跳到主内容
AIHO 2026 全新改版上线
codingMiniMax

MiniMax M2

MiniMax 2025 年 10 月开源的 agent/编程专用模型,230B/10B MoE,MIT 许可,约 Claude Sonnet 8% 价格 + 2x 速度,性价比之王。

规格

厂商
MiniMax
发布日期
2025/10/27
类型
coding
最大输出
32K tokens
定价
Input $0.30/M · Output $1.20/M(约为 Claude Sonnet 的 8%)
API 兼容
openai, anthropic

基准测试

开源全球前五
Artificial Analysis 综合
约 100 TPS
推理速度

✓ 优势

  • 专为 agent + 编程设计,MIT 开源可商用
  • 极致性价比:约 Claude Sonnet 8% 价格、约 2x 速度
  • 230B 总参 / 10B 激活,紧凑高效 MoE
  • Artificial Analysis 综合榜曾居开源全球前五
  • 深度适配 Claude Code / Cursor / Cline / Kilo Code / Droid

⚠ 不足

  • 纯编程能力略逊海外顶级闭源模型
  • 国产模型,海外文档相对少
  • 激活参数仅 10B,超复杂推理上限不及大模型
  • 免费试用期后转按量计费

适用场景

长链路工具调用 agent端到端编程开发工作流高并发 / 成本敏感的 agent 部署深度搜索任务

概述

MiniMax M2 是 MiniMax(稀宇科技)于 2025 年 10 月 27 日开源的高性能模型,专为 agent 和编程打造,目标是打破「性能、价格、推理速度」的不可能三角。MIT 许可可商用,主打多文件编辑、code-run-fix 循环和端到端工具使用,是国产 agent 生态的性价比代表。

核心能力

极致性价比

项目价格
Input$0.30 / 百万 token(¥2.1)
Output$1.20 / 百万 token(¥8.4)

官方称约为 Claude 4.5 Sonnet 8% 的价格、近 2 倍推理速度,在线推理约 100 TPS。这让大规模 agent 部署的成本结构发生质变。

Agentic 能力

M2 为「长链路工具调用任务」设计,可协调:

  • Shell 和浏览器访问
  • Python 代码解释器
  • 各类 MCP 工具

紧凑的 230B 总参 / 10B 激活 MoE 架构,让它在保持 agentic 能力的同时大幅压低推理成本。

编程与集成

为端到端开发工作流优化,深度适配 Claude CodeCursorCline、Kilo Code、Droid。纯编程能力略逊海外顶级闭源模型,但在国产模型中处于第一梯队。Artificial Analysis 综合榜(整合 10 项测试)曾居开源全球前五。

部署示例

# 兼容 vLLM / SGLang
pip install vllm
vllm serve "MiniMaxAI/MiniMax-M2"
# 推荐推理参数
temperature=1.0, top_p=0.95, top_k=20

API 也提供 Anthropic 兼容端点,方便从 Claude 系列迁移。

与同类模型怎么选

维度MiniMax M2Kimi K2 ThinkingQwen3-Coder
定位agent/编程性价比agent 推理 SOTAagentic 编码
参数230B/10B1T/32B480B/35B
价格极低
自部署门槛极高
许可MITModified MITApache 2.0

建议:成本敏感、要高并发 agent 部署首选 M2;要最强开源推理选 Kimi K2 Thinking;纯编码选 Qwen3-Coder

避坑清单

  • 激活参数 10B 有上限:超复杂单步推理不及大激活模型,长链路 agent 才是它的主场。
  • 试用期会结束:限免后转按量计费,规划预算注意。
  • 纯编程别期待超闭源:它的优势是「性价比 + agent」,不是刷 SWE-bench 榜首。
  • 用官方推荐推理参数:temperature 1.0 / top_p 0.95 / top_k 20。

延伸阅读