Name: MiniMax M2
Brand: MiniMax

概述

MiniMax M2 是 MiniMax（稀宇科技）于 2025 年 10 月 27 日开源的高性能模型，专为 agent 和编程打造，目标是打破「性能、价格、推理速度」的不可能三角。MIT 许可可商用，主打多文件编辑、code-run-fix 循环和端到端工具使用，是国产 agent 生态的性价比代表。

核心能力

极致性价比

项目	价格
Input	$0.30 / 百万 token（¥2.1）
Output	$1.20 / 百万 token（¥8.4）

官方称约为 Claude 4.5 Sonnet 8% 的价格、近 2 倍推理速度，在线推理约 100 TPS。这让大规模 agent 部署的成本结构发生质变。

Agentic 能力

M2 为「长链路工具调用任务」设计，可协调：

Shell 和浏览器访问
Python 代码解释器
各类 MCP 工具

紧凑的 230B 总参 / 10B 激活 MoE 架构，让它在保持 agentic 能力的同时大幅压低推理成本。

编程与集成

为端到端开发工作流优化，深度适配 Claude Code、Cursor、Cline、Kilo Code、Droid。纯编程能力略逊海外顶级闭源模型，但在国产模型中处于第一梯队。Artificial Analysis 综合榜（整合 10 项测试）曾居开源全球前五。

部署示例

# 兼容 vLLM / SGLang
pip install vllm
vllm serve "MiniMaxAI/MiniMax-M2"

# 推荐推理参数
temperature=1.0, top_p=0.95, top_k=20

API 也提供 Anthropic 兼容端点，方便从 Claude 系列迁移。

与同类模型怎么选

维度	MiniMax M2	Kimi K2 Thinking	Qwen3-Coder
定位	agent/编程性价比	agent 推理 SOTA	agentic 编码
参数	230B/10B	1T/32B	480B/35B
价格	极低	中	中
自部署门槛	中	极高	高
许可	MIT	Modified MIT	Apache 2.0

建议：成本敏感、要高并发 agent 部署首选 M2；要最强开源推理选 Kimi K2 Thinking；纯编码选 Qwen3-Coder。

避坑清单

激活参数 10B 有上限：超复杂单步推理不及大激活模型，长链路 agent 才是它的主场。
试用期会结束：限免后转按量计费，规划预算注意。
纯编程别期待超闭源：它的优势是「性价比 + agent」，不是刷 SWE-bench 榜首。
用官方推荐推理参数：temperature 1.0 / top_p 0.95 / top_k 20。

MiniMax M2

规格

基准测试

✓ 优势

⚠ 不足

适用场景

概述