小米开源 CLI Agent 黑马。SWE-Bench Pro 62%、Terminal Bench 2 73% 双超 Claude Code,MIT 协议、内置免费多模态模型、记忆系统。但仅 V0.1.0,生态和稳定性有待验证。
TL;DR
一句话: MiMo Code 是小米在 2026 年 6 月 11 日开源的终端 AI 编程 Agent,MIT 协议、基于 OpenCode 架构改造,搭载自研 MiMo 模型。它最炸的成绩是 SWE-Bench Pro 62%、Terminal Bench 2 73% 双双超过 Claude Code——国产 Agent 第一次在权威基准上硬刚 Anthropic。内置多模态模型、记忆系统、完全免费。
最大价值是 开源彻底 + 基准亮眼:MIT 协议权重可商用,多模态模型内置不依赖外部 API,记忆系统能跨会话记住项目上下文。代价是 极其早期——目前仅 V0.1.0,生态、稳定性、文档都还在补,生产环境用要承担"踩坑"成本。把它当"最有潜力的国产 Agent 黑马"来观察和尝鲜,比当主力工具更合适。
来源说明:本文基于 GitHub XiaomiMiMo/MiMo-Code 仓库、技术报告与社区评测整理。MiMo Code 处于 V0.1.0 早期阶段,功能与基准数据迭代极快,请以最新官方仓库为准。
核心能力
SWE-Bench 双超 Claude Code 的硬实力
MiMo Code 一发布就靠基准成绩刷屏。在两个最被认可的 Agent 编程基准上:
- SWE-Bench Pro 62%——衡量"给定 GitHub issue,自主定位 + 修复 + 通过测试"的能力,MiMo 以 62% 超过 Claude Code 的同期成绩
- Terminal Bench 2 73%——衡量"终端环境下的多步工具调用任务"能力,MiMo 同样领先
这两个基准测的都是 长程任务——不是单轮补全,而是"看 issue → 理解代码 → 多文件改 → 跑测试 → 修回归"的完整 Agent 闭环。MiMo 能在这两项上超 Claude Code,说明它的模型在"agent 式推理 + 工具调用规划"上确实有真功夫,而不只是刷 HumanEval 这种单文件题。
需要说明的是,基准 ≠ 实战体验。SWE-Bench 是标准化任务集,真实项目的复杂度、脏数据、中文场景未必复现同样的领先。但作为"国产 Agent 第一梯队"的入场券,这个成绩足够有说服力。
基于 OpenCode 架构,终端原生
MiMo Code 没有从零造轮子,而是 基于 OpenCode 架构 改造——TypeScript 全栈、终端 TUI、多会话并行、MCP 支持,这些都继承了 OpenCode 的成熟设计。小米的增量在于:
- 内置 MiMo 自研模型——不用自己配 API key,开箱即用(也支持接其他模型)
- 记忆系统——跨会话记住项目结构、约定、历史决策,不用每次重新喂上下文
- 多模态内置——截图调试、看图改 UI 直接支持,不依赖外部多模态 API
- 中文优化——针对中文代码库、中文需求做了专项调优
继承 OpenCode 架构的好处是 生态兼容——OpenCode 的 provider 配置、MCP server、部分插件 MiMo Code 能直接复用,迁移成本低。坏处是也继承了 OpenCode 的早期粗糙:配置门槛、稳定性依赖 API 质量。
长程编程 + 记忆系统
MiMo Code 主打的"长程编程"和 Claude Code 的 long-horizon task 是一个意思——撑住 30 分钟以上、跨多文件的自主改造。它的差异化在 记忆系统:
传统 Agent 每次开新会话都是"失忆"的,得重新喂项目上下文。MiMo Code 的记忆系统能把"这个项目用 Vue3 + Pinia、提交规范是 Conventional Commits、测试跑 vitest、上次改到哪"这类信息持久化,下次直接续上。这对长期维护一个项目的开发者是实打实的提效——不用每次 /init 重新生成 CLAUDE.md。
cd your-project
mimo-code # 启动,自动加载项目记忆
> 继续上次的鉴权模块重构,跑通剩余测试
实测记忆系统在 V0.1.0 还比较初级——能记住显式声明的事实,但对"隐式约定"的捕捉还不够智能,偶尔会记错或记漏。方向是对的,成熟度待提升。
内置多模态模型,免费看图编程
MiMo Code 内置了 MiMo 多模态模型,支持图像输入。截图一个 UI bug、贴一张报错栈、丢一张架构图,它都能"看着改"——而且 不依赖外部 API,开箱即用、完全免费:
> 这张设计稿还原成响应式页面,注意移动端适配
[附图:design.png]
对前端还原、运维看监控截图、QA 看 bug 截图这类场景,多模态是刚需。Claude Code 也支持多模态但要走 Claude API 计费,MiMo 内置免费的思路对个人开发者更友好。
MIT 协议,彻底开源
MiMo Code 是 MIT 协议 开源——权重、代码、工具全可商用、可改、可二次分发。这比 Kimi K2.7 Code 的开源协议更宽松(Kimi 的商用条款需留意),对企业做二次开发、嵌入自家产品是利好。
小米此举被社区解读为"用开源换生态"——终端 Agent 赛道 Claude Code 闭源、OpenCode 占开源高地,小米作为后来者用 MIT + 基准成绩 + 内置模型打差异。能不能跑出来,看后续迭代和社区活跃度。
使用体验
上手 5 分钟
# 一行命令安装
curl -fsSL https://github.com/XiaomiMiMo/MiMo-Code/install.sh | bash
# 或 npm
npm install -g mimo-code
# 内置模型开箱即用,无需 API key
# (也可接自托管 MiMo 或其他 OpenAI 兼容模型)
mimo-code # 启动
# 进项目
cd your-project
mimo-code /init # 初始化项目记忆
mimo-code # 交互模式
日常体感
作为 V0.1.0 产品,MiMo Code 的体感是"潜力大、毛刺多"。
好的方面:TUI 交互流畅(继承 OpenCode 底子)、中文理解到位、多模态看图实用、内置模型不折腾 key。基准成绩在真实任务上大致能复现——中等复杂度的 bug 修复、功能追加,完成质量确实不输 Claude Code。
毛刺方面:偶发崩溃、记忆系统记忆不准、长任务中途断、文档不完善、部分 slash 命令行为和 OpenCode 不一致。社区 issue 区还在快速增长,属于"早期开源项目"的典型状态。用它当主力会有踩坑成本,当尝鲜和观察对象更合适。
配置与扩展
MiMo Code 兼容 OpenCode 的 provider 配置格式,想接 Claude / GPT / DeepSeek 也能配。但最佳体验还是配 MiMo 自研模型——内置调优、多模态、记忆系统都是围绕它做的。自托管 MiMo 模型需要一定 GPU 资源,个人玩家建议先用官方免费额度或内置模型。
价格与运行成本
MiMo Code 完全免费——MIT 开源、工具免费、内置模型免费。成本几乎为零(除非自托管模型要算硬件电费):
| 路径 | 价格 | 适用场景 |
|---|---|---|
| 内置 MiMo 模型 | 免费 | 开箱即用,个人开发者首选 |
| 自托管 MiMo | 免费(需硬件) | 企业 / 隐私场景,需 GPU |
| 接其他模型(BYOK) | 按 API 计费 | 想用 Claude/GPT 时,自行承担 token 费 |
这是三个国产 Agent 里成本结构最干净的——Kimi Code 要付 API 费,OpenCode 要付外部模型 API 费,MiMo Code 内置模型直接免费。对"一分钱不想花"的开发者,MiMo 是天花板。
但免费的代价是 稳定性:内置模型推理资源有限(如果走官方服务),高峰可能限流;自托管又要硬件。没有"既免费又稳定还强"的免费午餐。
适用场景
- 尝鲜国产开源 Agent 黑马:想第一时间体验 SWE-Bench 超过 Claude Code 的国产选手
- 基准成绩敏感的研究者:做 Agent 评测、对比实验,MiMo 是重要样本
- 需要内置多模态:截图调试、看图改 UI,不想为多模态单独付费
- MIT 协议二次开发:企业想基于开源 Agent 做自家产品,MiMo 协议最宽松
- 国内免费 + 中文友好:不花钱、不要海外账号、中文体验好
不适用场景
- 生产环境追求稳定:V0.1.0 早期,崩溃和毛刺难免,别拿核心业务冒险
- 需要成熟插件生态:生态刚起步,第三方工具和自定义命令体系远不如 Claude Code
- IDE 内 inline 补全:CLI Agent 不是补全器
- 不熟悉终端的新手:TUI + 配置门槛对纯新手不友好
- 要企业级 SLA:开源 V0.1 无任何承诺
与同类怎么选
| 维度 | MiMo Code | Claude Code | OpenCode | Kimi Code |
|---|---|---|---|---|
| 形态 | CLI(TUI) | CLI | CLI(TUI) | CLI |
| 协议 | MIT(最宽松) | 闭源 | MIT | 开源(商用需留意) |
| 模型 | MiMo(内置免费) | Claude(闭源) | 75+ 任选 | K2.7 Code(开源) |
| SWE-Bench | ★★★★★ 62% | ★★★★☆ | 看模型 | ★★★★☆ |
| 多模态 | ✅ 内置免费 | ✅(计费) | 看模型 | ✅ |
| 记忆系统 | ✅ 跨会话 | ✅(CLAUDE.md) | ⚠️ 基础 | ⚠️ 基础 |
| 成熟度 | ★★☆☆☆ V0.1 | ★★★★★ | ★★★★☆ | ★★★★☆ |
| 国内门槛 | ★★★★★ 极低 | ★☆☆☆☆ 高 | ★★★★☆ 低 | ★★★★★ 低 |
| 价格 | 免费 | $20-$200/月 | 免费(BYOK) | 极低 |
选 MiMo Code 如果你:
- 想尝鲜基准超 Claude Code 的国产黑马
- 要 MIT 协议做二次开发 / 商用
- 需要内置免费多模态
- 一分钱不想花,又要中文友好
别选 MiMo Code 如果你:
- 生产环境要稳(V0.1.0 太早期)
- 要成熟插件和 MCP 生态(去 Claude Code)
- 要 IDE inline 补全(去 Cursor / Copilot)
- 企业要 SLA 承诺
FAQ
Q:MiMo Code 真能超过 Claude Code 吗? A:在 SWE-Bench Pro 和 Terminal Bench 2 两个标准化基准上,MiMo 的分数确实领先。但基准 ≠ 全场景实战——长任务稳定性、上下文管理、插件生态 MiMo 仍落后。把它理解为"基准够强,实战在追赶"更准确。
Q:V0.1.0 能用于生产吗? A:不建议作为生产主力。早期版本崩溃、记忆不准、文档不全等问题难免。建议作为尝鲜 / 备选 / 研究对象,等迭代到 V1.0 再考虑生产化。
Q:内置模型真免费?有限制吗? A:工具和内置模型免费。但若走官方推理服务,高峰可能限流;重度使用建议自托管(需 GPU)或接其他模型 BYOK。
Q:和 Kimi Code 怎么选? A:都是国产开源 CLI Agent。Kimi Code 模型成熟(K2.7 多代迭代)、256K 长上下文、中文强;MiMo Code 基准成绩更亮眼、MIT 协议更宽松、内置多模态免费,但 V0.1 早期。要稳选 Kimi,要尝鲜和 MIT 商用选 MiMo。
Q:基于 OpenCode 架构,能用 OpenCode 的插件吗? A:大部分兼容——provider 配置、MCP server、部分配置文件格式通用。但 MiMo 有自己的增量(记忆系统、内置模型),部分行为和 OpenCode 不完全一致,迁移时需测试。
Q:小米会长期维护吗? A:目前社区活跃、迭代快,但开源项目的长期承诺难以保证。建议关注 GitHub issue 响应速度和发版节奏判断健康度,别把核心流程绑死在单一早期项目上。
相关阅读
- 同类对比:Claude Code / OpenCode / Kimi Code / Qwen Code
- 概念:AI Agent / SWE-Bench / MCP / 记忆系统
- 模型:MiMo Code / Claude Sonnet 4 / Kimi K2.7 Code
- 进阶:Vibe Coding / 国产大模型编程
来源
- 开源仓库:https://github.com/XiaomiMiMo/MiMo-Code
- 技术报告:https://github.com/XiaomiMiMo/MiMo-Code/blob/main/README.md
- MiMo 系列模型:https://github.com/XiaomiMiMo
- OpenCode 架构基础:https://github.com/sst/opencode
- SWE-Bench 排行榜:https://www.swebench.com
本卡片由 AIHO 编辑部根据官方公开资料与第三方评测整理。所有事实点均标注来源;如发现价格 / 命令 / 功能与最新官方信息不一致,请通过 /submit 反馈。
| 计划 | 价格 | 限制 | 国内支付 | 备注 |
|---|---|---|---|---|
| 开源版(MIT) | 免费 | 仅承担 API token 成本 | ✅ 国产模型可用支付宝 | 可自托管 |
| 内置多模态模型 | 免费 | MiMo 自研模型内置 | ✅ 无需支付 | 开箱即用 |
| 自托管 | 免费 | MIT 协议,权重可下载 | ✅ 无需支付 | 需硬件 |
- · 想尝鲜国产开源 Agent 黑马的开发者
- · 看重 SWE-Bench / Terminal Bench 基准成绩的研究者
- · 需要内置多模态(截图调试)能力
- · MIT 协议下做二次开发 / 商用集成
- · 国内开发者,要免费 + 中文友好
- · 生产环境追求稳定(仅 V0.1.0,仍在快速迭代)
- · 需要成熟插件生态(生态刚起步)
- · IDE 内 inline 补全场景
- · 不熟悉终端操作的新手
