跳到主内容
AIHO 2026 全新改版上线
TOOL · CODING #07/11AI CLI
MiMo Code

MiMo Code

小米开源终端 AI 编程 Agent,SWE-Bench 超越 Claude Code

cliagentterminalxiaomiopensourcemitchinese
访问官网
能力
4
易用
3
性价比
5
中文
5
稳定
3
编辑结论 综合4.0/ 5

小米开源 CLI Agent 黑马。SWE-Bench Pro 62%、Terminal Bench 2 73% 双超 Claude Code,MIT 协议、内置免费多模态模型、记忆系统。但仅 V0.1.0,生态和稳定性有待验证。

01 / 04深度解读

TL;DR

一句话: MiMo Code 是小米在 2026 年 6 月 11 日开源的终端 AI 编程 Agent,MIT 协议、基于 OpenCode 架构改造,搭载自研 MiMo 模型。它最炸的成绩是 SWE-Bench Pro 62%、Terminal Bench 2 73% 双双超过 Claude Code——国产 Agent 第一次在权威基准上硬刚 Anthropic。内置多模态模型、记忆系统、完全免费。

最大价值是 开源彻底 + 基准亮眼:MIT 协议权重可商用,多模态模型内置不依赖外部 API,记忆系统能跨会话记住项目上下文。代价是 极其早期——目前仅 V0.1.0,生态、稳定性、文档都还在补,生产环境用要承担"踩坑"成本。把它当"最有潜力的国产 Agent 黑马"来观察和尝鲜,比当主力工具更合适。

来源说明:本文基于 GitHub XiaomiMiMo/MiMo-Code 仓库、技术报告与社区评测整理。MiMo Code 处于 V0.1.0 早期阶段,功能与基准数据迭代极快,请以最新官方仓库为准。

核心能力

SWE-Bench 双超 Claude Code 的硬实力

MiMo Code 一发布就靠基准成绩刷屏。在两个最被认可的 Agent 编程基准上:

  • SWE-Bench Pro 62%——衡量"给定 GitHub issue,自主定位 + 修复 + 通过测试"的能力,MiMo 以 62% 超过 Claude Code 的同期成绩
  • Terminal Bench 2 73%——衡量"终端环境下的多步工具调用任务"能力,MiMo 同样领先

这两个基准测的都是 长程任务——不是单轮补全,而是"看 issue → 理解代码 → 多文件改 → 跑测试 → 修回归"的完整 Agent 闭环。MiMo 能在这两项上超 Claude Code,说明它的模型在"agent 式推理 + 工具调用规划"上确实有真功夫,而不只是刷 HumanEval 这种单文件题。

需要说明的是,基准 ≠ 实战体验。SWE-Bench 是标准化任务集,真实项目的复杂度、脏数据、中文场景未必复现同样的领先。但作为"国产 Agent 第一梯队"的入场券,这个成绩足够有说服力。

基于 OpenCode 架构,终端原生

MiMo Code 没有从零造轮子,而是 基于 OpenCode 架构 改造——TypeScript 全栈、终端 TUI、多会话并行、MCP 支持,这些都继承了 OpenCode 的成熟设计。小米的增量在于:

  • 内置 MiMo 自研模型——不用自己配 API key,开箱即用(也支持接其他模型)
  • 记忆系统——跨会话记住项目结构、约定、历史决策,不用每次重新喂上下文
  • 多模态内置——截图调试、看图改 UI 直接支持,不依赖外部多模态 API
  • 中文优化——针对中文代码库、中文需求做了专项调优

继承 OpenCode 架构的好处是 生态兼容——OpenCode 的 provider 配置、MCP server、部分插件 MiMo Code 能直接复用,迁移成本低。坏处是也继承了 OpenCode 的早期粗糙:配置门槛、稳定性依赖 API 质量。

长程编程 + 记忆系统

MiMo Code 主打的"长程编程"和 Claude Code 的 long-horizon task 是一个意思——撑住 30 分钟以上、跨多文件的自主改造。它的差异化在 记忆系统

传统 Agent 每次开新会话都是"失忆"的,得重新喂项目上下文。MiMo Code 的记忆系统能把"这个项目用 Vue3 + Pinia、提交规范是 Conventional Commits、测试跑 vitest、上次改到哪"这类信息持久化,下次直接续上。这对长期维护一个项目的开发者是实打实的提效——不用每次 /init 重新生成 CLAUDE.md

cd your-project
mimo-code                      # 启动,自动加载项目记忆
> 继续上次的鉴权模块重构,跑通剩余测试

实测记忆系统在 V0.1.0 还比较初级——能记住显式声明的事实,但对"隐式约定"的捕捉还不够智能,偶尔会记错或记漏。方向是对的,成熟度待提升。

内置多模态模型,免费看图编程

MiMo Code 内置了 MiMo 多模态模型,支持图像输入。截图一个 UI bug、贴一张报错栈、丢一张架构图,它都能"看着改"——而且 不依赖外部 API,开箱即用、完全免费:

> 这张设计稿还原成响应式页面,注意移动端适配
[附图:design.png]

对前端还原、运维看监控截图、QA 看 bug 截图这类场景,多模态是刚需。Claude Code 也支持多模态但要走 Claude API 计费,MiMo 内置免费的思路对个人开发者更友好。

MIT 协议,彻底开源

MiMo Code 是 MIT 协议 开源——权重、代码、工具全可商用、可改、可二次分发。这比 Kimi K2.7 Code 的开源协议更宽松(Kimi 的商用条款需留意),对企业做二次开发、嵌入自家产品是利好。

小米此举被社区解读为"用开源换生态"——终端 Agent 赛道 Claude Code 闭源、OpenCode 占开源高地,小米作为后来者用 MIT + 基准成绩 + 内置模型打差异。能不能跑出来,看后续迭代和社区活跃度。

使用体验

上手 5 分钟

# 一行命令安装
curl -fsSL https://github.com/XiaomiMiMo/MiMo-Code/install.sh | bash

# 或 npm
npm install -g mimo-code

# 内置模型开箱即用,无需 API key
# (也可接自托管 MiMo 或其他 OpenAI 兼容模型)
mimo-code                       # 启动

# 进项目
cd your-project
mimo-code /init                 # 初始化项目记忆
mimo-code                       # 交互模式

日常体感

作为 V0.1.0 产品,MiMo Code 的体感是"潜力大、毛刺多"。

好的方面:TUI 交互流畅(继承 OpenCode 底子)、中文理解到位、多模态看图实用、内置模型不折腾 key。基准成绩在真实任务上大致能复现——中等复杂度的 bug 修复、功能追加,完成质量确实不输 Claude Code。

毛刺方面:偶发崩溃、记忆系统记忆不准、长任务中途断、文档不完善、部分 slash 命令行为和 OpenCode 不一致。社区 issue 区还在快速增长,属于"早期开源项目"的典型状态。用它当主力会有踩坑成本,当尝鲜和观察对象更合适。

配置与扩展

MiMo Code 兼容 OpenCode 的 provider 配置格式,想接 Claude / GPT / DeepSeek 也能配。但最佳体验还是配 MiMo 自研模型——内置调优、多模态、记忆系统都是围绕它做的。自托管 MiMo 模型需要一定 GPU 资源,个人玩家建议先用官方免费额度或内置模型。

价格与运行成本

MiMo Code 完全免费——MIT 开源、工具免费、内置模型免费。成本几乎为零(除非自托管模型要算硬件电费):

路径价格适用场景
内置 MiMo 模型免费开箱即用,个人开发者首选
自托管 MiMo免费(需硬件)企业 / 隐私场景,需 GPU
接其他模型(BYOK)按 API 计费想用 Claude/GPT 时,自行承担 token 费

这是三个国产 Agent 里成本结构最干净的——Kimi Code 要付 API 费,OpenCode 要付外部模型 API 费,MiMo Code 内置模型直接免费。对"一分钱不想花"的开发者,MiMo 是天花板。

但免费的代价是 稳定性:内置模型推理资源有限(如果走官方服务),高峰可能限流;自托管又要硬件。没有"既免费又稳定还强"的免费午餐。

适用场景

  • 尝鲜国产开源 Agent 黑马:想第一时间体验 SWE-Bench 超过 Claude Code 的国产选手
  • 基准成绩敏感的研究者:做 Agent 评测、对比实验,MiMo 是重要样本
  • 需要内置多模态:截图调试、看图改 UI,不想为多模态单独付费
  • MIT 协议二次开发:企业想基于开源 Agent 做自家产品,MiMo 协议最宽松
  • 国内免费 + 中文友好:不花钱、不要海外账号、中文体验好

不适用场景

  • 生产环境追求稳定:V0.1.0 早期,崩溃和毛刺难免,别拿核心业务冒险
  • 需要成熟插件生态:生态刚起步,第三方工具和自定义命令体系远不如 Claude Code
  • IDE 内 inline 补全:CLI Agent 不是补全器
  • 不熟悉终端的新手:TUI + 配置门槛对纯新手不友好
  • 要企业级 SLA:开源 V0.1 无任何承诺

与同类怎么选

维度MiMo CodeClaude CodeOpenCodeKimi Code
形态CLI(TUI)CLICLI(TUI)CLI
协议MIT(最宽松)闭源MIT开源(商用需留意)
模型MiMo(内置免费)Claude(闭源)75+ 任选K2.7 Code(开源)
SWE-Bench★★★★★ 62%★★★★☆看模型★★★★☆
多模态✅ 内置免费✅(计费)看模型
记忆系统✅ 跨会话✅(CLAUDE.md)⚠️ 基础⚠️ 基础
成熟度★★☆☆☆ V0.1★★★★★★★★★☆★★★★☆
国内门槛★★★★★ 极低★☆☆☆☆ 高★★★★☆ 低★★★★★ 低
价格免费$20-$200/月免费(BYOK)极低

选 MiMo Code 如果你

  • 想尝鲜基准超 Claude Code 的国产黑马
  • 要 MIT 协议做二次开发 / 商用
  • 需要内置免费多模态
  • 一分钱不想花,又要中文友好

别选 MiMo Code 如果你

  • 生产环境要稳(V0.1.0 太早期)
  • 要成熟插件和 MCP 生态(去 Claude Code)
  • 要 IDE inline 补全(去 Cursor / Copilot)
  • 企业要 SLA 承诺

FAQ

Q:MiMo Code 真能超过 Claude Code 吗? A:在 SWE-Bench Pro 和 Terminal Bench 2 两个标准化基准上,MiMo 的分数确实领先。但基准 ≠ 全场景实战——长任务稳定性、上下文管理、插件生态 MiMo 仍落后。把它理解为"基准够强,实战在追赶"更准确。

Q:V0.1.0 能用于生产吗? A:不建议作为生产主力。早期版本崩溃、记忆不准、文档不全等问题难免。建议作为尝鲜 / 备选 / 研究对象,等迭代到 V1.0 再考虑生产化。

Q:内置模型真免费?有限制吗? A:工具和内置模型免费。但若走官方推理服务,高峰可能限流;重度使用建议自托管(需 GPU)或接其他模型 BYOK。

Q:和 Kimi Code 怎么选? A:都是国产开源 CLI Agent。Kimi Code 模型成熟(K2.7 多代迭代)、256K 长上下文、中文强;MiMo Code 基准成绩更亮眼、MIT 协议更宽松、内置多模态免费,但 V0.1 早期。要稳选 Kimi,要尝鲜和 MIT 商用选 MiMo。

Q:基于 OpenCode 架构,能用 OpenCode 的插件吗? A:大部分兼容——provider 配置、MCP server、部分配置文件格式通用。但 MiMo 有自己的增量(记忆系统、内置模型),部分行为和 OpenCode 不完全一致,迁移时需测试。

Q:小米会长期维护吗? A:目前社区活跃、迭代快,但开源项目的长期承诺难以保证。建议关注 GitHub issue 响应速度和发版节奏判断健康度,别把核心流程绑死在单一早期项目上。

相关阅读

来源

本卡片由 AIHO 编辑部根据官方公开资料与第三方评测整理。所有事实点均标注来源;如发现价格 / 命令 / 功能与最新官方信息不一致,请通过 /submit 反馈。

02 / 04价格速查
计划价格限制国内支付备注
开源版(MIT)免费仅承担 API token 成本✅ 国产模型可用支付宝可自托管
内置多模态模型免费MiMo 自研模型内置✅ 无需支付开箱即用
自托管免费MIT 协议,权重可下载✅ 无需支付需硬件
03 / 04适合 / 不适合
✅ 适合谁
  • · 想尝鲜国产开源 Agent 黑马的开发者
  • · 看重 SWE-Bench / Terminal Bench 基准成绩的研究者
  • · 需要内置多模态(截图调试)能力
  • · MIT 协议下做二次开发 / 商用集成
  • · 国内开发者,要免费 + 中文友好
⚠️ 不适合谁
  • · 生产环境追求稳定(仅 V0.1.0,仍在快速迭代)
  • · 需要成熟插件生态(生态刚起步)
  • · IDE 内 inline 补全场景
  • · 不熟悉终端操作的新手
04 / 04类似工具推荐