小米官宣MiMo-V2家族模型 神秘Hunter Alpha身份揭晓引行业震动

AI 资讯9小时前发布 dennis
0

3 月 19 日凌晨,小米官方正式揭晓全球 AI 圈热议焦点 ——OpenRouter 平台连续多日霸榜的神秘模型 Hunter Alpha,正是其全新发布的万亿参数旗舰大模型 MiMo-V2-Pro 的早期内测版本。同步亮相的还有全模态模型 MiMo-V2-Omni 与语音合成模型 MiMo-V2-TTS,三款产品组成的 MiMo-V2 家族,以硬核技术参数与亮眼实战表现,强势跻身全球顶尖大模型梯队,引发业界广泛关注。

这场 \"神秘模型解谜\" 始于 3 月 11 日,代号 Hunter Alpha 与 Healer Alpha 的两款匿名模型悄然登陆全球最大 API 聚合平台 OpenRouter。无宣传、无发布会的 \"隐身\" 上线模式,却凭借强悍性能实现调用量爆发式增长,累计使用量迅速突破 1 万亿 Token,连续多日登顶平台日调用量榜单,甚至吸引 \"龙虾之父\"——OpenClaw 创始人 Peter Steinberger 在社交平台发帖打听模型细节,引发全球开发者社区的猜测热潮。

彼时,网友们的猜测众说纷纭:有人根据命名风格推测是 OpenAI 的 GPT-5 系列新品,也有技术社区依据中文训练特征,将其指向 DeepSeek-V4 的 stealth 版本。直至小米官宣,谜底才正式揭开 —— 这两款神秘模型均出自小米 MiMo 大模型团队,其中 Hunter Alpha 对应旗舰文本基座 MiMo-V2-Pro,Healer Alpha 为其相关衍生版本,而主导该系列研发的小米 MiMo 大模型负责人罗福莉,正是前 DeepSeek 研究员,这一背景也让此次 \"认错亲\" 的乌龙更添戏剧性。

作为家族核心旗舰,MiMo-V2-Pro 的技术配置堪称行业顶尖。模型总参数量突破 1 万亿大关,激活参数达 420 亿,上下文窗口支持 100 万 Token 超长文本处理,整体规模较前代 MiMo-V2-Flash 扩大三倍。底层架构上,其继承混合注意力机制并将混合比例从 5:1 提升至 7:1,搭配轻量级 MTP 多 Token 预测层,在处理超长篇内容时仍能保持高速生成效率。为支撑如此庞大的模型训练与运行,小米 AI 团队联合北京大学研发统一资源管理系统 ARL-Tangram,通过弹性调度算法解决异构资源约束难题,将智能体强化学习任务的算力成本降低 71.2%,训练效率显著提升。

实战性能方面,MiMo-V2-Pro 交出了一份亮眼答卷。在 Artificial Analysis 全球智能指数评测中,该模型斩获全球第八、国内第二的优异排名;在 PinchBench 与 ClawEval 两大权威智能体基准测试中,分别取得 84.0 分与 61.5 分的高分,全面超越 Gemini 3 Pro 并逼近 Claude Opus 4.6。尤其在代码能力上,其在 SWE-bench Verified 测试中以 86.7 分超越 Claude 4.6 Sonnet,可直接用 Three.js 编写带动态背景与升级路线的 3D 塔防游戏代码,展现出极强的复杂任务处理能力。匿名内测期间,OpenClaw、Kilo Code 等主流开发工具贡献了大量调用量,充分验证了其在生产环境中的可靠性。

一同发布的 MiMo-V2-Omni 与 MiMo-V2-TTS 同样亮点突出。全模态模型 MiMo-V2-Omni 创新性地将图像、视频、音频编码器融合进单一主干网络,实现 \"看、听、读、行\" 的一体化感知与行动能力,既能作为自动驾驶视觉大脑预测潜在危险,也能自主完成跨平台比价购物等复杂操作。语音合成模型 MiMo-V2-TTS 则专注于情感化表达,支持通过自然语言指令精准控制音色与情绪走向,可自然融入咳嗽、叹气等细节,为智能体赋予更生动的交互体验。

在商业化布局上,小米展现出强势突围姿态。MiMo-V2-Pro 的 API 定价仅为同级别竞品的五分之一,256K 上下文以内输入每百万 Token 定价 1 美元,输出 3 美元,同时联合 OpenClaw 等五大主流 Agent 框架提供限时免费接入支持,以高性价比快速渗透开发者生态。目前三款模型均已在小米官方平台上线详情页面,开发者可直接申请体验,而此次模型发布恰逢小米新品发布会前夕,也被业界解读为其 AI 生态布局的重要铺垫。

从匿名霸榜到正式官宣,小米 MiMo-V2 家族的亮相堪称一次成功的 \"技术突袭\"。万亿参数的硬核配置、超越主流竞品的实战表现、极具竞争力的定价策略,不仅彰显了小米在大模型领域的技术积累,更打破了全球顶尖大模型市场的现有格局。随着 AI 智能体时代的加速到来,小米以 MiMo-V2 家族为支点,正在构建从文本、多模态到语音的全栈 AI 能力,未来有望在开发者生态、智能终端、行业应用等多个场景释放价值,为全球 AI 产业发展注入新的动力。

© 版权声明

相关文章