MiniMax M2.7横空出世 大模型迈入自我进化新纪元

AI 资讯2小时前发布 dennis
0

在全行业扎堆适配 OpenClaw、聚焦 “养虾” 热潮之际,MiniMax 已然完成技术跃迁,正式官宣全新大模型 M2.7。这款距 M2.5 发布仅一个月的迭代产品,不仅在复杂任务执行与多智能体协作上实现质的飞跃,更突破性具备自我构建工具、自主排障优化的能力,让大模型从 “被动执行指令” 升级为 “主动进化干活”,率先开启大模型自我迭代的全新阶段。目前,M2.7 已在 MiniMax Agent 及开放平台全量上线,向行业展示了下一代大模型的核心竞争力。

M2.7 的核心突破,首先体现在指令遵循与多智能体协作的极致稳健。在包含 40 个复杂技能的测试场景中,其指令遵循率高达 97%,在 MM-Claw “龙虾测试” 中正确率达 62.7%,直逼 Claude Sonnet 4.6。更值得关注的是,它原生支持多智能体协作,无需依赖外部框架即可自主组建 Agent Teams,各智能体能够稳定锚定身份、自主决策,高效拆解并执行长流程任务。例如在电商平台用户仪表盘开发项目中,M2.7 可自动分化出项目经理、前端开发、后端工程师、测试人员等多个角色,各司其职完成需求分析、API 设计、UI 搭建、测试验收等全流程工作,实现 “一个模型带动整个 AI 团队” 的协作模式。

代码能力的全面升级,让 M2.7 从 “代码生成工具” 蜕变为 “专业工程助手”。在 SWE-Pro 测试中,它以 56.22% 的正确率追平 GPT-5.3-Codex,在端到端项目交付的 VIBE-Pro 基准中同样斩获高分。针对 SRE(网站可靠性工程)场景,M2.7 展现出资深工程师的实战能力:接到系统告警后,能自动关联监控数据推导故障原因,分析调用链并联动数据库验证,精准定位漏洞后,还会采用非阻塞方式执行修复操作,甚至撰写规范的代码合并请求。在办公场景中,它可轻松应对复杂 Office 文档处理,能基于企业年报和沟通会资料自主构建营收预测模型,生成 Excel 透视表、Word 调研报告及排版规范的汇报 PPT,具备初级分析师的专业水准,其在 GDPval-AA 评测中的 ELO 评分位列开源第一,且超越 GPT-5.3。

在 C 端互动场景中,M2.7 大幅强化了人设稳定性与跨语言交流能力。它原生支持十种语言,跨语言沟通时能保持人格统一,深度适配 OpenClaw 长期记忆框架后,在赛博养崽等角色扮演场景中展现出持久的身份认同。为进一步提升互动沉浸感,MiniMax 官方基于 M2.7 开源了 OpenRoom 交互系统,构建出赛博朋克风的 “龙虾小屋” Web GUI 空间,让 AI 角色能与环境实时互动,对话可同步产生视觉反馈,彻底打破传统文本交互的局限。

实测环节中,M2.7 的硬核实力得到充分验证。在多智能体 “谁是卧底” 游戏房搭建测试中,它不仅快速输出包含系统架构、目录结构、人设设计、Web 界面规划的完整方案,还为主持人及 5 名玩家编写专属 [SOUL.md](SOUL.md) 人设文件,搭建出 Minecraft 风格的游戏网页,并配置智能体间通信协议与游戏逻辑。点击启动后,6 个原生 Agent 能够自主遵循规则完成发言、讨论、投票等全过程,顺畅决出胜负,全方位展现了其统筹规划、角色塑造与全栈开发能力。

在模拟生产环境的 SRE 级故障排查测试中,M2.7 更是展现出极强的问题诊断与解决能力。面对四份复杂的生产系统文件,它迅速从日志中锁定故障直接触发事件 —— 新增产品分类筛选与排序功能的 Git 提交未创建对应索引,进而找到数据库 CPU 飙升的根本原因:5200 万行数据的产品表缺失(category, created_at)复合索引,导致查询只能执行全表扫描与磁盘排序,最终引发 CPU 占满、连接池耗尽、查询超时的连锁反应。针对该问题,M2.7 精准写出 EXPLAIN 验证命令,提供了采用 CONCURRENTLY 语法的非阻塞建索引 SQL 语句(避免生产环境锁表),并附上规范的数据库迁移文件代码,整个排障修复流程专业、高效且安全,完全符合企业级生产标准。

M2.7 最具革命性的突破,在于其开启了大模型 “自我进化” 的路径 —— 具备自主构建 Agent Harness 的能力。Agent Harness 作为模型与现实环境交互的工具箱,以往需人工开发配置,而 M2.7 已能自主设计搭建。在强化学习实验中,研究员仅需给出初始想法,M2.7 即可自主搭建实验环境,实时监控运行状态、读取日志、排查故障、修改代码,甚至自动提交合并请求与冒烟测试,全程闭环推进实验。更令人惊叹的是,它还能主动迭代优化 Harness 本身,通过反复试错摸索优化路径,使模型在内部评测集上的效果提升 30%。此外,M2.7 还能自主训练升级机器学习模型,借助短时记忆、自反馈与自优化机制,在 MLE Lite 的 22 道高难度竞赛题中拿下 9 金 5 银 1 铜的优异成绩。

当行业还在聚焦适配现有工具、追赶 “吃虾” 热度时,MiniMax M2.7 已然跳出 “教模型用工具” 的固有框架,切入 “让模型自己造工具、搞研发” 的全新赛道。这种主动进化的能力,正是下一代大模型的核心竞争力分水岭。M2.7 的发布,不仅为用户提供了一款更强大、更智能的 AI 工具,更向行业展示了大模型的进化方向 —— 从被动执行到主动创造,从单一功能到全流程闭环,从辅助工具到自主进化的 “数字员工”。随着这类具备自我进化能力的大模型不断迭代,AI 将深度融入研发、生产、办公等各个场景,为行业生产力带来颠覆性变革。

© 版权声明

相关文章