蚂蚁开源万亿即时模型Ling-2.5-1T:兼顾情感交互与Agent高效执行

AI 资讯19小时前发布 dennis
0

蚂蚁集团近日在百灵大模型家族中推出万亿参数旗舰产品Ling-2.5-1T,以即时响应为核心定位,通过架构革新实现了情感化交互能力与智能体(Agent)执行效率的双重突破,同时以开源形式向开发者开放,补齐了通用大模型在“人性温度”与“落地能力”上的短板。

这款模型的核心突破源于底层架构的重构。研发团队在Ling 2.0的分组查询注意力(GQA)基础上,升级为1:7比例的混合线性注意力(MLA)与Lightning Linear组合架构,依托Ring-flash-linear-2.0技术路线,将KV缓存占用压缩至极致。尽管其激活参数量达630亿,但实际运行效率优于多数320亿激活参数的模型,尤其在32K以上长文本场景中,访存规模较上代降低10倍以上,生成吞吐提升3倍以上。同时,该模型支持100万Token的超长上下文窗口,预训练语料扩充至29TB,在百万Token范围内的关键信息检索准确率达98.7%。

在Agent执行能力的打磨上,Ling-2.5-1T构建了基于Agent的硬性校验机制,通过评分规则与代码断言的双重约束,使复杂指令执行准确率提升27%。在电商运营场景实测中,面对包含50个订单、15类商品的3000行复杂JSON日志,该模型接入OpenClaw后,可自主完成文件定位、依赖安装、数据清洗与Excel报表生成的全流程操作,最终数据关联准确率达99.3%,展现出“能落地干重活”的桌面级Agent实力。此外,其高Token效率特性可减少无效推理,在相同输出质量下,token消耗量较前代降低65%,有效推理占比达92%,远超行业78%的平均水平。

与强大执行力形成互补的是,Ling-2.5-1T通过人文社科专家参与的RLHF特训,大幅削弱了机器文本的程式化特征,实现了更具温度的情感交互。在对比测试中,以“产品翻车CEO”身份撰写的内容,其朋友圈文案中“满屏的质疑和滚烫的机身”等表达,精准还原了真实情绪;正式致歉信中主动承认“供应链监管失职”的表述,展现出符合人类沟通习惯的责任担当,相较同类模型的标准化公关文本更具诚意。

此次Ling-2.5-1T的开源发布,进一步完善了蚂蚁集团的大模型矩阵,与专注逻辑推理的Ring模型、擅长多模态的Ming模型形成互补,构建起覆盖通用、逻辑、多模态场景的完整解决方案。目前,该模型已在Hugging Face和魔搭社区(ModelScope)同步开放,其混合线性架构的成熟应用,验证了超大规模模型可同时兼顾高效运行与情感化交互,为智能写作、自动化办公、智能客服等领域的开发者提供了兼具性能与成本优势的技术底座。

© 版权声明

相关文章