【量子位 2026年2月12日讯】具身智能赛道迎来里程碑式突破!阿里巴巴集团旗下高德正式发布ABot系列两款基座模型——具身操作模型ABot-M0与具身导航模型ABot-N0,不仅补齐了机器人规模化落地的核心能力短板,更在全球十大权威基准测试中同步斩获SOTA(当前最优)成绩,成为全球首个实现具身操作与具身导航”双SOTA”的厂商,为服务机器人、工业自动化等领域的实用化发展铺平道路。
ABot-M0:统一架构打破操作壁垒 任务成功率提升30%
长期以来,不同形态机器人的数据割裂、动作表示不统一等问题,严重制约了具身操作技术的规模化应用。高德ABot-M0以”通用大脑”为定位,通过”数据统一—算法革新—空间感知”的系统性重构,实现了跨平台、跨场景的操作能力突破。
在数据层面,ABot-M0整合全球开源资源,构建了包含超过600万条真实操作轨迹的通用数据集,通过统一动作表示、坐标系与控制频率,成功解决了跨平台数据融合难题,支撑完全基于公开数据的预训练。算法创新上,该模型提出全球首个动作流形学习(AML)算法,精准捕捉物理规律与环境约束下的动作特征,直接预测结构合理、物理可行的动作序列,大幅提升策略稳定性与解码效率。同时,3D感知模块的引入,让模型能精准理解”前后、远近、遮挡”等空间语义,在复杂环境中做出精准操作决策。
实测数据显示,ABot-M0在Libero、Libero-Plus、RoboCasa三大权威基准测试中均达到SOTA水平。其中在高扰动、高难度的Libero-Plus基准测试中,任务成功率高达80.5%,较业界先进方案π₀提升近30个百分点,在语言理解、动态光照适应、背景干扰等细分场景中均展现出碾压级优势。
ABot-N0:五大任务一统 长程导航成功率飙升40.5%
导航作为机器人进入物理世界的核心能力,长期面临”任务碎片化”困境——传统模型多针对单一导航场景设计,难以应对长程复杂任务。高德ABot-N0开创性地实现五大导航任务统一,将Point-Goal(点位导航)、Object-Goal(目标导航)、Instruction-Following(指令跟随)、POI-Goal(兴趣点导航)与Person-Following(人物跟随)整合于单一模型,彻底突破任务割裂瓶颈。
当用户下达”带我去奶茶店买一杯奶茶,再帮我占个座”的复杂指令时,ABot-N0会自动拆解任务流程:先通过Point-Goal接近奶茶店区域,再切换至POI-Goal锁定店铺入口,随后以Instruction-Following导航至柜台,最后通过Object-Goal寻找空座位并停靠,完整复刻人类导航决策逻辑。
这一能力源于模型的层次化”大脑-动作”架构设计:”认知大脑”负责指令理解与推理,”动作专家”基于流匹配技术生成精准轨迹;训练过程中通过认知热身、联合微调与强化学习三阶段优化,确保导航决策对齐人类偏好。数据侧,依托高德沉淀的约8000个高保真3D场景与近1700万条专家示例,模型在真实环境中的泛化能力与鲁棒性大幅提升。
在CityWalker、SocNav等七大权威基准测试中,ABot-N0全面刷新世界纪录:SocNav闭环仿真中成功率从47.8%飙升至88.3%,提升幅度达40.5%;HM3D-OVON复杂场景导航成功率提升8.8%,在人群避让、路径规划等关键指标上表现突出。目前该模型已成功部署于真实四足机器人平台,在边缘侧实现高效推理与闭环控制,验证了工业级稳定性。
双模型协同 开启具身智能规模化落地
ABot-M0与ABot-N0的协同,构建了”感知-决策-执行”的全链路能力闭环。在仓储物流场景中,机器人可通过ABot-N0规划最优路径,结合ABot-M0的精准操作能力完成货物抓取与分拣;在服务场景中,既能跟随用户移动,又能响应指令完成物品取放等操作,大幅拓展了机器人的应用边界。
业内专家指出,高德此次双SOTA突破,不仅解决了具身智能”操作不通用、导航不长程”的核心痛点,更提供了可复现、可扩展的技术方案。相较于行业内多聚焦单一任务的发展模式,高德通过架构创新与数据积累,走出了一条通用具身智能的落地路径,为智慧物流、医疗辅助、工业自动化等领域的技术升级提供了核心支撑。
随着ABot系列模型的推出,具身机器人有望加速从实验室走向实际应用,未来在复杂环境交互、长程任务执行等场景的表现值得期待。高德的技术突破,也将推动整个具身智能产业向更高效、更通用的方向发展,为人工智能与物理世界的深度融合注入新动力。