【量子位 2026年2月13日讯】当行业都在追逐数十亿参数的具身模型时,原力灵机抛出了一枚”轻量炸弹”——仅2.4B参数的具身原生模型DM0,不仅能实时处理728×728三视角高清画面,推理延迟低至60毫秒,更在RoboChallenge大规模真机评测中拿下单任务与多任务双料第一。这家由前旷视核心团队打造的创企,以”具身原生”为核心理念,同步发布开源框架Dexbotic 2.0与量产工作流DFOL,重新定义了具身智能的技术路径与落地逻辑。
具身原生革命:跳出”VLM+动作头”的外挂陷阱
当前具身智能领域主流的”VLM+Action Head”方案,本质是在语言大模型基础上嫁接动作执行模块,如同给数字智能”外挂”物理四肢。而原力灵机合伙人周而进带领团队走出了截然不同的道路——从数据采集、模型训练到架构设计,全链路遵循”物理世界原生反馈”逻辑,让智能从物理交互中内生而来。
DM0的”原生性”体现在两大核心层面:其一,模型训练从零起步,拒绝在数字世界预训练模型上微调补全,而是从初始化阶段就融合互联网、智驾与具身多传感数据,让模型天生理解空间关系与物理交互,如同婴儿先学会动作再发展语言;其二,重新定义数据范式,摒弃”仿真vs真机”的二元争论,将所有数据视为”合成光谱”的不同形态,物理规则明确的低熵场景用算力生成数据,语义模糊的高熵场景用真机采集反馈,实现”熵在哪里,数据就投向哪里”的精准适配。
这种原生设计让DM0在跨机型适配中展现出惊人优势。通过8种不同形态机器人的多任务训练,模型学会的是”伸手-移动-放置”的操作逻辑,而非特定机器人的关节参数,就像老司机换车即开,彻底摆脱了硬件依赖。
空间推理思维链:破解物理世界的三维难题
不同于大语言模型一维语义推理的思维链(CoT),DM0创新提出空间推理思维链(Spatial CoT),构建起”子任务预测-目标定位-轨迹规划-离散动作-连续动作”的五阶闭环,完美适配三维物理世界的操作需求。面对”收拾桌面”这类模糊指令,模型不会直接输出动作,而是先拆解任务、精确定位物体,再生成毫米级精度的执行轨迹。
在工件摆放等精细操作中,这种推理能力尤为关键——当物体左偏2毫米时,普通模型无法识别差异,而DM0能通过空间推理计算偏差并修正动作。配合728×728的高分辨率视觉输入,模型实现了物理世界的精准感知与执行,这也是其在物流分拣等场景中能处理柔性、刚性等多种物料的核心原因。
更值得关注的是,DM0引入了轻量化世界模型理念,并非打造复杂的现实仿真器,而是让模型具备”动作预演”能力——在执行前模拟动作后果,选择最优路径,既避免了物理世界试错的风险与低效,又保证了决策的安全性与合理性。
软硬件协同三件套:打通具身量产最后一公里
原力灵机此次同步发布的”模型+框架+工作流”三件套,构建了从技术研发到产业落地的完整闭环。开源框架Dexbotic 2.0堪称”具身智能领域的PyTorch”,采用模块化设计,视觉编码器、LLM模块、动作专家模块可自由组合,联合清华、无问芯穹共建,实现了具身操作与导航、模仿学习与强化学习的统一。
量产工作流DFOL则精准击中行业痛点,填补了传统非标自动化与人工操作之间的空白——既具备接近人工的柔性适应能力,能快速换线应对复杂输入,又保持了工业级的效率与确定性,通过成功率(连续无故障作业)、动作质量(毫米级定位)、节拍(吞吐率)三大指标保障商业价值。
这套协同体系已在物流场景中得到验证。原力灵机打造的轮式双臂机器人,能在物料箱堆满混合形态物料的复杂环境中,完成24小时不间断分拣,破解了传统吸盘对柔性、非光泽物料束手无策的难题。而这只是其落地路线图的第一步,按照规划,团队将从物流仓储起步,逐步拓展至门店服务场景,最终向家庭场景迈进。
7×24小时闭环:在真实场景中持续进化
“越早跑起来越好”是原力灵机的落地哲学。不同于行业”先做Demo再落地”的常规思路,DM0已在多个场地实现7×24小时真实运行,哪怕初期成功率不高,也要通过持续运行暴露电源、网络、光照等工程问题,同时回流真实数据反哺模型迭代。
这种”运行-反馈-优化”的闭环,正是具身智能的核心进化逻辑。通过全身全时全域的数据采集——涵盖底盘移动、躯干协调、传感器反馈的全身数据,意图到执行的连续全时数据,以及未来将拓展的全域空间数据——DM0不断丰富物理世界的交互经验,应对无限长尾场景。
如今,这个仅需RTX 5090显卡即可运行的轻量模型,已用62%的任务成功率在真机评测中超越众多数十亿参数模型,印证了”参数够用即好,原生闭环为王”的技术判断。周而进团队更描绘了长远愿景:未来的具身机器人将拥有独立社会身份,如同拥有”自己的支付宝”,能自主完成支付结算,成为连接物理世界与数字生态的社会化接口。
从技术路线到落地策略,原力灵机的探索都展现出独特的务实与远见。DM0的发布不仅为具身智能提供了轻量化、可量产的新范式,更证明了在算力受限的环境下,通过架构创新与场景闭环,同样能实现技术突破与商业价值的统一。随着”具身原生”理念的普及,这场由2.4B参数模型掀起的革命,或将重塑整个行业的发展格局。