“别再闭门造车藏数据了!具身智能的‘大脑’,靠数据喂出来。”11月23日,智源研究院在具身智能产业峰会上抛出重磅倡议,呼吁全行业共建具身机器人数据生态,瞬间点燃现场氛围。这场峰会吸引了大半个具身机器人圈的参与——从地瓜机器人、元境智能等创业明星,到华为、小米等科技巨头,再到清华大学、中科院等科研机构,各方代表纷纷响应。智源研究院院长黄铁军直言:“未来具身机器人的核心竞争力,就看谁能掌握更多高质量数据,谁贡献的数据多,谁的模型‘大脑’就更聪明。”
行业痛点催生倡议:数据“孤岛”拖慢具身智能进化
智源研究院的倡议,直指当前具身智能发展的核心瓶颈——数据“孤岛化”。具身机器人要在家庭、工厂等复杂场景中自主决策,需要海量“视觉-动作-环境反馈”的多模态数据训练模型,但目前行业内90%以上的数据都掌握在单一企业或机构手中,彼此隔绝。
“我们花了半年时间,才收集到10万条家庭场景机器人交互数据,光标注就花了300万元。”某机器人创业公司CEO在峰会上大倒苦水,而这样的困境并非个例。华为智能汽车解决方案BU负责人也表示,工业场景的机器人数据采集成本更高,一条“机械臂精密装配”的完整数据,采集与标注成本超过200元,且不同企业的场景数据无法复用,导致行业陷入“重复投入、效率低下”的怪圈。
更严重的是,数据“偏食”会导致模型“能力残缺”。智源研究院发布的《2025具身智能发展报告》显示,仅靠单一企业数据训练的模型,在跨场景任务中成功率不足40%——比如用家庭场景数据训练的机器人,进入工厂后连“识别螺丝刀”都可能出错。黄铁军形象地比喻:“这就像只看了小学课本的学生,去考大学试卷,肯定考不好。只有汇集全行业的场景数据,模型才能‘见多识广’。”
核心机制:数据贡献“积分制”,多劳多得享模型红利
为打破数据“孤岛”,智源研究院推出了“具身智能数据共建计划”,核心是“数据贡献积分制”——企业或机构上传符合标准的具身机器人数据后,将根据数据质量、场景稀缺性、标注完整性等维度获得积分,积分可用于兑换智源研究院基于海量数据训练的通用具身大模型使用权、数据标注服务,甚至优先参与行业标准制定。
“不是简单地‘收集数据’,而是建立‘贡献-回报’的良性循环。”智源研究院具身智能实验室主任解释,例如某企业上传10万条“老年陪护场景”数据(稀缺场景),可获得1000万积分,这些积分不仅能兑换最新的“智源具身大模型V3”使用权,还能免费使用平台的AI标注工具处理自有数据,节省大量成本。而智源则将汇集的多场景数据,用于优化通用大模型,再反哺给所有参与者。
为打消企业“数据泄露”的顾虑,计划采用“联邦学习+数据脱敏”双重保障机制。企业数据无需上传原始文件,而是通过联邦学习技术在本地完成模型训练,仅将模型参数更新同步至平台;同时数据脱敏系统会自动剥离设备编号、企业标识等敏感信息,确保数据安全。小米机器人事业部负责人表示:“这种模式既保护了我们的核心数据,又能享受到行业共建的红利,我们第一时间就报名加入了。”
行业响应热烈:大半个圈子入局,首批数据超500万条
倡议一经发布,便得到全行业的积极响应。峰会上,地瓜机器人、元境智能、华为、小米等20余家企业与10所高校现场签约,成为数据共建计划的首批成员。据智源研究院统计,截至峰会结束,首批成员已承诺贡献的数据量超500万条,覆盖家庭服务、工业制造、养老陪护、物流分拣等12大核心场景。
地瓜机器人CEO当场宣布,将开放其工业巡检机器人的100万条设备缺陷检测数据,“这些数据是我们花了3年时间积累的,以前视作‘核心机密’,但现在我们意识到,只有融入生态,让通用大模型更强,我们的机器人产品才能更智能。”元境智能则贡献了50万条家庭服务机器人交互数据,涵盖衣物整理、厨房备菜等高频场景。
科研机构的加入为数据生态注入了“理论活水”。清华大学机器人学实验室将开放其在“机器人灵巧手操作”领域的30万条高精度数据,这些数据包含机械臂抓取不同形状物体的力反馈细节,对提升模型的精细动作控制能力至关重要。中科院自动化所则提供了“跨环境机器人适应”数据,帮助模型突破场景限制。
未来图景:3年建成全球最大具身数据池,推动行业降本增效
根据智源研究院的规划,数据共建计划将分三阶段推进:2026年底前,建成包含5000万条数据的国内最大具身智能数据池;2027年实现数据量破亿,覆盖20+核心场景;2028年打造全球最大的具身智能数据生态,数据量超3亿条,同时推出适配不同场景的专用模型。
这一计划将为行业带来显著的降本增效。智源研究院测算,数据共建后,单个企业的模型训练成本将降低60%以上,机器人产品的研发周期将从平均18个月缩短至8个月。“以前一家企业要花1亿元才能做出的高精度模型,未来通过数据积分兑换,中小创业公司只需投入千万元就能用上,这将彻底激活行业创新活力。”黄铁军表示。
更长远来看,数据共建将推动具身智能从“小众试点”走向“规模化落地”。当通用大模型能适配绝大多数场景后,企业无需再投入巨资研发核心算法,只需聚焦产品硬件与场景定制,这将加速具身机器人在养老、医疗、工业等领域的普及,让技术真正服务于产业与民生。
智源具身智能数据共建计划核心信息速览:
-
发起方:智源研究院,呼吁全行业共建具身机器人数据生态;
-
核心机制:数据贡献积分制,积分可兑换模型使用权、标注服务等;
-
数据安全:采用联邦学习+数据脱敏,保障企业数据安全;
-
首批参与:20+企业、10所高校,承诺贡献数据超500万条;
-
发展规划:2028年建成全球最大具身数据池(超3亿条),降本60%+。
结语:数据共筑,让具身智能告别“单兵作战”
智源研究院的数据共建倡议,像一颗石子投入具身智能的“湖面”,激起全行业的共鸣。在技术快速迭代的今天,具身智能的发展早已不是“单兵作战”的时代,数据的共享与协同,才是推动行业进步的核心动力。
当大半个具身机器人圈都选择“打开大门”,当数据“孤岛”被逐一打破,我们有理由相信,具身智能的“大脑”将在海量数据的滋养下快速进化,机器人将更快走进生产生活的方方面面,开启人机协同的全新篇章。