行业终于有“统一标尺”!10家机构共建RoboChallenge组委会,规范具身智能真机评测

2025 年 11 月 20 日,在智源研究院具身智能 Open Day 活动现场,RoboChallenge 组委会正式成立。该组委会由原力灵机与 Hugging Face 联合发起,汇聚智源研究院、智元机器人、Qwen、星海图、自变量机器人及清华大学、西安交通大学等 10 家产学研机构,标志着具身智能真机评测从 “各自为战” 迈入标准化、共建共享的新阶段,为行业技术落地与迭代提供核心支撑。

当前具身智能技术快速渗透机器人、自动驾驶、泛工业等领域,但评测体系缺失成为行业痛点 —— 不同机构的测试环境、任务设计、数据标准差异显著,导致技术效果难以横向对比。而具身智能的核心是 AI 与物理环境的交互能力,必须回归真实场景进行评测。RoboChallenge 组委会的成立,正是为解决这一问题,通过构建行业级公共基础设施,推动评测标准的形成与落地。

组委会采用 “指导委员会 + 四大工作组” 的双层架构,确保高效运营与透明治理。基准与任务设计工作组负责核心评测体系、典型任务及数据集的设计优化;实验室维护工作组承担测试机器人维护、实验环境管理与标准化测试执行,保障评测结果可对比、可复现;平台开发工作组打造 robochallenge.ai 网站及配套 API 服务,实现测试数据上传、评测结果获取的闭环生态;社区共建工作组则通过黑客马拉松、学术研讨会等活动,吸引全球开发者与机构参与,促进技术交流与需求对接。

在运作原则上,组委会坚守 “测试开放可复现、社区包容非竞争、贡献开源可追溯” 三大核心承诺,鼓励参与方公开技术细节与测试数据,避免 “闭门造车”。这种开放治理模式能充分吸纳不同场景的真实需求,例如家庭服务机器人企业关注的 “多语言指令响应” 等评估维度,都将被纳入评测体系,让标准更贴合产业实际。

原力灵机联合创始人兼 CEO 唐文斌表示,期待通过开放协作的方式,定义具身智能的 “度量衡”,让机器更智能地融入人类物理世界。RoboChallenge 组委会的启航,不仅填补了具身智能真机评测的行业空白,更折射出 AI 领域从单点技术突破向生态共建转型的趋势,未来将持续推动技术研发与产业需求的精准对接,加速具身智能的规模化应用。

需要我帮你将这篇资讯整理成 Markdown 格式的文档,方便保存或分享吗?

© 版权声明

相关文章