行业终于有“统一标尺”！10家机构共建RoboChallenge组委会，规范具身智能真机评测

0 0

2025 年 11 月 20 日，在智源研究院具身智能 Open Day 活动现场，RoboChallenge 组委会正式成立。该组委会由原力灵机与 Hugging Face 联合发起，汇聚智源研究院、智元机器人、Qwen、星海图、自变量机器人及清华大学、西安交通大学等 10 家产学研机构，标志着具身智能真机评测从 “各自为战” 迈入标准化、共建共享的新阶段，为行业技术落地与迭代提供核心支撑。

当前具身智能技术快速渗透机器人、自动驾驶、泛工业等领域，但评测体系缺失成为行业痛点 —— 不同机构的测试环境、任务设计、数据标准差异显著，导致技术效果难以横向对比。而具身智能的核心是 AI 与物理环境的交互能力，必须回归真实场景进行评测。RoboChallenge 组委会的成立，正是为解决这一问题，通过构建行业级公共基础设施，推动评测标准的形成与落地。

组委会采用 “指导委员会 + 四大工作组” 的双层架构，确保高效运营与透明治理。基准与任务设计工作组负责核心评测体系、典型任务及数据集的设计优化；实验室维护工作组承担测试机器人维护、实验环境管理与标准化测试执行，保障评测结果可对比、可复现；平台开发工作组打造 robochallenge.ai 网站及配套 API 服务，实现测试数据上传、评测结果获取的闭环生态；社区共建工作组则通过黑客马拉松、学术研讨会等活动，吸引全球开发者与机构参与，促进技术交流与需求对接。

在运作原则上，组委会坚守 “测试开放可复现、社区包容非竞争、贡献开源可追溯” 三大核心承诺，鼓励参与方公开技术细节与测试数据，避免 “闭门造车”。这种开放治理模式能充分吸纳不同场景的真实需求，例如家庭服务机器人企业关注的 “多语言指令响应” 等评估维度，都将被纳入评测体系，让标准更贴合产业实际。

原力灵机联合创始人兼 CEO 唐文斌表示，期待通过开放协作的方式，定义具身智能的 “度量衡”，让机器更智能地融入人类物理世界。RoboChallenge 组委会的启航，不仅填补了具身智能真机评测的行业空白，更折射出 AI 领域从单点技术突破向生态共建转型的趋势，未来将持续推动技术研发与产业需求的精准对接，加速具身智能的规模化应用。

需要我帮你将这篇资讯整理成 Markdown 格式的文档，方便保存或分享吗？

# AI 资讯