优必选Thinker大模型开源:小参数撬动9项全球第一,工业机器人精度与响应难题迎刃而解

AI 资讯8小时前发布 dennis
0

【量子位 2026年2月3日讯】具身智能赛道再添重磅突破!优必选正式开源专为工业人形机器人打造的具身智能大模型Thinker,以“小参数、高性能、全开源”的核心优势,在涵盖场景认知、空间理解等关键能力的权威基准评测中狂揽9项全球第一,力压英伟达、字节跳动等顶尖团队的同类模型。这款百亿参数基座模型,不仅破解了工业场景中机器人“抓不准、跟不上”的行业痛点,更通过全链路数据优化方案将标注成本降低99%,目前已实现Walker S2工业机器人在箱体搬运、工件分拣等场景99.99%的作业准确率,为具身智能规模化落地提供“可复用、低成本”的技术底座。

一、9项第一背后:小参数模型的“性能逆袭”

在具身智能领域,“参数堆料”曾被视为提升模型能力的主流路径,但优必选Thinker打破这一惯性思维,以轻量化架构实现性能突破,尤其适配工业机器人对实时性、精准性的高要求。

1. 核心指标碾压:覆盖具身智能两大核心能力

Thinker在10B参数以下具身智能模型权威榜单中,拿下的9项第一全面覆盖两大关键维度,每项指标均领先第二名5%以上:

  • 场景认知与任务规划:在First-Person Action Benchmark(第一视角动作基准)中,模型对工业场景指令的理解准确率达96.3%,能精准拆解“料箱搬运→货架归位→库存记录”等多步骤任务,避免传统模型“漏步骤、错顺序”的问题;

  • 空间感知与物理交互:在3D Scene Understanding(3D场景理解)测试中,空间定位误差控制在2毫米以内,远超行业平均5毫米的水平,可支撑机器人完成螺丝拧紧、芯片拾取等毫米级精度操作。

更值得关注的是,任务越复杂、序列越长,Thinker的优势越显著。在Horizon=5(需连续执行5个关联动作)的工业产线模拟任务中,其成功率比第二名高出9.2%,充分验证了模型在长时序任务中的稳定性。

2. 小参数架构设计:适配工业机器人实时性需求

Thinker基于百亿参数基座模型优化,通过“模块化拆分+关键能力强化”实现“小体积大能量”:

  • 架构轻量化:剔除通用大模型中对具身任务冗余的文本生成模块,聚焦“视觉-动作”闭环核心能力,模型推理速度提升60%,可满足工业场景中200Hz频率的实时控制需求;

  • 能力专项强化:针对工业场景重点优化空间推理(如判断工件摆放角度)、工具交互(如识别螺丝刀型号并选择拧动力度)等模块,在相关子任务上性能提升40%;

  • 跨设备适配:已完成对优必选Walker S2、AgileX等主流工业机器人的适配,换用新机型时无需重构模型,仅需微调硬件接口参数,部署周期从3个月缩短至1周。

“工业机器人不需要‘会写诗’的大脑,但必须有‘算得快、判得准’的核心能力。”优必选具身智能负责人在接受采访时表示,Thinker的架构设计完全围绕工业场景痛点展开,避免了通用大模型“能力冗余、响应滞后”的问题。

二、数据驱动突破:从20B噪声数据到10M高质量样本

具身智能的性能高度依赖数据质量,但行业普遍面临“原始数据噪声大、标注成本高、小样本泛化难”的痛点。优必选构建全链路数据优化方案,为Thinker打造高质量数据基座。

1. 数据精炼:20B原始数据的“极致提纯”

面对含噪声、多模态错位的20B原始工业数据,Thinker通过两步法实现“从量到质”的跨越:

  • 广度筛选:基于定制化规则(如剔除模糊图像、过滤重复动作序列),从视觉、语言、动作、环境等多模态数据中快速筛选出1%的候选数据池,初步去除无效信息;

  • 深度评分:引入大模型构建多维度评分模块,从“工业场景适配度”(如是否包含真实产线环境)、“任务价值”(如是否覆盖复杂工具交互)、“数据质量”(如动作标注是否精准)三个维度打分,最终提炼出10M高质量训练样本,数据利用率提升20倍。

以螺丝拧紧任务数据为例,原始数据中包含大量“角度偏差、力度不当”的失败案例,经过筛选后,仅保留“标准操作+典型错误修复”的有效样本,模型学习效率显著提升。

2. 自动化标注:人工参与率<1%的成本革命

针对具身数据标注难度大、成本高的行业痛点,Thinker构建“弱监督+自监督+少量人工校验”的闭环体系:

  • 核心技术:采用“大模型辅助标注+多模型交叉验证”策略,例如对视觉场景分割任务,先由基础模型生成初步标注,再通过3个不同架构的模型交叉验证,自动修正偏差;

  • 人工介入最小化:仅对标注置信度低于95%的样本(如模糊的工件边缘识别)进行人工复核,最终将人工参与率控制在1%以下,较传统全人工标注成本降低99%,效率提升100倍以上;

  • 动态迭代:将模型训练中的误差反馈至标注流水线,持续优化算法参数,例如发现“特定材质工件识别准确率低”后,自动增加该类样本的标注权重,标注准确率随迭代逐步提升至99.2%。

三、工业落地:从模型到机器人的“能力闭环”

Thinker并非实验室级别的技术演示,而是已深度集成至优必选工业机器人解决方案,通过“模型-机器人-场景”的双向反馈实现能力进化。

1. 单机应用:Walker S2作业准确率达99.99%

搭载Thinker大模型的优必选Walker S2工业机器人,已在多家车厂、电子工厂实现规模化应用,核心场景表现亮眼:

  • 箱体搬运:模型通过视觉推演预判料箱重心位置,控制机械臂抓取力度,避免传统机器人“抓不稳、易掉落”的问题,搬运成功率从95%提升至99.99%;

  • 工件分拣:在电子元件分拣任务中,能精准识别不同型号芯片(最小尺寸2mm×2mm),并根据生产线节奏调整分拣速度,每小时处理量达1200件,比人工效率提升3倍;

  • 异常处理:当遇到料箱变形、工件错位等突发情况时,模型可自主生成应对方案(如调整抓取角度、更换夹持工具),无需人工干预,异常处理响应时间缩短至0.5秒。

2. 群体智能延伸:支撑多机协同作业

依托Thinker的认知与决策能力,优必选进一步构建群脑网络(BrainNet)架构,实现多台工业机器人协同作业:

  • 超级大脑:基于Thinker扩展的多模态推理大模型,负责产线级任务拆解与调度,例如将“汽车底盘组装”任务拆分为“零件搬运、螺丝拧紧、质检记录”等子任务,分配给不同机器人;

  • 智能小脑:基于Transformer模型的协同控制模块,实现多机动作同步,例如3台Walker S2协作组装发动机时,动作误差控制在10毫秒以内,避免碰撞或工序延误;

  • 数据回流:产线中产生的新数据(如罕见工件形态、突发故障案例)会实时反馈至Thinker模型,持续优化算法,形成“应用-反馈-迭代”的正向循环。

珠海某汽车零部件工厂的应用案例显示,5台Walker S2在Thinker与群脑网络支撑下,产线组装效率提升40%,不良率下降至0.01%,人力成本降低60%。

四、全开源生态:降低行业门槛,推动具身智能普惠化

优必选此次将Thinker的模型权重、训练工具链、应用案例全量开源,打破具身智能技术壁垒,开发者可通过GitHub、Hugging Face等平台免费获取资源,快速适配自有场景。

1. 开源内容:从模型到工具的“一站式支持”

开源包包含三大核心资源,覆盖从训练到部署的全流程:

  • 模型资源:提供4B、10B两个参数版本的权重文件,支持TensorFlow、PyTorch主流框架,开发者可根据硬件算力选择适配版本;

  • 训练工具链:包含数据精炼脚本、自动化标注工具、工业场景微调模板,新手开发者可基于模板快速完成“电子元件检测”“机械臂控制”等任务的模型优化;

  • 应用案例库:详细拆解Walker S2在不同工业场景的部署流程,包含代码示例、参数配置、故障排查指南,降低实际应用难度。

2. 生态价值:加速行业技术迭代

Thinker的开源不仅为中小开发者提供技术支持,更推动行业形成“协作创新”的生态:

  • 降低研发成本:中小企业无需从零构建具身模型,基于Thinker二次开发可节省60%以上的研发时间,例如某机器人初创公司基于开源模型,仅用2个月就完成了工业质检机器人的智能大脑开发;

  • 推动标准统一:开源方案中包含优必选在工业场景验证的“数据标注规范”“模型评估指标”,为行业提供可复用的技术标准,避免“各自为战”导致的兼容性问题;

  • 激发场景创新:目前已有开发者基于Thinker探索农业采摘、仓储物流等非工业场景的应用,例如优化模型识别农作物成熟度,实现采摘机器人精准作业。

五、行业影响:具身智能迈入“低成本规模化”新阶段

Thinker的发布与开源,不仅是优必选在具身智能领域的技术突破,更标志着行业从“技术探索”向“产业落地”的关键转折,为解决具身智能三大核心瓶颈提供新思路:

1. 突破模型轻量化瓶颈

打破“参数越大性能越强”的固有认知,证明通过架构优化与能力聚焦,小参数模型也能满足工业场景需求,为端侧、边缘侧机器人应用提供可能。

2. 破解数据成本难题

全链路数据优化方案将标注成本降低99%,解决行业“数据贵、标注难”的痛点,尤其利好缺乏海量数据积累的中小厂商。

3. 构建开源协作生态

通过开放技术资源,吸引全球开发者参与迭代,形成“开源-反馈-升级”的正向循环,加速具身智能在千行百业的渗透。

正如优必选CEO周剑所言:“Thinker的开源,是希望让更多人能用得起、用得好具身智能技术。未来,我们不仅要让机器人走进工厂,更要通过生态协作,让具身智能成为推动产业智能化的普惠工具。”

目前,Thinker已在GitHub、Hugging Face、ModelScope等平台开放下载,优必选同时启动“具身智能开发者计划”,提供技术培训与场景落地支持。随着更多开发者的参与,这款拿下9项全球第一的模型,或将成为工业具身智能领域的“标配底座”,推动人形机器人加速从实验室走向生产线。

© 版权声明

相关文章