【量子位 2026年1月31日讯】当多数AI公司还在深耕虚拟世界的文本与图像生成时,硅谷初创企业Physical Intelligence正另辟蹊径——用“物理智能”让机器人学会折叠衣物、制作咖啡、处理蔬菜,甚至理解重力、摩擦等真实世界物理规律。这家由Stripe前早期员工拉奇·格鲁姆(Lachy Groom)联合创办的公司,凭借“通用机器人基础模型”的独特定位,成立两年便斩获超10亿美元融资,估值达56亿美元,吸引红杉资本、Khosla Ventures、Thrive Capital等顶级资本入局,成为硅谷最受瞩目的“机器人大脑”研发者。
走进Physical Intelligence位于旧金山的总部,没有光鲜的前台与醒目标识,只有满室忙碌的场景:木质长桌上散落着Girl Scout饼干盒与澳洲特产Vegemite酱,另一侧则摆满显示器、机械臂零件与缠绕的电线——三台机械臂正分别尝试折叠黑裤子、翻转衬衫、削西葫芦,虽偶有失误,却展现出逼近人类的“物理理解能力”。正如联合创始人、加州大学伯克利分校副教授谢尔盖·莱文(Sergey Levine)所言:“我们做的,相当于机器人版ChatGPT,只不过它处理的不是文本,而是真实世界的物理动作。”
一、核心技术:“跨实体学习”打造通用机器人大脑,从削西葫芦到做咖啡皆可迁移
Physical Intelligence的突破,在于摒弃传统机器人“单一任务编程”模式,通过“通用基础模型+真实数据训练”,让机器具备“举一反三”的物理交互能力,其技术逻辑可拆解为三大核心环节。
1. 数据闭环:从真实场景采集数据,反哺模型迭代
公司构建了一套“数据采集-模型训练-场景验证”的持续循环体系:
-
多场景数据采集:除总部测试室外,团队还在仓库、家庭、餐厅等真实场景部署机器人工作站,收集机械臂处理衣物、包装、食材等任务的全流程数据,甚至专门搭建“测试厨房”,让机器人学习操作咖啡机、处理蔬菜;
-
数据用途多元:这些数据不仅包含成功案例,更重视失败经验——例如机械臂折叠裤子时“边角对齐偏差”、削西葫芦时“力度控制不当”等失误数据,都会用于训练模型的“纠错能力”。莱文解释:“人类通过试错学会动作,机器人也该如此,失败数据比成功数据更有价值。”
在总部测试现场,削西葫芦的机械臂已能稳定将瓜皮削入指定容器,而折叠裤子与翻转衬衫的机械臂虽未完全达标,但每一次调整都在向目标靠近——这些实时测试数据会同步传输至模型训练系统,成为下一轮优化的依据。
2. 跨实体学习:一套模型适配多硬件,新机器人无需从零学起
不同于传统机器人“一款硬件对应一套算法”的局限,Physical Intelligence的核心技术“跨实体学习(Cross-Embodiment Learning)”,可实现“知识迁移”:
-
技术原理:模型通过海量数据学习“物理动作的本质规律”,例如“削”的动作核心是“刀具角度+力度控制+物料固定”,掌握这些规律后,无论面对西葫芦、苹果还是土豆,只需微调参数即可适配;若更换新机械臂硬件,也无需重新采集数据,可直接复用已有知识;
-
降本价值:联合创始人全·王(Quan Vuong,前Google DeepMind研究员)表示:“过去为新机器人开发自动化能力,边际成本很高;现在有了通用模型,接入新硬件的成本大幅降低,这让机器人规模化应用成为可能。”
目前,公司已与物流、生鲜、巧克力制造等领域企业合作测试,部分场景已实现“即插即用”——某巧克力厂商引入模型后,机械臂处理可可豆的分拣效率较传统设备提升40%,且无需额外编程。
3. 硬件哲学:用“普通硬件+强智能”打破性能瓶颈
与多数机器人公司追求“高精尖硬件”不同,Physical Intelligence选择“低成本硬件+强算法”路线:
-
硬件选择:所用机械臂采购价约3500美元,莱文坦言“供应商有巨额加价”,若自研生产,材料成本可降至1000美元以下;
-
核心逻辑:通过算法弥补硬件短板,例如普通机械臂的力控精度不足,模型便通过“感知反馈+动态调整”优化动作,让廉价设备也能完成折叠衣物、制作咖啡等精细任务。“好的智能能补偿差的硬件,这是我们与其他公司最大的不同。”莱文强调。
二、团队与融资:Stripe前高管掌舵,10亿资金押注“5-10年长期主义”
Physical Intelligence的崛起,离不开核心团队的行业积淀与资本的坚定支持,其“不急于商业化”的战略在追求短期回报的硅谷尤为独特。
1. 灵魂人物:从Stripe早期员工到“机器人投资人”,格鲁姆的“五年寻路”
31岁的拉奇·格鲁姆(Lachy Groom)是硅谷知名的“少年天才”——13岁在澳大利亚创办首家公司,9个月后成功出售;加入Stripe成为早期员工后,又以天使投资人身份押注Figma、Notion、Ramp等明星企业。但他始终在寻找“值得全情投入的事业”,直到2024年接触到莱文与斯坦福大学切尔西·芬恩(Chelsea Finn)的物理智能研究:
-
创业契机:通过Google DeepMind研究员卡罗尔·豪斯曼(Karol Hausman)牵线,格鲁姆与莱文团队深入交流,“走出会议室就确定,这就是我要找的方向”;
-
管理风格:公司80人团队保持“慢扩张”节奏,格鲁姆直言“硬件研发比软件难太多——设备会坏、测试会延迟、安全要考量”,因此拒绝盲目扩招,优先保证技术深度。
2. 资本青睐:10亿融资无商业化时间表,顶级VC愿等“长期回报”
尽管公司未明确盈利路径,仍吸引红杉、Khosla、Thrive等资本累计注资超10亿美元,估值达56亿美元:
-
资金用途:主要投入计算资源(占比超60%),用于数据处理与模型训练;其次是硬件采购与场景测试;
-
特殊约定:格鲁姆明确告知投资人“无法给出商业化时间表”,但资本仍愿买单——一方面因团队过往履历(莱文是机器人学习领域权威,格鲁姆投资眼光独到),另一方面看好“物理智能重构机器人行业”的长期价值。“我们能投入的资金没有上限,因为总有更多计算资源可用于解决更复杂的物理问题。”格鲁姆表示。
三、行业竞争:与Skild AI分道扬镳,“纯研究”VS“商业化”路线之争
物理智能赛道的竞争已悄然升温,Physical Intelligence与2023年成立的Skild AI形成鲜明对比,代表两种截然不同的发展路径。
1. 路线分歧:前者重研究,后者追商业化
-
Physical Intelligence:坚持“纯研究导向”,拒绝短期商业化诱惑,聚焦通用模型研发。目前仅与少量企业合作测试,未追求营收,目标是先让模型具备“理解复杂物理场景”的能力,例如让机器人在动态环境中(如有人穿行的厨房)安全操作;
-
Skild AI:采取“商业化优先”策略,其“全实体大脑”已落地安防、仓储、制造领域,2025年短短数月营收达3000万美元,估值更高达140亿美元。Skild还公开质疑对手:“多数机器人基础模型只是‘视觉-语言模型伪装’,缺乏物理常识,依赖互联网数据而非真实机器人数据。”
2. 技术博弈:数据来源与泛化能力的较量
Skild AI强调“商业化数据飞轮”——通过实际部署获取数据反哺模型;而Physical Intelligence则认为“过早商业化会限制模型通用性”,坚持从多元场景采集数据,甚至刻意测试“未接触过的任务”,例如让削过西葫芦的机械臂尝试处理苹果,验证模型的泛化能力。“我们的5-10年 roadmap,18个月就突破了,现在要解决的是更难的‘未知场景适应’。”格鲁姆透露。
四、挑战与争议:机器会抢人类饭碗吗?硬件瓶颈如何突破?
尽管前景可期,Physical Intelligence仍面临多重质疑,核心集中在“实用性”“安全性”与“技术落地难度”三大维度。
1. 外界质疑:“谁需要机器人削西葫芦?”
不少声音认为,公司研究的“折叠衣物”“制作咖啡”等任务并非刚需,且可能引发就业担忧——例如餐厅服务员、家政人员是否会被替代?对此,格鲁姆回应:“我们的目标不是取代人类,而是处理重复、枯燥或危险的物理工作,让人类专注更有创造力的事。”全·王补充:“目前模型已能在部分工厂场景替代人工,例如高精度包装纸箱组装,效率是人类的3倍。”
2. 内部挑战:硬件成为最大拦路虎
相较于软件迭代的快速,硬件问题常让团队陷入困境:机械臂故障、零件延迟到货、安全规范限制测试……这些都导致研发进度反复。“软件出bug可以快速修复,硬件坏了只能等配件,这是我们最头疼的事。”格鲁姆坦言,未来公司可能自研核心硬件,以解决“算法与设备不匹配”的问题。
结语:物理智能的“ChatGPT时刻”何时到来?
从总部测试室里仍在努力折叠裤子的机械臂,到估值56亿美元的资本认可,Physical Intelligence的探索,本质上是在回答一个核心问题:机器如何真正“理解”物理世界?正如英伟达CEO黄仁勋所言,物理AI的“ChatGPT时刻”已临近——当机器人能像人类一样应对突发状况(如咖啡洒出后自主清理)、适应不同环境(从家庭厨房到工厂车间),或许就是这一时刻到来的标志。
目前,Physical Intelligence尚未对外开放模型体验,但其与物流、制造企业的合作测试已初见成效。对于未来,格鲁姆充满信心:“我们在与研究了几十年物理智能的专家合作,现在时机终于成熟。硅谷愿意给我们时间和资源,即使没有明确商业化路径,因为大家相信,这会是改变世界的技术。”
这场关于“机器人大脑”的研发竞赛,才刚刚拉开序幕。Physical Intelligence能否成为物理智能领域的“OpenAI”?答案或许藏在那些不断试错的机械臂动作里,藏在每一次数据迭代中,更藏在硅谷对“长期主义创新”的坚持中。