【量子位 2026年1月6日讯】拉斯维加斯CES 2026的舞台上,黄仁勋身着标志性鳄鱼皮夹克,带来了英伟达五年来首次“弃更游戏显卡、全押AI”的重磅发布。新一代Rubin架构GPU以“推理性能5倍、训练性能3.5倍”的跨越式提升,直接改写AI算力规则;更通过Vera Rubin全栈平台、Alpamayo自动驾驶模型、Cosmos物理AI系统三大核心布局,将“物理AI”从概念推向商业落地——2026年Q1,搭载英伟达智驾技术的梅赛德斯-奔驰CLA车型将率先上路,人形机器人也将凭借GR00T模型实现更精准的全身控制,标志着AI正式从“屏幕端”走进“物理世界”。
此次发布不仅覆盖AI基建、智驾、机器人、生物医疗四大领域,更开放10万亿语言token、50万条机器人轨迹等海量数据集,进一步巩固英伟达从芯片到生态的全链路优势。
一、Rubin GPU:5倍算力突破,推理成本直降90%
作为英伟达新一代算力核心,Rubin GPU在NVFP4数据格式下实现性能“飞跃式”提升,更通过架构革新解决AI推理“算不起、记不住”的行业痛点:
1. 性能碾压上代:晶体管仅增1.6倍,算力却翻5倍
Rubin GPU的核心突破在于“极端协同设计”——并非单纯堆砌晶体管,而是通过CPU、GPU、内存、网络的全栈优化释放算力。官方数据显示:
-
推理性能:50 PFLOPS(NVFP4精度),是Blackwell GB200的5倍,可每秒处理超1000亿token;
-
训练性能:35 PFLOPS(NVFP4精度),较上代提升3.5倍,训练混合专家(MoE)模型时所需GPU数量减少至1/4;
-
内存与带宽:单GPU封装8组HBM4内存,容量288GB、带宽22 TB/s(是Blackwell的2.8倍),彻底解决大模型训练时的“内存墙”问题。
“这不是简单升级芯片,而是重新设计整台AI超算。”黄仁勋在演讲中强调,这种突破让Agentic AI(代理智能体)的大规模推理成为可能,例如原本需要1000张GPU的大模型推理任务,现在仅需200张Rubin即可完成。
2. Vera Rubin平台:六芯协同,打造“算力巨兽”
为支撑Rubin GPU的极致性能,英伟达推出Vera Rubin NVL72机柜架构,整合六大核心组件形成闭环:
-
Vera CPU:88个定制Olympus Arm核心,支持176线程并行,通过“空间多线程”设计解决CPU与GPU的吞吐不匹配问题;
-
NVLink 6交换机:单GPU互连带宽3.6 TB/s(双向),单个机柜总带宽260 TB/s,是全球互联网总带宽的2倍以上;
-
BlueField-4 DPU:构建“推理上下文内存存储平台”,为每颗GPU额外提供16TB高速共享内存,解决长文本推理时的KV Cache(键值缓存)瓶颈;
-
Spectrum-6以太网交换机:液冷设计、支持800G端口,单芯片带宽102.4 Tb/s,满足超大规模集群的互联需求。
实测显示,单个Vera Rubin NVL72机柜可提供3.6 ExaFLOPS推理算力、2.5 ExaFLOPS训练算力,相当于50万台普通服务器的计算能力,且能效提升5倍,45℃温水冷却设计可节省数据中心6%的电力消耗。
二、砸掉智驾门槛:Alpamayo模型开源,2026年Q1奔驰实车上路
在自动驾驶领域,英伟达推出全球首款开源视觉-语言-行动(VLA)推理模型Alpamayo,直接降低L4级智驾的开发门槛:
1. 模型能“思考”还能“解释”,覆盖全场景驾驶
Alpamayo 1(100亿参数)打破传统智驾“黑盒决策”模式,可接收三类输入并生成可解释的决策:
-
环境感知:处理多摄像头实时视频,识别行人、车辆、交通标识;
-
运动历史:分析车辆过往行驶轨迹,预判路况变化;
-
用户指令:响应“规避拥堵”“优先高速”等个性化需求。
例如遇到突发横穿马路的行人时,Alpamayo不仅能快速规划避让路线,还能输出决策依据:“前方50米有行人闯入,当前车速60km/h,需减速至30km/h并向左侧车道避让,避让后加速恢复原速”,大幅提升智驾系统的安全性与可信度。
2. 仿真+数据双管齐下,加速开发落地
为配合Alpamayo模型,英伟达同步推出:
-
AlpacaSim仿真框架:支持暴雨、暴雪、极端拥堵等边缘场景的闭环训练,开发者无需依赖真实路测即可验证算法;
-
1700小时开源数据集:覆盖全球20个国家的复杂路况,包含隧道逆光、山区弯道、突发事故等罕见场景数据,填补真实路测数据的空白。
落地进度上,Alpamayo将率先搭载于2026年Q1欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级逐步开放“高速公路脱手驾驶”“城市全场景自动驾驶”功能,2026年底登陆美国市场。目前,英伟达L4级智驾生态已覆盖特斯拉、比亚迪、理想等20余家车企,以及小马智行、Waymo等Robotaxi公司。
三、All in物理AI:Cosmos赋能机器人,GR00T实现全身控制
黄仁勋在演讲中多次强调:“AI的下一个前沿是物理AI,机器将理解、推理并在真实世界行动。”此次发布的Cosmos平台与Isaac GR00T模型,正是这一战略的核心落地工具:
1. Cosmos平台:让AI“懂物理”,生成符合规律的合成数据
Cosmos系列模型通过仿真物理世界规律,为机器人与智驾系统提供海量高保真训练数据,新版本包含三大核心升级:
-
Cosmos Reason 2:顶尖视觉-语言推理模型(VLM),可帮助机器人识别物体材质(如“玻璃易碎需轻拿”)、判断空间关系(如“狭窄通道需侧身通过”),支持200+类物体的精准交互;
-
Cosmos Transfer 2.5/Predict 2.5:生成大规模物理仿真视频,例如模拟机器人在不同地面材质(瓷砖、草坪、冰面)上的运动姿态,或车辆在暴雨天气下的刹车距离变化;
-
AI Blueprint工具链:提供视频搜索、摘要生成的参考工作流,已被Salesforce用于分析机器人采集的工业质检视频,将故障识别效率提升50%。
目前,Figure、Agility Robotics等机器人公司已用Cosmos生成的合成数据训练产品,通用汽车更是将其用于自动驾驶仿真测试,使实车路测里程减少30%。
2. Isaac GR00T N1.6:人形机器人的“全身控制大脑”
专为类人机器人设计的GR00T N1.6模型,是业界首个开源视觉-语言-行动(VLA)模型,实现两大突破:
-
全身协同控制:支持机器人的关节、躯干、四肢联动,例如“弯腰拾取地上物品时调整重心避免摔倒”“双手配合拧开瓶盖”;
-
深度推理集成:结合Cosmos Reason 2模型,可理解复杂指令并规划动作,例如用户说“整理桌面”,机器人能自主判断“先将书本归位、再擦拭桌面、最后摆放摆件”。
Franka Robotics、NEURA Robotics已用该模型优化机器人生产线,实测显示,机器人完成“零件装配”任务的效率提升40%,失误率降低至0.5%以下。
四、生态开放:国产模型登榜,海量数据免费共享
为推动物理AI生态扩张,英伟达此次加大开源力度,不仅支持国产模型,还开放核心数据集:
1. 力挺国产开源模型,DeepSeek、Kimi登PPT
黄仁勋在演讲开篇即提及中国开源模型的进展,DeepSeek、Kimi K2、Qwen(通义千问)等出现在“开源模型生态”展示页。数据显示,目前80%的AI初创公司基于开源模型开发,而英伟达GPU支撑了全球90%以上的开源模型训练,形成“硬件-模型-应用”的正向循环。
2. 开放10万亿token+50万机器人轨迹,降低开发成本
英伟达此次免费开放四类核心数据集,覆盖多领域需求:
-
语言数据:10万亿训练token,支持多语言大模型开发;
-
机器人数据:50万条机器人操作轨迹,包含抓取、装配、搬运等任务;
-
生物医疗数据:45.5万个蛋白质结构、100TB车辆传感器数据,助力药物研发与智驾训练;
-
物理仿真数据:涵盖机器人、自动驾驶、工业制造的100TB合成视频。
“开源不是慈善,而是让更多人用我们的工具,最终拉动GPU需求。”黄仁勋直言,这种生态策略已见效——目前全球超200万开发者使用英伟达AI工具,2025年其数据中心业务营收突破1500亿美元,其中生态伙伴贡献占比超60%。
五、行业影响:AI竞赛转向“物理落地”,英伟达护城河再加深
此次发布不仅是技术升级,更标志着AI行业从“算力堆砌”转向“物理落地”的新阶段:
-
算力军备竞赛升级:Rubin GPU的5倍性能提升,将倒逼AMD、英特尔加速高端AI芯片研发,而Vera Rubin平台的全栈优势,可能进一步拉大英伟达与竞争对手的差距;
-
智驾与机器人商业化提速:Alpamayo模型的开源与奔驰实车落地,将推动L4级智驾从“测试”走向“量产”,人形机器人也有望在2026-2027年进入消费级市场;
-
中国企业机遇与挑战并存:国产模型获英伟达认可,意味着更多合作机会,但Rubin架构的技术壁垒也可能加剧国内企业对英伟达GPU的依赖,自主芯片研发压力进一步增大。
结语:物理AI的“ChatGPT时刻”已至
从Rubin GPU的算力突破,到Alpamayo智驾模型的实车落地,再到Cosmos赋能机器人理解物理世界,英伟达此次发布的全栈方案,正式宣告“物理AI”进入商业变现期。正如黄仁勋所言:“AI不再只是聊天工具,而是能走进工厂、公路、家庭的‘实干家’。”
随着Vera Rubin平台2026年下半年量产,以及梅赛德斯-奔驰等合作伙伴的产品落地,物理AI将逐步重塑汽车、制造、医疗等行业。对于消费者而言,或许在2026年底,就能坐上“会思考”的自动驾驶汽车,让“机器人管家”打理家务——而这一切的背后,都离不开英伟达搭建的物理AI底座。