AI竞赛转向推理,英伟达宣布Rubin芯片平台全面投产
创始人
2026-01-06 10:18:31
0

来源:21世纪经济报道

英伟达2026年的首场重头戏比以往来得更早。

当地时间1月5日,在美国CES上,黄仁勋出乎意料地提前发布了下一代AI芯片平台“Rubin”,打破了英伟达通常在每年3月GTC大会上集中公布新一代架构的传统。

AI竞赛进入推理时代,英伟达决定加速出击。

Vera Rubin已投产

Rubin并非空降。

早在2025年3月的GTC大会上,黄仁勋就已预告了代号“Vera Rubin”的超级芯片,并明确其将于2026年量产。

此次在CES上,黄仁勋对Rubin平台进行了系统性发布,Rubin成为英伟达最新GPU的代号。

“Rubin的到来正逢其时。无论是训练还是推理,AI对计算的需求都在急剧攀升。”黄仁勋表示,“我们坚持每年推出新一代AI超级计算机,通过六颗全新芯片的极致协同设计,Rubin正在向AI的下一个前沿迈出巨大一步。”

Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。

相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。

与英伟达Blackwell平台相比,Rubin平台可将推理token成本降低最高90%,并将训练混合专家(MoE)模型所需的GPU数量减少75%。

同时,Vera Rubin NVL72机柜级系统和平台同步发布,命名上非外界预计的NVL144。对此,英伟达高管在沟通会上向21世纪经济报道等记者指出,NVL72指的是72个GPU封装单元,每个封装内部包含2个Rubin Die,因此系统中实际包含144个Rubin Die,这并不意味着系统规模变化。

在生态层面,Rubin已获得头部云厂商和模型公司的集中响应。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名单。

Rubin在CES的提前亮相,也引发了外界对英伟达产品发布节奏变化的关注。对此,英伟达高管回应称,目前构成Vera Rubin平台的六颗芯片已经全部到位,相关系统已在运行真实应用负载,并取得了积极结果。

此次在CES上提前披露Rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达同时强调,Rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。

全栈AI布局

随着AI进入推理阶段,黄仁勋展示的不只是Rubin平台。

在CES演讲中,英伟达还发布了一系列AI体系产品,包括开源模型、AI存储、物理AI等。这是英伟达的全栈AI布局,同时也是其在继续释放信号:AI重心继续从“训练规模”转向“推理系统”。

具体来看,英伟达发布了推理上下文存储平台(Inference Context Memory Storage Platform),这是一个专为推理场景设计的AI原生存储平台。该平台由BlueField-4 DPU与Spectrum-X以太网支撑,在GPU与传统存储之间引入新的存储层,用于高效管理和共享KV Cache,减少重复计算带来的算力浪费。

同时,黄仁勋特别强调了物理AI。在更长期的布局上,英伟达围绕物理AI推进,发布了一系列开源模型、开发框架和硬件平台,将AI能力从数据中心延伸至机器人、自动驾驶与工业边缘场景。

黄仁勋表示:“AI已经不再是一次性问答的聊天机器人,而是能够理解物理世界、进行长期推理、使用工具完成真实工作,并同时保有短期和长期记忆的智能协作者。”

面向机器人领域,英伟达发布了Cosmos与GR00T系列开源模型,用于机器人学习、推理与动作规划。

其中,Cosmos Reason 2是一款推理型视觉语言模型(VLM),使机器能够“看见、理解并在物理世界中行动”;GR00T N1.6 则是一款面向类人机器人的推理型视觉-语言-动作(VLA)模型,用于解锁全身控制能力。

“机器人领域的ChatGPT时刻已经到来,”黄仁勋表示,“能够理解现实世界、进行推理并规划行动的物理AI模型,正在解锁全新的应用场景。英伟达覆盖Jetson、CUDA、Omniverse 以及开源物理AI模型的完整技术栈,正在赋能全球合作伙伴,通过AI驱动的机器人重塑各个行业。”

在自动驾驶领域,英伟达发布了Alpamayo开源模型家族,定位为面向“长尾场景”的推理型自动驾驶基础模型。该体系配套发布了AlpaSim高保真仿真框架以及覆盖1700多小时驾驶数据的开源数据集,用于训练和验证基于推理的自动驾驶系统。黄仁勋表示,英伟达的首款AV车将于第一季度在美国推出,其他地区紧随其后。

从Rubin平台的提前亮相,到推理存储与物理AI的同步推进,英伟达正在将AI基础设施的竞争推向“系统工程能力”。

在这一阶段,真正拉开差距的,已不只是芯片算力本身,而是从架构、系统到生态的整体交付。

相关内容

热门资讯

从“硬件平权”到“AI平权” ... 中国软件网曹开彬今年的“618”,对于我这个AMD中国AI应用创新联盟的兼任秘书长来说,是一个有着非...
微信AI助手小微启动灰度测试,... 6月29日,三大股指午后涨跌不一,其中半导体板块表现活跃。截至下午14:20,上证科创板芯片指数盘中...
原创 “... 导语:当下,Momenta正向“物理AI第一股”发起最后冲刺。此次IPO是公司的新起点,在世界模型助...
杭州探索设立OPC“AI产品体... 新华社杭州6月29日电(记者张璇、徐卓宇)记者29日从首届“AI+OPC”创新发展大会(杭州)上获悉...
驾驭AI!用友BIP企业AI提... 市场需求瞬息万变,销售预测早已成为企业产销协同、库存管控、战略布局的核心抓手。然而当下多数企业仍依赖...
AI视界·中国品牌AI可见度全... 《AI视界·中国品牌AI可见度全景榜》(CBVI2026年度全行业品牌样本库)编制说明本品牌样本库基...
恒拓开源:6月26日融资买入9... 证券之星消息,6月26日,恒拓开源(920415)融资买入96.0万元,融资偿还93.07万元,融资...
我国开源生态版图持续扩容 新增... 当前,我国正持续推进开源生态建设。开源,简单来说就是将底层源代码开放,让用户可以自由使用、修改和分享...
应对美国高端AI限制,奥地利推... IT之家6月28日消息,据彭博社消息,奥地利正敦促欧盟考虑让Anthropic落户其境内,以反制美国...
中央音乐学院教授李小兵岭南大讲... 当下AI音乐产业发展迅猛,人工智能正重塑音乐创作生态。它既成为专业音乐人制作音乐的得力助手,也大幅降...