“物理AI的ChatGPT时刻”!英伟达最新发布,黄仁勋发声
创始人
2026-01-06 07:47:29
0

每经编辑|毕陆名

英伟达(NVDA,股价:188.120美元;总市值:4.57万亿美元)在无人驾驶领域迈出关键一步,宣布开源其首个推理VLA(视觉-语言-动作)模型Alpamayo 1,这一举措旨在加速安全的自动驾驶技术开发。该模型通过类人思维方式处理复杂驾驶场景,为解决自动驾驶长尾问题提供新路径。

当地时间1月5日,美东时间1月5日周一,英伟达CEO黄仁勋在拉斯维加斯举行的CES展会上发布了Alpamayo平台,使汽车能够在真实世界中进行"推理"。黄仁勋表示,首款搭载英伟达技术的汽车将于第一季度在美国上路。

图片来源:视频截图

英伟达免费开放Alpamayo模型,允许潜在用户自行对模型进行重新训练。该模型旨在打造能在意外情况下"思考"解决方案的车辆,例如交通信号灯故障等场景。车载计算机将分析来自摄像头和其他传感器的输入,将其分解为步骤并提出解决方案。

英伟达此次发布的Alpamayo家族整合了三大基础支柱:开源模型、仿真框架和数据集,构建了一个完整的开放生态系统供任何汽车开发者或研究团队使用。

Alpamayo 1是业界首个为自动驾驶研究社区设计的思维链推理VLA模型,现已在Hugging Face平台发布。该模型采用100亿参数架构,使用视频输入生成轨迹及推理轨迹,展示每个决策背后的逻辑。开发者可以将Alpamayo 1改编为更小的运行时模型用于车辆开发,或将其作为自动驾驶开发工具的基础,例如基于推理的评估器和自动标注系统。

黄仁勋表示:“物理AI的ChatGPT时刻已到来——机器开始理解、推理并在真实世界中行动。无人出租车是首批受益者。Alpamayo为自动驾驶汽车带来推理能力,使其能够思考罕见场景,在复杂环境中安全驾驶,并解释其驾驶决策——这是安全、可扩展自动驾驶的基础。”

英伟达强调,Alpamayo模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中。未来该家族的模型将具有更大的参数规模、更详细的推理能力、更多的输入输出灵活性以及商业使用选项。

推理VLA是一种统一的AI模型,将视觉感知、语言理解和动作生成与逐步推理集成在一起。

这类模型整合了明确的AI推理功能,在传统视觉-语言-动作模型的基础上构建。AI推理是AI逐步解决复杂问题并生成类似于人类思维过程推理痕迹的能力。这些系统对一系列互联网规模的任务进行预训练,包括语言生成和视觉连接,以发展通用知识和感知基础。

与将视觉输入直接映射到动作的标准VLA模型不同,推理VLA模型将复杂的任务分解成可管理的子问题,并以可解释的形式阐明其推理过程。这使模型能够更准确地解决问题或执行任务,还能对模型正在进行的操作提供一定程度的反思。

构建推理VLA模型需要三种基本AI功能:视觉感知、语言理解以及动作和决策制定。视觉感知处理来自摄像头、毫米波雷达或激光雷达等感知传感器的实时数据;语言理解通过自然语言处理解释命令、上下文提示和对话输入;动作和决策制定则使用融合的感官和语言信息来计划、选择和安全地执行任务,同时生成可解释的推理痕迹。

在自动驾驶场景中,推理VLA可以对交通状况进行逐步推理。例如,接近一个十字路口时,系统可能会进行如此推理:“我看到一个停止标志,左边有车辆驶来,还有行人正在过马路。我应该减速,完全停下来,等待行人通过人行横道,安全时再继续前进。”

除Alpamayo 1模型外,英伟达还发布了配套的仿真工具和数据集,构建完整的开发生态系统。

此外,英伟达CEO黄仁勋表示,AI的复杂性推高需求。新款Vera Rubin设计已经全面量产。宣布面向Vera Rubin电脑的六款新芯片。新款VeraCPU拥有88 Arm定制核。公司现在是最大的网络公司。

英伟达计划2027年测试一款无人驾驶出租车服务。

黄仁勋表示,英伟达公司备受期待的新款Rubin数据中心产品将于今年发布,客户很快就能试用该技术,这将有助于加速人工智能的发展。相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行(推理)性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。英伟达表示,基于Rubin的系统运行成本将低于Blackwell版本,因为它们可以用更少的组件实现相同的效果。微软公司和其他大型云服务商将成为首批部署这一新硬件的客户。

英伟达宣布,作为全栈NVIDIA BlueField平台的一部分,NVIDIA BlueField®-4数据处理器将为推理上下文记忆存储平台提供动力。赋能推理上下文记忆存储平台(Inference Context Memory Storage Platform)。这是一种专为千亿级参数规模(Gigascale)推理设计的新型AI原生存储基础设施,旨在加速并扩展代理式AI(Agentic AI)。

每日经济新闻综合公开信

封面图片来源:视频截图

相关内容

热门资讯

从“硬件平权”到“AI平权” ... 中国软件网曹开彬今年的“618”,对于我这个AMD中国AI应用创新联盟的兼任秘书长来说,是一个有着非...
微信AI助手小微启动灰度测试,... 6月29日,三大股指午后涨跌不一,其中半导体板块表现活跃。截至下午14:20,上证科创板芯片指数盘中...
原创 “... 导语:当下,Momenta正向“物理AI第一股”发起最后冲刺。此次IPO是公司的新起点,在世界模型助...
杭州探索设立OPC“AI产品体... 新华社杭州6月29日电(记者张璇、徐卓宇)记者29日从首届“AI+OPC”创新发展大会(杭州)上获悉...
驾驭AI!用友BIP企业AI提... 市场需求瞬息万变,销售预测早已成为企业产销协同、库存管控、战略布局的核心抓手。然而当下多数企业仍依赖...
AI视界·中国品牌AI可见度全... 《AI视界·中国品牌AI可见度全景榜》(CBVI2026年度全行业品牌样本库)编制说明本品牌样本库基...
恒拓开源:6月26日融资买入9... 证券之星消息,6月26日,恒拓开源(920415)融资买入96.0万元,融资偿还93.07万元,融资...
我国开源生态版图持续扩容 新增... 当前,我国正持续推进开源生态建设。开源,简单来说就是将底层源代码开放,让用户可以自由使用、修改和分享...
应对美国高端AI限制,奥地利推... IT之家6月28日消息,据彭博社消息,奥地利正敦促欧盟考虑让Anthropic落户其境内,以反制美国...
中央音乐学院教授李小兵岭南大讲... 当下AI音乐产业发展迅猛,人工智能正重塑音乐创作生态。它既成为专业音乐人制作音乐的得力助手,也大幅降...