Rubin平台官宣量产!黄仁勋:机器人的ChatGPT时刻已至

描述

电子发烧友网报道(文/梁浩斌)在拉斯维加斯当地时间1月5日,英伟达CEO黄仁勋身穿标志性皮衣亮相CES展会前的英伟达特别演讲会场。作为2026年的第一场公开活动,黄仁勋在这场演讲中带来了相当多“猛料”,宣布了Blackwell 、Rubin架构芯片的最新进展,以及首次公开了 Rubin平台六款芯片,以及详细性能参数。
 
除了硬件之外,物理AI也被重点提及,黄仁勋在演讲中宣布开源分别面向自动驾驶和机器人的两款VLA模型,加速推动自动驾驶、机器人等应用的物理AI落地。
 
Vera Rubin平台量产,推理性能实现 5 倍飞跃
 
作为英伟达下一代GPU架构,Rubin GPU的量产进展一直备受关注。去年10月,英伟达在秋季GTC大会上首次展示了Vera Rubin超级计算平台,而这个平台不是单一的芯片升级,而是一套涵盖六大核心芯片的全栈协同架构,包括 Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 及 Spectrum-6 以太网交换机,从计算、网络到存储安全实现全层级革新。
 
Vera CPU基于定制化 Arm v9.2 架构(代号 Olympus)打造,专为超大规模 AI 场景设计。其搭载 88 个高性能定制核心,支持 NVIDIA Spatial Multi-Threading 技术,可提供 176 个线程,配合 162MB L3 缓存,在数据处理、压缩及 CI/CD 任务中性能较前代 Grace CPU 提升 2 倍。该芯片集成 2270 亿晶体管,采用 3NP 先进制程,配备 1.5TB LPDDR5X 系统内存,通过 SOCAMM 技术实现 1.2TB/s 的内存带宽,是上一代Grace平台的 3 倍之多。
 
在异构协同能力上,Vera CPU搭载1.8TB/s NVLink-C2C一致性内存互联通道,可与Rubin GPU实现低延迟数据交互,单芯片最多能驱动4颗Rubin GPU高效运行。同时,其内置机架级机密计算功能,为多租户 AI 云服务提供硬件级安全隔离,核心应用覆盖 AI 推理任务调度、GPU 数据投喂、多节点协同管理等关键场景,能效比较前代提升 40%,推理任务响应速度加快 50%。
 
Rubin GPU 作为平台的算力核心,集成 3360 亿晶体管,采用两颗 Reticle 尺寸芯片设计,配备 224 个 SM 单元与第六代 Tensor Core,第三代 Transformer 引擎为其赋予了强大的 AI 处理能力。在性能表现上,该 GPU 在 NVFP4 精度下的推理算力达到 50 PFLOPS,是上一代 Blackwell GPU 的 5 倍;FP8 精度训练算力达 17.5 PFLOPS,较前代提升 250%,可轻松支撑万亿参数大模型与混合专家(MoE)模型的训练推理。
 
显存配置方面,Rubin GPU 标配 288GB HBM4 显存,Ultra 版本更支持 1025GB HBM4E 显存,显存带宽高达 22TB/s,较 Blackwell 的 8TB/s 提升 175%,配合硬件加速自适应压缩技术,可使显存占用降低 30%。其单 GPU NVLink 带宽达 3.6TB/s,支持全对全拓扑互联,能满足大规模模型并行计算需求。在功耗控制上,该 GPU TDP 为 1800W(Ultra 版 3600W),支持 45℃温水液冷技术,散热效率提升 60%,单位算力功耗降低 40%,每 PFLOPS 功耗仅 42W,为超大规模 AI 集群部署提供了能效保障。
 
NVLink 6 交换机是 Rubin 平台机架内 GPU 互联的核心枢纽,专为低延迟、高带宽通信设计,单 GPU 双向互联带宽达 3.6TB/s,较前代提升 100%,是 PCIe Gen 6 带宽的 14 倍以上。在 Vera Rubin NVL72 机架配置中,该交换机可实现 72 颗 GPU 的全对全无阻塞互联,总带宽高达 260TB/s,较前代机架提升 73%。
 
ConnectX-9 SuperNIC 作为智能网卡,兼具 InfiniBand 与以太网双模支持能力,每端口速率达 800Gb/s,支持 200G PAM4 串并转换,单卡总吞吐量高达 1.6Tb/s,较前代 ConnectX-8 提升 100%。其兼容 InfiniBand HDR200 与以太网 400G 协议,支持 RDMA over Converged Ethernet(RoCE v3)技术,RDMA 延迟降低至 0.8μs,较前代减少 20%,为跨节点数据传输提供低延迟保障。
 
ConnectX-9 SuperNIC集成 230 亿晶体管,内置可编程 IO、基于遥测的拥塞控制、线速加密(AES-256)及网络内数据压缩等硬件加速功能,新增 AI 任务优先级调度机制,拥塞控制效率提升 40%。其与 NVIDIA Spectrum-X 以太网和 Quantum-X800 网络平台无缝集成,能为 Rubin GPU 提供稳定高速的网络连接,每 Gb/s 功耗仅 0.3W,能效比提升 50%,平均无故障时间达 200 万小时,可满足 AI 工厂与云平台超大规模部署的网络需求。
 
BlueField-4 DPU 整合了计算、网络、存储三大核心功能,是平台的安全与存储中枢,集成 64 核 Grace CPU(Neoverse V2 架构),FP8 算力达 8 TFLOPS,较前代 BlueField-3 提升 500%,网络传输能力提升 2 倍。其支持 800Gb/s 端口速率,兼容 InfiniBand 与以太网双模,网络延迟降低至 1.5μs,较前代减少 30%,可高效卸载 90% 的存储与网络任务,大幅降低 CPU 负载。该 DPU 支持 1.5TB LPDDR5X 内存,内存带宽达 250GB/s,较前代提升 233%,兼容 NVMe-oF 与 SATA 协议,存储 IOPS 提升 3 倍。
 
Spectrum-6 以太网交换机是 Rubin 平台跨机架互联的核心设备,采用共封装光学(CPO)技术,支持 200G 硅光模块,单芯片交换容量达 102.4 Tb/s,较前代提升 100%。其端口密度显著提升,可支持 128 个 800Gb/s 端口或 512 个 200Gb/s 端口,较前代端口密度翻倍,能满足超大规模 AI 集群的横向扩展需求。
 
该交换机实现机架间互联带宽 260 TB/s(NVL72 配置),端到端延迟降低至 2.5μs,较前代减少 30%,有效带宽利用率达 95%。其集成 AI 流量调度引擎与动态负载均衡功能,可使 AI 任务网络抖动降低 40%,应用程序运行效率提高 5 倍。
 
六款核心芯片的协同设计构成了 Rubin 平台的核心竞争力,从计算、网络到存储的全栈优化,不仅将 AI 推理 Token 成本降低 10 倍,更使 MoE 模型训练所需 GPU 数量减少 75%,为代理式 AI、物理 AI 的规模化落地奠定了坚实基础。
 
黄仁勋强调,Vera Rubin 的设计初衷是应对 AI 计算量“每年 10 倍增长”的核心挑战:“摩尔定律已无法跟上模型规模扩张速度,唯有通过全栈协同设计,重构每一层基础设施,才能让 AI‘多想一会儿’变得经济可行。” 据透露,全部六款Vera Rubin平台芯片均已从制造合作伙伴处取回并进行测试,而该平台产品将在2026年下半年,在微软 Azure、CoreWeave 、AWS等云服务商率先部署。
 
黄仁勋:AI重心从“生成”到“推理+物理AI”,机器人的ChatGPT时刻已至
 
演讲中,黄仁勋明确指出 AI 产业正经历两大关键转型:一是从“生成式 AI” 转向“代理式AI(Agentic AI)”,模型具备自主推理、规划任务、使用工具的能力;二是从 “数字 A” 走向“物理AI”,让 AI 理解重力、惯性等自然法则,实现与现实世界的交互。
 
“AI发展的下一站就是进入物理世界,英伟达为此已经进行了8年的工作”。而在这次演讲中,英伟达发布了多款开源模型,涵盖不同领域。
 
其中面向自动驾驶,英伟达发布全球首个开源视觉-语言-行动(VLA)推理模型 Alpamayo,打破传统自动驾驶系统被动响应的局限。该模型具备链式推理能力,可理解复杂场景中的因果关系,如突发路况下的避险逻辑,并解释决策过程,搭配AlpaSim高保真仿真框架及 1700 小时开源驾驶数据集,形成从训练到验证的完整闭环。
 
同时,黄仁勋宣布首款搭载英伟达全栈自动驾驶技术的梅赛德斯-奔驰 CLA 车型,将于 2026 年第一季度在美国上路,标志着推理型AI正式从实验室走向消费级出行场景。
 
另外还有专注逻辑推理与任务执行的Agent模型Nemotron、理解物理规律和环境交互的Cosmos物理AI模型、用于生物医药研发和医疗影像的Clara。
 
英伟达认为,机器人是物理AI的最大应用场景,而针对机器人领域,英伟达推出了两大关键技术:开源基础模型GR00T N1和物理引擎Newton。
 
GR00T N1是面向人形机器人的VLA模型,支持全身控制与多步骤协作,可通过模仿学习或强化学习掌握物体抓取、环境导航等技能。物理引擎 Newton是英伟达联合DeepMind、迪士尼研究院研发,支持刚性/软体模拟、触觉反馈训练,能以超实时速度生成海量合成数据,解决机器人“训练数据稀缺” 难题。
 
黄仁勋表示,机器人的 ChatGPT 时刻已至,通过 Omniverse 仿真平台与 Cosmos物理模型,开发者可快速训练适配工业、家庭等多场景的机器人系统。
 
除此之外,黄仁勋也在演讲中多次强调生态开放的重要性,认为开源模型是AI普及的核心驱动力,他特别提及到中国开源模型 DeepSeek R1 的突破:“它让行业意识到,开放创新能激活全球力量,尽管开源模型仍落后前沿闭源模型约 6 个月,但差距正不断缩小。”
 
未来五年AI产业预判:机器人成最大产业;推理算力、上下文管理能力成关键
 
在演讲最后,黄仁勋对AI产业未来五年的趋势做出了三大预判:
 
一是编程软件将全面让位于训练软件,CPU 主导的通用计算转向 GPU 加速计算,全球价值 10 万亿美元的传统计算基础设施将完成 AI 现代化改造;
 
二是随着 AI 从 “一次性问答” 转向 “长期协作智能体”,未来推理算力、上下文管理能力将成为企业竞争关键,Vera Rubin 这类全栈平台将成为行业标配;
 
三是机器人产业的爆发,到2030年,全球劳动力缺口将达 5000 万,人形机器人、工业机器人需求将爆发,成为比云计算更大的产业,而物理 AI 与仿真技术将是核心驱动力。
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分