Rubin平台官宣量产！黄仁勋：机器人的ChatGPT时刻已至

Hobby观察 2026-01-07 6323

描述

电子发烧友网报道（文/梁浩斌）在拉斯维加斯当地时间1月5日，英伟达CEO黄仁勋身穿标志性皮衣亮相CES展会前的英伟达特别演讲会场。作为2026年的第一场公开活动，黄仁勋在这场演讲中带来了相当多“猛料”，宣布了Blackwell 、Rubin架构芯片的最新进展，以及首次公开了 Rubin平台六款芯片，以及详细性能参数。

除了硬件之外，物理AI也被重点提及，黄仁勋在演讲中宣布开源分别面向自动驾驶和机器人的两款VLA模型，加速推动自动驾驶、机器人等应用的物理AI落地。

Vera Rubin平台量产，推理性能实现 5 倍飞跃

作为英伟达下一代GPU架构，Rubin GPU的量产进展一直备受关注。去年10月，英伟达在秋季GTC大会上首次展示了Vera Rubin超级计算平台，而这个平台不是单一的芯片升级，而是一套涵盖六大核心芯片的全栈协同架构，包括 Vera CPU、Rubin GPU、NVLink 6 交换机、ConnectX-9 SuperNIC、BlueField-4 DPU 及 Spectrum-6 以太网交换机，从计算、网络到存储安全实现全层级革新。

Vera CPU基于定制化 Arm v9.2 架构（代号 Olympus）打造，专为超大规模 AI 场景设计。其搭载 88 个高性能定制核心，支持 NVIDIA Spatial Multi-Threading 技术，可提供 176 个线程，配合 162MB L3 缓存，在数据处理、压缩及 CI/CD 任务中性能较前代 Grace CPU 提升 2 倍。该芯片集成 2270 亿晶体管，采用 3NP 先进制程，配备 1.5TB LPDDR5X 系统内存，通过 SOCAMM 技术实现 1.2TB/s 的内存带宽，是上一代Grace平台的 3 倍之多。

在异构协同能力上，Vera CPU搭载1.8TB/s NVLink-C2C一致性内存互联通道，可与Rubin GPU实现低延迟数据交互，单芯片最多能驱动4颗Rubin GPU高效运行。同时，其内置机架级机密计算功能，为多租户 AI 云服务提供硬件级安全隔离，核心应用覆盖 AI 推理任务调度、GPU 数据投喂、多节点协同管理等关键场景，能效比较前代提升 40%，推理任务响应速度加快 50%。

Rubin GPU 作为平台的算力核心，集成 3360 亿晶体管，采用两颗 Reticle 尺寸芯片设计，配备 224 个 SM 单元与第六代 Tensor Core，第三代 Transformer 引擎为其赋予了强大的 AI 处理能力。在性能表现上，该 GPU 在 NVFP4 精度下的推理算力达到 50 PFLOPS，是上一代 Blackwell GPU 的 5 倍；FP8 精度训练算力达 17.5 PFLOPS，较前代提升 250%，可轻松支撑万亿参数大模型与混合专家（MoE）模型的训练推理。

显存配置方面，Rubin GPU 标配 288GB HBM4 显存，Ultra 版本更支持 1025GB HBM4E 显存，显存带宽高达 22TB/s，较 Blackwell 的 8TB/s 提升 175%，配合硬件加速自适应压缩技术，可使显存占用降低 30%。其单 GPU NVLink 带宽达 3.6TB/s，支持全对全拓扑互联，能满足大规模模型并行计算需求。在功耗控制上，该 GPU TDP 为 1800W（Ultra 版 3600W），支持 45℃温水液冷技术，散热效率提升 60%，单位算力功耗降低 40%，每 PFLOPS 功耗仅 42W，为超大规模 AI 集群部署提供了能效保障。

NVLink 6 交换机是 Rubin 平台机架内 GPU 互联的核心枢纽，专为低延迟、高带宽通信设计，单 GPU 双向互联带宽达 3.6TB/s，较前代提升 100%，是 PCIe Gen 6 带宽的 14 倍以上。在 Vera Rubin NVL72 机架配置中，该交换机可实现 72 颗 GPU 的全对全无阻塞互联，总带宽高达 260TB/s，较前代机架提升 73%。

ConnectX-9 SuperNIC 作为智能网卡，兼具 InfiniBand 与以太网双模支持能力，每端口速率达 800Gb/s，支持 200G PAM4 串并转换，单卡总吞吐量高达 1.6Tb/s，较前代 ConnectX-8 提升 100%。其兼容 InfiniBand HDR200 与以太网 400G 协议，支持 RDMA over Converged Ethernet（RoCE v3）技术，RDMA 延迟降低至 0.8μs，较前代减少 20%，为跨节点数据传输提供低延迟保障。

ConnectX-9 SuperNIC集成 230 亿晶体管，内置可编程 IO、基于遥测的拥塞控制、线速加密（AES-256）及网络内数据压缩等硬件加速功能，新增 AI 任务优先级调度机制，拥塞控制效率提升 40%。其与 NVIDIA Spectrum-X 以太网和 Quantum-X800 网络平台无缝集成，能为 Rubin GPU 提供稳定高速的网络连接，每 Gb/s 功耗仅 0.3W，能效比提升 50%，平均无故障时间达 200 万小时，可满足 AI 工厂与云平台超大规模部署的网络需求。

BlueField-4 DPU 整合了计算、网络、存储三大核心功能，是平台的安全与存储中枢，集成 64 核 Grace CPU（Neoverse V2 架构），FP8 算力达 8 TFLOPS，较前代 BlueField-3 提升 500%，网络传输能力提升 2 倍。其支持 800Gb/s 端口速率，兼容 InfiniBand 与以太网双模，网络延迟降低至 1.5μs，较前代减少 30%，可高效卸载 90% 的存储与网络任务，大幅降低 CPU 负载。该 DPU 支持 1.5TB LPDDR5X 内存，内存带宽达 250GB/s，较前代提升 233%，兼容 NVMe-oF 与 SATA 协议，存储 IOPS 提升 3 倍。

Spectrum-6 以太网交换机是 Rubin 平台跨机架互联的核心设备，采用共封装光学（CPO）技术，支持 200G 硅光模块，单芯片交换容量达 102.4 Tb/s，较前代提升 100%。其端口密度显著提升，可支持 128 个 800Gb/s 端口或 512 个 200Gb/s 端口，较前代端口密度翻倍，能满足超大规模 AI 集群的横向扩展需求。

该交换机实现机架间互联带宽 260 TB/s（NVL72 配置），端到端延迟降低至 2.5μs，较前代减少 30%，有效带宽利用率达 95%。其集成 AI 流量调度引擎与动态负载均衡功能，可使 AI 任务网络抖动降低 40%，应用程序运行效率提高 5 倍。

六款核心芯片的协同设计构成了 Rubin 平台的核心竞争力，从计算、网络到存储的全栈优化，不仅将 AI 推理 Token 成本降低 10 倍，更使 MoE 模型训练所需 GPU 数量减少 75%，为代理式 AI、物理 AI 的规模化落地奠定了坚实基础。

黄仁勋强调，Vera Rubin 的设计初衷是应对 AI 计算量“每年 10 倍增长”的核心挑战：“摩尔定律已无法跟上模型规模扩张速度，唯有通过全栈协同设计，重构每一层基础设施，才能让 AI‘多想一会儿’变得经济可行。” 据透露，全部六款Vera Rubin平台芯片均已从制造合作伙伴处取回并进行测试，而该平台产品将在2026年下半年，在微软 Azure、CoreWeave 、AWS等云服务商率先部署。

黄仁勋：AI重心从“生成”到“推理+物理AI”，机器人的ChatGPT时刻已至

演讲中，黄仁勋明确指出 AI 产业正经历两大关键转型：一是从“生成式 AI” 转向“代理式AI（Agentic AI）”，模型具备自主推理、规划任务、使用工具的能力；二是从 “数字 A” 走向“物理AI”，让 AI 理解重力、惯性等自然法则，实现与现实世界的交互。

“AI发展的下一站就是进入物理世界，英伟达为此已经进行了8年的工作”。而在这次演讲中，英伟达发布了多款开源模型，涵盖不同领域。

其中面向自动驾驶，英伟达发布全球首个开源视觉-语言-行动（VLA）推理模型 Alpamayo，打破传统自动驾驶系统被动响应的局限。该模型具备链式推理能力，可理解复杂场景中的因果关系，如突发路况下的避险逻辑，并解释决策过程，搭配AlpaSim高保真仿真框架及 1700 小时开源驾驶数据集，形成从训练到验证的完整闭环。

同时，黄仁勋宣布首款搭载英伟达全栈自动驾驶技术的梅赛德斯-奔驰 CLA 车型，将于 2026 年第一季度在美国上路，标志着推理型AI正式从实验室走向消费级出行场景。

另外还有专注逻辑推理与任务执行的Agent模型Nemotron、理解物理规律和环境交互的Cosmos物理AI模型、用于生物医药研发和医疗影像的Clara。

英伟达认为，机器人是物理AI的最大应用场景，而针对机器人领域，英伟达推出了两大关键技术：开源基础模型GR00T N1和物理引擎Newton。

GR00T N1是面向人形机器人的VLA模型，支持全身控制与多步骤协作，可通过模仿学习或强化学习掌握物体抓取、环境导航等技能。物理引擎 Newton是英伟达联合DeepMind、迪士尼研究院研发，支持刚性/软体模拟、触觉反馈训练，能以超实时速度生成海量合成数据，解决机器人“训练数据稀缺” 难题。

黄仁勋表示，机器人的 ChatGPT 时刻已至，通过 Omniverse 仿真平台与 Cosmos物理模型，开发者可快速训练适配工业、家庭等多场景的机器人系统。

除此之外，黄仁勋也在演讲中多次强调生态开放的重要性，认为开源模型是AI普及的核心驱动力，他特别提及到中国开源模型 DeepSeek R1 的突破：“它让行业意识到，开放创新能激活全球力量，尽管开源模型仍落后前沿闭源模型约 6 个月，但差距正不断缩小。”

未来五年AI产业预判：机器人成最大产业；推理算力、上下文管理能力成关键

在演讲最后，黄仁勋对AI产业未来五年的趋势做出了三大预判：

一是编程软件将全面让位于训练软件，CPU 主导的通用计算转向 GPU 加速计算，全球价值 10 万亿美元的传统计算基础设施将完成 AI 现代化改造；

二是随着 AI 从 “一次性问答” 转向 “长期协作智能体”，未来推理算力、上下文管理能力将成为企业竞争关键，Vera Rubin 这类全栈平台将成为行业标配；

三是机器人产业的爆发，到2030年，全球劳动力缺口将达 5000 万，人形机器人、工业机器人需求将爆发，成为比云计算更大的产业，而物理 AI 与仿真技术将是核心驱动力。

打开APP阅读更多精彩内容