NVIDIA CEO黄仁勋在GTC 2026台北大会发表主题演讲

描述

在 COMPUTEX 期间举办的 NVIDIA GTC 台北大会上,全球开发者、研究人员和行业领导者齐聚一堂,深入探讨正在影响各行各业的全新突破,涵盖 AI 工厂以及将基础设施扩展到代理式 AI 和物理 AI 等主题。

聆听 NVIDIA 创始人兼 CEO 黄仁勋在台北流行音乐中心主舞台带来的现场演讲。

“如今,AI 已成为利润引擎,也是 GDP 引擎” —— NVIDIA CEO 黄仁勋在 COMPUTEX 期间的 GTC 台北大会上指出

NVIDIA 创始人兼 CEO 黄仁勋抵达台北后,行程便一刻未停。

他与参与建设全球 AI 基础设施的合作伙伴逛了夜市,与使用 NVIDIA 平台的企业 CEO 们共进晚餐,并为新园区揭幕。

本周黄仁勋所到之处,都能看到生态系统的身影。今天,他们齐聚台北流行音乐中心共同迎来这场主题演讲。黄仁勋向在场的每一位致谢,从各公司 CEO,到他在夜市偶遇的水果摊主。

黄仁勋向现场及线上的观众表示:“如今,AI 已成为利润引擎,也是 GDP 引擎。”

过去三年,人们一直在追问 AI 是否真的有用。生成式 AI 给出了肯定回答;推理模型让 AI 真正具备能力;而智能体则让 AI 真正工作起来,实现自主、持续、大规模运行。

黄仁勋表示:“实用 AI 已经到来。”2026 年前几个月里,GitHub 等平台上的开发者提交量已接近此前的三倍。

黄仁勋说,这也让身处这股浪潮中心的人们比以往任何时候都更具价值。

AI 工厂成为新型基础设施

黄仁勋表示,Token 如今已成为可创造利润的营收单元,AI 企业正争相建设更多 AI 工厂,将地区对计算能力的需求推向新高。

他说:“归根到底,我们的客户是建设 AI 工厂,而并不只是要购买计算机。”

NVIDIA DSX 是 NVIDIA 面向基础设施建设者推出的 AI 工厂框架:DSX MaxLPS 可在相同功耗预算下提供多 40% 的 GPU,DSX OS 则采用开源、可扩展的架构。

黄仁勋说:“全球正在竞相建设 AI 工厂,这是人类历史上规模最大的基础设施建设。因为计算能力就是营收。”他逐一介绍了与 CoreWeave、Nebius、Nscale、NAVER Cloud、Yotta、Firmus、Indosat、GMI 等众多合作伙伴的合作。黄仁勋说:“这些公司都在同时服务区域客户与全球客户。它们都是出色的公司,带来了难得的机遇。”

黄仁勋强调,在 AI 工厂时代,计算能力就是营收,每生成一个 Token 都能创造利润。这让每瓦性能、可靠性以及系统的长生命周期,成为关键的财务杠杆,而不仅仅是技术指标:“如果你拥有十亿瓦级的电力,那么每瓦吞吐量就是你的收入。仅因为芯片更便宜就选择错误的架构,是没有意义的,因为计算能力就是营收。买得越多,赚得越多。”

NVIDIA Vera Rubin 进入全面量产

随后,黄仁勋宣布 NVIDIA Vera Rubin 正在加速进入全面量产阶段。

他表示:“我们为 Vera Rubin 打造的供应链规模是 Grace Blackwell 的两倍。我们需要所有产能来支撑当前的需求。”

由 NVIDIA Vera Rubin NVL72 系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Spectrum-6 SPX 以太网机柜以及 NVIDIA Vera BlueField-4 STX 存储所构成的五机柜平台,正由数百家 NVIDIA 供应链生态合作伙伴共同推进量产,仅台湾地区就有 150 家,这些合作伙伴分布于全球 30 个国家与地区、超过 350 家工厂。

黄仁勋表示:“NVIDIA 的生态系统贯穿了整个产业链,从主要位于台湾地区的上游供应链向下一直延伸至数据中心,并最终触达终端用户。”

本次量产覆盖范围已涵盖 AI 云、本地数据中心以及工业与企业级部署。

在舞台上,黄仁勋逐一走过整套新一代系统——Vera Rubin NVL72 系统、液冷 Vera CPU 机柜、Vera BlueField-4 STX 存储与安全系统、Grok 3 LPX 低延迟推理托盘,以及 Spectrum-X 以太网硅光网络,强调了 NVIDIA 最新硬件的设计理念,即作为一个单一的、紧密集成的 AI 工厂平台。

Spectrum-X 以太网硅光交换机是全球首款支持 200Gb/s SerDes 的、采用光电一体化封装的以太网交换机,专为百万 GPU 级 AI 工厂打造,目前已进入量产,CoreWeave、Lambda 与 Oracle Cloud Infrastructure 等成为首批生态合作伙伴与采用者。

NVIDIA Vera CPU 是一款为 AI 时代量身打造的 CPU,提供 88 个核心、1.2TB/s 的 LPDDR5X 内存带宽,以及无芯粒边界的 3.6TB/s 片上互连结构,同时每时钟周期可执行 10 条指令,带来世界级的单线程性能。

黄仁勋在解释 Vera 为何被设计为“专为智能体打造的 CPU”时说:“过去我们打造的 CPU 是为人类服务的。未来将会有数十亿个智能体,而这些智能体在使用 CPU 时几乎没有耐心。”

NVIDIA Vera BlueField-4 STX 从芯片层面处理安全问题。NVIDIA DOCA Argus 可将威胁检测时间从分钟级压缩至毫秒级;DOCA Vault 则在机柜级别为 AI 数据提供安全防护。

智能体迎来专属运行时

黄仁勋将智能体视为下一个重大的计算机遇。

他指出,这一转变将催生一个“前所未有”的全新 CPU 市场,背后驱动力是持续运行、并不断调度工具与数据的自主智能体。

黄仁勋表示:“这种应用模式,将成为每家公司未来十年采用的计算模式。”而智能体将成为它们基础设施中的基础层。

NVIDIA 正以 NVIDIA Agent Toolkit 把握这一机遇——这是一套全栈运行时,可用于在企业内部构建、部署并保障自主智能体的运行。

该工具包集成了大语言模型、智能体 Harness 以及企业级运行时,使企业能够在 NVIDIA AI 平台之上“安全地运行智能体”,并“为自身工作量构建专属智能体”。

黄仁勋将芯片设计列为他最看好的智能体应用场景之一,并重点介绍了 NVIDIA 与 Cadence 共同开发的芯片设计“超级智能体”。

通过编排寄存器传输级 (RTL) 生成、测试平台搭建、回归测试与调试等工作流,Cadence-NVIDIA 验证智能体可自动运行数百次仿真与形式化验证。

黄仁勋表示,验证周期已“加快超过 40 倍”,“过去需要几周才能完成的工作,现在几个小时即可完成”。

黄仁勋发布了 Nemotron 3 Ultra —— NVIDIA 全新的 5,500 亿参数混合专家 (MoE) 模型。这是一款更小、更聪明的前沿智能模型,推理速度最高可提升 5 倍,运行成本较当前领先的开源模型降低约 30%。

黄仁勋表示:“我们致力于为世界打造开放模型,所有人都可以使用、并在其基础上扩展、让它变得更好,并最终成为属于自己的模型。”

调用 NVIDIA CUDA-X 库 (包括 cuDF、cuOpt、AI-Q、NeMo、PhysicsNeMo 与 CUDA-Q) 的智能体技能 (skills),现已向智能体全面开放。这些经过验证的 NVIDIA 智能体技能可在 Claude Code 插件市场以及 Hermes Skills Hub 中获取,智能体可以将高性能的 CUDA 加速能力作为工具直接调用。

NVIDIA OpenShell 是面向这些自主智能体的安全运行时。它为智能体操作提供独立沙盒、集中式策略执行机制以及治理管理网关,并可运行于 Ubuntu、Windows 与 Red Hat OpenShift 等主流企业平台之上。

这不仅是一套云端基础设施。该智能体运行时还将部署到企业服务器、工作站乃至笔记本电脑之上。

重塑计算机

个人计算经过四十年发展走到了今天。NVIDIA 与微软正在为个人智能体时代重塑 PC——从数据中心一路延伸到桌面端。

黄仁勋回顾了从最初的 Windows PC 生态系统到当今智能体时代的发展历程,并指出 AI 领域正在发生与之类似的平台级转变。

他解释说,新型 PC 在传统操作系统之上叠加了大语言模型和智能体。运行时,用户可以与一位自主助手对话,这位助手能够跨越文件、应用与网页进行查看、理解并自主执行操作。

黄仁勋发布了 NVIDIA RTX Spark,让轻薄 Windows 笔记本与紧凑型桌面主机都能具备 1 Petaflop 的 AI 性能。

由 MediaTek 联合打造,运行微软 Windows 系统,NVIDIA RTX Spark 将为首个专为个人智能体打造的 PC 提供动力——始终在线、始终本地运行。

黄仁勋将 RTX Spark 形容为“我们把 33 年来积累的一切,浓缩进一颗芯片之中”。它将搭载一颗 NVIDIA Blackwell RTX GPU,拥有 6,144 个 CUDA 核心、可提供 1 Petaflop AI 性能,与一颗“和 MediaTek 联合打造,并通过 NVLink 融合在一起”的 20-Core NVIDIA Grace CPU 相连接。

他举起这颗新芯片,称其为“世界上有史以来最出色的芯片”,并强调“NVIDIA 全部软件栈都能在这颗芯片上运行”,它为新一代专为个人智能体打造的 Windows PC 提供动力。

Adobe 正针对 RTX Spark,从底层重新架构 Photoshop 与 Premiere,使其 AI 与图形性能提升一倍。

黄仁勋解释说,Adobe 已为 RTX Spark “重新设计了 Adobe Photoshop 与 Premiere 的核心架构”,并将以“两倍速度”发布这些新版本,他还补充说,这些新版本同样将方便智能体使用。

他说:“这是四十年来第一次覆盖整条产品线的 PC 重塑。”

随后,黄仁勋公布了一整条面向智能体打造的 Windows 设备产品线——涵盖笔记本、台式机和桌面级超级计算机——并向观众逐一介绍它们之间如何协同工作。

首先登场的是由 RTX Spark 驱动的笔记本电脑,黄仁勋称它是“为创作而生、为游戏而生、为智能体而生”,并可在本地运行个人 AI。

接着,他介绍了桌面端的“个人智能体”主机。这是一台紧凑型 Windows 机器,可以放在家中持续运行。黄仁勋说:“这个智能体可以全天候运行,不必担心计费。你可以下载自己的智能体,可以把它当成一只属于自己的‘龙虾’养在这里。这是你的‘Claw’,它一直在运行,没有按量计费的焦虑,并且属于你自己。”

它被设计为始终在线的个人 AI 中枢,随着 Nemotron 3 Ultra 等模型及其后续版本的持续推出,会变得越来越智能。

最后,他发布了 适用于 Windows 的 NVIDIA DGX Station,这是一台桌面级 AI 超级计算机,具备数十 Petaflops 的 AI 性能与几百 GB 的内存,面向那些希望在办公桌旁就拥有一整座“AI 工厂级”计算能力的开发者。

黄仁勋表示,随着时间推移,“你家中实际上就拥有了一台 AI 超级计算机。渐渐地,对你而言,它会更像 R2-D2 和 C-3PO (《星球大战》中的角色),而不再像一台 PC。”

他认为,这些系统共同标志着一次重要转变,其意义不亚于当年手机向智能化演变的那次变革。

黄仁勋说:“这是这段旅程的开端。一条全新的产品线、一个全新的开始。”他指出,未来每一代 NVIDIA 架构都将包含台式机、笔记本与工作站三类产品,并强调“全球 PC 产业已全部加入我们,共同重塑 PC”。

AI 走入物理世界

AI 正在进入工厂、车辆、医院以及支撑这个世界运转的各类物理系统。黄仁勋将其描述为 物理 AI 的前沿——在这里,智能体不再只是阅读和书写文本,而是真正在现实世界中感知、推理和行动。

NVIDIA Cosmos 3 全模态模型是一款基于混合 Transformer 架构构建的世界基础模型,能够从第一人称或第三人称等任意视角理解并模拟物理世界。

黄仁勋解释说,大语言模型训练所用的文本均出自人类视角,而机器人所需的数据则必须源自其自身视角,这让物理 AI 成为计算领域“最棘手的数据问题之一”。

Cosmos 3 通过遥操作、仿真以及第三人称视频重投影等方式进行学习,在视觉推理、世界仿真与动作生成等多项基准测试中均达到前沿水平。

Cosmos 3 同时提供了一整套丰富的开源工具包,可简化从数据生成、仿真到训练与验证的全流程。借此,开发者可以构建出按黄仁勋所说的能够“理解物理世界、对其进行推理,并将其生成出来,在闭环中进行仿真,甚至本身就成为决策”的机器人与自主系统。

黄仁勋介绍了搭载 NVIDIA Halos OS 的 NVIDIA DRIVE Hyperion 如何成为面向辅助驾驶汽车的全球性平台,主流汽车制造商与出行服务商正在不同地区采用这一技术栈。他表示,搭载 DRIVE Hyperion 的车辆将接入“约占全球出行服务 97%”的出行平台,使 NVIDIA 的辅助驾驶平台成为全球无人驾驶出租车与智能车队共同的底层基础。

NVIDIA 发布了 Alpamayo 2 Super,一款开放的自动驾驶推理模型,旨在理解复杂驾驶场景并支持端到端决策。

Alpamayo 2 搭配了用于辅助驾驶策略训练的闭环强化学习框架 AlpaGym 和能够生成逼真驾驶场景的 OmniDreams。这样开发者能够在辅助驾驶系统真正上路之前,在仿真环境中完成训练与验证。

面向机器人研究领域,NVIDIA Isaac GR00T 参考人形机器人是首款基于 NVIDIA Jetson Thor 与 NVIDIA Isaac GR00T 开发平台打造的开放式人形机器人参考设计。

全栈产品已正式交付

黄仁勋最后表示:“过去六个月,计算机行业发生了彻底变革。”他介绍了一套可不断复用的智能体计算架构:以大模型作为智能体核心,搭配 Harness 调用各类 Skills,并依托运行时环境完成运转。

这类运行时可部署在云端、本地机房、PC 或机器人中,整体计算架构完全统一。各家企业可基于 NVIDIA Agent Toolkit,选用不同 Harness 与模型进行自研优化,还能打造子智能体并对外提供租用服务。这套工具也为各方对接 AI 技术提供了便捷途径。

黄仁勋称,Vera Rubin 目前已进入全面量产阶段。它不只是一款 GPU,而是一套完整的分布式智能体处理系统。Grace Blackwell 主要用于 AI 计算,尤其是推理任务,而 Vera Rubin 则专门适配智能体的运行需求。

他表示,NVIDIA 如今已转型为基础设施企业,它不再只是单纯的显卡厂商、系统厂商,而是致力于帮助客户尽快实现收益与利润最大化的基础设施服务商。

与此同时,CPU 本身也在迎来变革。“智能体时代催生了全新的计算模式,如今 CPU 的设计目标转向智能体,而非传统的人类用户。”

NVIDIA 与微软联手推出面向智能体的全新 PC 产品线,这标志着一个全新阶段的开启。这套智能体处理模式,将广泛应用于各类设备,覆盖 PC、机器人、卫星、通信基站、工厂,部署场景包含云端、本地与边缘。

黄仁勋表示:“这种基于智能体的计算模式将在世界各地的计算机中得到推广。我们对个人计算机的认知很可能会因此发生改变。”

“我要感谢与各位的合作和深厚情谊。若没有我们共同付出的努力,就不可能有今天的成就,”黄仁勋对台下观众说道。

随着主题演讲的结束,黄仁勋播放了一段动画回顾短片:一个 AI 机器人收到了一条短信“夜市派对”。随后便动身前往台北夜市。成群结队的机器人在街头穿梭。而黄仁勋刚刚描绘的关于实用 AI 和代理式 AI 的故事,也正从数据中心融入到这座缔造了它的城市之中。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分