2026年6月,英伟达正式宣布NVIDIA Spectrum-X以太网硅光技术已全面量产。新一代Spectrum-X交换机基于光电一体封装技术(CPO)构建,专为NVIDIA Vera Rubin平台在数据中心的横向扩展与跨区域扩展部署AI工厂而设计。官方数据显示,相比使用传统可插拔收发器的网络方案,Spectrum-X硅光技术可实现能效提升5倍、AI正常运行时间提升5倍、部署速度快1.3倍。这是英伟达全栈协同设计战略落地的又一标志性成果,也意味着AI数据中心网络正从"可插拔时代"迈入"光电一体时代"。
AI工厂的核心特征是大规模GPU集群通过高速以太网进行东西向通信。当集群规模从千卡扩展到万卡甚至十万卡时,网络不再是"够用就好"的配角,而是直接决定GPU利用率的关键变量。
传统可插拔光收发器(如QSFP-DD、OSFP)存在三个结构性问题:第一,电-光-电多次转换带来显著功耗与延迟;第二,铜缆与光纤连接器数量庞大,故障点多,直接拉低系统可用率;第三,随着单端口速率从800G向1.6T演进,可插拔方案的功耗和散热已逼近物理极限。
英伟达的判断很明确:要支撑Vera Rubin平台的AI工厂级部署,网络必须从架构层面重构,而非在旧方案上修修补补。
Spectrum-X硅光技术的核心是光电一体封装(Co-Packaged Optics, CPO)。传统方案中,光模块是独立于交换机ASIC的可插拔部件,通过PCB走线连接;而CPO将光引擎与交换芯片封装在同一个基板上,光信号从芯片出来后直接进入光波导,省去了传统PCB上的电信号传输路径和大量连接器。
这一架构变更带来的收益是系统级的:
能效提升5倍 。减少电-光转换次数和铜缆传输损耗后,每比特传输能耗大幅下降。对于一个万卡AI集群而言,网络功耗占比可从传统方案的15%–20%压缩至个位数,释放出的电力可直接转化为更多GPU算力。
AI正常运行时间提升5倍 。连接器和可插拔模块是网络故障的主要来源。CPO方案将数十个可插拔接口缩减为板级集成,故障点数量断崖式下降,系统可用性从"四个九"迈向"五个九"级别。对于按小时计费的AI训练任务而言,这意味着数十亿美元级别的潜在损失被避免。
部署速度快1.3倍 。更少的线缆、更少的模块、更简化的拓扑,使数据中心网络的上线周期显著缩短。在AI算力需求快速扩张的当下,部署速度本身就是竞争力。
Spectrum-X硅光技术并非孤立的硬件升级,而是英伟达全栈协同设计(Full-Stack Co-Design)的典型代表。从NVLink、InfiniBand到Spectrum-X以太网,英伟达的策略是让网络、计算、存储和软件栈从第一天起就协同优化,而非各自为战后再做适配。
此次量产的Spectrum-X交换机专为Vera Rubin平台设计,支持大规模横向扩展(Scale-Out)和跨区域部署(Scale-Up),目标场景是数十万GPU组成的AI工厂。配合英伟达DGS(Dynamic Global Scheduler)和AI Enterprise软件栈,网络、算力与调度可以作为一个整体进行优化,而非各自独立运行。
值得注意的是,"全面量产"四个字的分量。硅光技术在学术界已论证多年,但从样品到大规模量产始终面临良率、封装一致性和供应链三大挑战。英伟达此次宣布量产,意味着其硅光供应链已跑通,具备了持续供货能力。
这也让Spectrum-X成为当前市场上少数真正可大规模部署的CPO以太网方案之一,与Broadcom、Intel等竞争对手形成代际差距。
当AI集群从万卡走向十万卡,网络能效不再是"锦上添花",而是"生死线"。英伟达以CPO硅光技术重构以太网底座,用5倍能效和5倍可用性回答了一个问题:AI工厂的网络,必须和GPU一样被重新设计。Spectrum-X的全面量产,标志着AI数据中心基础设施正式进入光电一体的新纪元。
全部0条评论
快来发表一下你的评论吧 !