击碎摩尔定律！英伟达和AMD将一年一款新品，均提及HBM和先进封装

Felix分析 2024-06-04 5533

描述

电子发烧友网报道（文/吴子鹏）摩尔定律是由英特尔创始人之一戈登·摩尔提出的经验规律，描述了集成电路上的晶体管数量和性能随时间的增长趋势。根据摩尔定律，集成电路上可容纳的晶体管数目约每隔18个月便会增加一倍，性能也将提升一倍。过去很长一段时间，摩尔定律被认为是全球半导体产业进步的基石。如今，这一定律已经逐渐失效，延续摩尔和超越摩尔路线纷纷出现。

6月2日晚间，英伟达创始人兼首席执行官黄仁勋在台北国际电脑展（COMPUTEX）开幕前发表主题演讲。他直言，英伟达承诺将以“一年一代”的节奏推出新的AI芯片。这一速度将明显超越摩尔定律，因为英伟达每一代AI芯片的发布，相较于上一代，都能够带来数倍的性能提升。

先进封装

随后在6月3日，AMD首席执行官苏姿丰在主题演讲中同样表示，AMD将于2025年推出MI350系列，再过一年会推出MI400。大约一年发布一款的速度与英伟达的计划看齐。

一年一平台，一年一产品

在演讲中，黄仁勋透露了英伟达后续两年的平台路线，2025年英伟达AI芯片将基于Blackwell Ultra平台，2026年是Rubin平台，2027年则是Rubin Ultra平台。

今年GTC大会上，英伟达发布了新一代的GPU架构平台Blackwell和B200芯片产品。从架构来看，Blackwell架构用于数据中心，针对当前火爆的AI大模型优化，训练、推理性能和能效均大幅提升。基于Blackwell架构，英伟达B200芯片由两个超大型Die封装而成，内含超过2080亿个晶体管，是前一代800亿个晶体管的两倍以上，推理速度提升30倍以上，成本和能耗降低高达25倍。

黄仁勋表示，“Blackwell计算能力的增长是惊人的。但更重要的是，每当我们的计算能力提高时，成本却在不断下降。基于Blackwell平台的芯片，用于训练GPT-4模型（2万亿参数和8万亿Token）的能量下降了350倍。”

同时，黄仁勋称，Blackwell芯片现已开始生产。不过，根据产业界的消息，量产上市的Blackwell芯片并不便宜，汇丰银行分析师透露的数据显示，GB200 NVL36/NVL72计算平台的定价分别为180万美元和300万美元，GB200的定价为6万至7万美元，B100的定价为3万至3.5万美元。

不过，黄仁勋依旧是相同的观点：英伟达的芯片，买得越多就会越便宜！

先进封装

按照英伟达的规划，2025年该公司将推出Blackwell Ultra AI芯片，将继续引领全球AI 芯片的发展。和Blackwell Ultra平台一起发布的还有下一代频谱交换机。

然后到2026年，英伟达将推出Rubin架构，2027年推出Rubin Ultra AI芯片。虽然Ultra可能只是扩展，不过就像这个词所代表的意思，预计英伟达将会在Ultra代上显著增加芯片的规模和能力。

和英伟达一样，AMD虽然加快了创新速度，但是创新质量却很有保障。AMD将于今年推出采用第四代高带宽内存（HBM）HBM3E的MI 325X芯片，内存带宽提高一倍，效能提升1.3倍。明年推出的MI 350X将会采用3nm工艺基于CDNA 4架构，预计同系列性能增幅将创造AMD历史之最。

HBM芯片和先进封装成为革新要点

既然英伟达和AMD的AI芯片迭代已经在速度上超越了摩尔定律，也就代表着先进制程对于英伟达AI芯片有用，但又不是那么有用。能够实现如此巨大的性能飞跃，有两点是非常重要的：HBM显存和先进封装，前者突破了传输的限制，后者让芯片规模超越了制程。无论是黄仁勋和苏姿丰的演讲，还是两家公司近来的动作都体现了这一点。

上文提到，AMD将会在MI 325X芯片中使用HBM3E。根据黄仁勋的描述，英伟达将会在Rubin架构产品上首次支持8层HBM4高带宽存储，随后在Rubin Ultra AI芯片上升级为12层HBM4。SK海力士总裁兼AI基础设施负责人Justin Kim表示，该公司计划和台积电合作，采用台积电的先进封装技术，以打造出业界性能最佳的HBM4。

此前，作为AI芯片里HBM内存的主要供应商，SK海力士基本是采用专有的技术。据悉，SK海力士已使用专有技术制造高达HBM3E的基础芯片。从技术细节来看，以硅通孔技术（TSV：Through Silicon Via）、批量回流模制底部填充（MR-MUF：Mass Reflow-Molded Underfill）先进封装工艺作为核心技术，通过MR-MUF技术，SK海力士能打造出性能稳定且层数领先的HBM内存。

如果SK海力士也采用台积电的先进封装，那么将有助于英伟达和AMD的AI芯片更好地融合HBM4内存。根据台湾媒体此前的报道，英伟达、AMD 两家公司包下台积电今明两年CoWoS与SoIC先进封装产能。英伟达目前的主力产品H100芯片主要采用台积电4纳米制程和CoWoS先进封装，与SK海力士的高带宽内存（HBM）以2.5D封装形式提供给客户。目前，英伟达芯片主要采用的CoWoS技术具备提供更高的存储容量和带宽的优势，是目前高端先进封装的主流方案。

将InfiniBand的性能带到以太网架构中

除了平台和芯片的剧透以外，此次英伟达黄仁勋演讲还有一则值得关注的消息，那就是InfiniBand和以太网的融合。从生态来说，CUDA、NVLink和InfiniBand等多项私有方案的存在，也是英伟达和AMD等其他公司最明显的不同，如今看来InfiniBand将率先拥抱开放。

英伟达的InfiniBand是一种高速网络和输入/输出（I/O）技术，旨在连接数据中心和高性能计算（HPC）环境中的服务器、存储系统和其他计算设备，具有低延迟、高带宽、可扩展和高可靠等优势。以太网则是一种广泛用于局域网（LAN）的技术，基于IEEE 802.3以太网网络标准，具有简单性、灵活性和可扩展性。

可以说InfiniBand是英伟达专门为机器间信息传输打造的私有协议，属于三类RDMA网络其中之一，另外两个是RoCE、iWARP。目前，英伟达已经在先进的芯片、超级计算架构和复杂的交换机方面形成产品体系，因此InfiniBand具有很高的价值。英伟达的InfiniBand技术来自迈络思（Mellanox ），后者于2020年4月被英伟达收购。目前，英伟达提供全面的InfiniBand系统，包括InfiniBand交换机、InfiniBand网卡、InfiniBand以太网网关、InfiniBand线缆和光模块、InfiniBand遥测和软件管理以及InfiniBand加速软件。目前，QUANTUM QM8700交换机单通道速度可达200Gb/s，整机的传输速度可达16Tb/s。

虽然InfiniBand技术性能强大，但是其兼容性并不好，以英伟达AI设备为主体的计算平台很难融入其他的设备，这让高性能计算的用户很困扰，他们希望英伟达能够支持更通用的协议——以太网。

目前，以太网技术已经支持RDMA，但是只限于RoCE和iWARP。就像黄仁勋所言，InfiniBand想要和以太网融合并不容易。在协议栈方面，InfiniBand 拥有自己定义的1-4层格式（物理层、链路层、传输层和网络层），是一个完整的网络协议，这些核心底层和以太网存在很大的差异，两者的融合确实不易。

不过，受迫于客户方的压力，英伟达也在努力推进支持InfiniBand的以太网技术的发展，比如 Spectrum X。英伟达Spectrum以太网是一个端到端平台，包括交换机、DPU、SmartNIC、线缆、收发器和网络软件。目前，英伟达以太网交换机系列包括涵盖1GbE至800GbE的全面交换机和软件产品组合。英伟达首席财务官Collette Kress此前表示，“Spectrum-X的销量正在不断增长，客户包括多个客户，其中包括一个拥有100,000个GPU的大型集群，Spectrum-X为英伟达网络开辟了一个全新的市场，并使以太网数据中心能够容纳大规模 AI。我们预计Spectrum-X将在一年内跃升至数十亿美元的产品线。”

对于InfiniBand和以太网的融合，黄仁勋介绍称，英伟达的策略是将InfiniBand的性能带到以太网架构中，“我们关注的焦点并非平均吞吐量，而是确保最后一个数据包能够准时、无误地抵达。然而，传统的以太网并未针对这种高度同步化、低延迟的需求进行优化。为了满足这一需求，我们创造性地设计了一个端到端的架构，使NIC（网络接口卡）和交换机能够通信。”

结语

过去很多年，摩尔定律都是芯片性能提升的主要手段，最新的工艺也会和顶级的芯片产品挂钩。然而，随着摩尔定律逐渐放缓和失效，目前英伟达和AMD等头部厂商已经摸索出一条自己的更新路径，这条路径里工艺制程只是助力之一，更多源于HBM技术和异构集成的系统级创新。

打开APP阅读更多精彩内容