击碎摩尔定律!英伟达和AMD将一年一款新品,均提及HBM和先进封装

描述

电子发烧友网报道(文/吴子鹏)摩尔定律是由英特尔创始人之一戈登·摩尔提出的经验规律,描述了集成电路上的晶体管数量和性能随时间的增长趋势。根据摩尔定律,集成电路上可容纳的晶体管数目约每隔18个月便会增加一倍,性能也将提升一倍。过去很长一段时间,摩尔定律被认为是全球半导体产业进步的基石。如今,这一定律已经逐渐失效,延续摩尔和超越摩尔路线纷纷出现。

6月2日晚间,英伟达创始人兼首席执行官黄仁勋在台北国际电脑展(COMPUTEX)开幕前发表主题演讲。他直言,英伟达承诺将以“一年一代”的节奏推出新的AI芯片。这一速度将明显超越摩尔定律,因为英伟达每一代AI芯片的发布,相较于上一代,都能够带来数倍的性能提升。
 
amd
 
随后在6月3日,AMD首席执行官苏姿丰在主题演讲中同样表示,AMD将于2025年推出MI350系列,再过一年会推出MI400。大约一年发布一款的速度与英伟达的计划看齐。
 

一年一平台,一年一产品

在演讲中,黄仁勋透露了英伟达后续两年的平台路线,2025年英伟达AI芯片将基于Blackwell Ultra平台,2026年是Rubin平台,2027年则是Rubin Ultra平台。
 
今年GTC大会上,英伟达发布了新一代的GPU架构平台Blackwell和B200芯片产品。从架构来看,Blackwell架构用于数据中心,针对当前火爆的AI大模型优化,训练、推理性能和能效均大幅提升。基于Blackwell架构,英伟达B200芯片由两个超大型Die封装而成,内含超过2080亿个晶体管,是前一代800亿个晶体管的两倍以上,推理速度提升30倍以上,成本和能耗降低高达25倍。
 
黄仁勋表示,“Blackwell计算能力的增长是惊人的。但更重要的是,每当我们的计算能力提高时,成本却在不断下降。基于Blackwell平台的芯片,用于训练GPT-4模型(2万亿参数和8万亿Token)的能量下降了350倍。”
 
同时,黄仁勋称,Blackwell芯片现已开始生产。不过,根据产业界的消息,量产上市的Blackwell芯片并不便宜,汇丰银行分析师透露的数据显示,GB200 NVL36/NVL72计算平台的定价分别为180万美元和300万美元,GB200的定价为6万至7万美元,B100的定价为3万至3.5万美元。
 
不过,黄仁勋依旧是相同的观点:英伟达的芯片,买得越多就会越便宜!
 
amd
 
按照英伟达的规划,2025年该公司将推出Blackwell Ultra AI芯片,将继续引领全球AI 芯片的发展。和Blackwell Ultra平台一起发布的还有下一代频谱交换机。
 
然后到2026年,英伟达将推出Rubin架构,2027年推出Rubin Ultra AI芯片。虽然Ultra可能只是扩展,不过就像这个词所代表的意思,预计英伟达将会在Ultra代上显著增加芯片的规模和能力。
 
和英伟达一样,AMD虽然加快了创新速度,但是创新质量却很有保障。AMD将于今年推出采用第四代高带宽内存(HBM)HBM3E的MI 325X芯片,内存带宽提高一倍,效能提升1.3倍。明年推出的MI 350X将会采用3nm工艺基于CDNA 4架构,预计同系列性能增幅将创造AMD历史之最。
 

HBM芯片和先进封装成为革新要点

既然英伟达和AMD的AI芯片迭代已经在速度上超越了摩尔定律,也就代表着先进制程对于英伟达AI芯片有用,但又不是那么有用。能够实现如此巨大的性能飞跃,有两点是非常重要的:HBM显存和先进封装,前者突破了传输的限制,后者让芯片规模超越了制程。无论是黄仁勋和苏姿丰的演讲,还是两家公司近来的动作都体现了这一点。
 
上文提到,AMD将会在MI 325X芯片中使用HBM3E。根据黄仁勋的描述,英伟达将会在Rubin架构产品上首次支持8层HBM4高带宽存储,随后在Rubin Ultra AI芯片上升级为12层HBM4。SK海力士总裁兼AI基础设施负责人Justin Kim表示,该公司计划和台积电合作,采用台积电的先进封装技术,以打造出业界性能最佳的HBM4。
 
此前,作为AI芯片里HBM内存的主要供应商,SK海力士基本是采用专有的技术。据悉,SK海力士已使用专有技术制造高达HBM3E的基础芯片。从技术细节来看,以硅通孔技术(TSV:Through Silicon Via)、批量回流模制底部填充(MR-MUF:Mass Reflow-Molded Underfill)先进封装工艺作为核心技术,通过MR-MUF技术,SK海力士能打造出性能稳定且层数领先的HBM内存。
 
如果SK海力士也采用台积电的先进封装,那么将有助于英伟达和AMD的AI芯片更好地融合HBM4内存。根据台湾媒体此前的报道,英伟达、AMD 两家公司包下台积电今明两年CoWoS与SoIC先进封装产能。英伟达目前的主力产品H100芯片主要采用台积电4纳米制程和CoWoS先进封装,与SK海力士的高带宽内存(HBM)以2.5D封装形式提供给客户。目前,英伟达芯片主要采用的CoWoS技术具备提供更高的存储容量和带宽的优势,是目前高端先进封装的主流方案。
 

将InfiniBand的性能带到以太网架构中

除了平台和芯片的剧透以外,此次英伟达黄仁勋演讲还有一则值得关注的消息,那就是InfiniBand和以太网的融合。从生态来说,CUDA、NVLink和InfiniBand等多项私有方案的存在,也是英伟达和AMD等其他公司最明显的不同,如今看来InfiniBand将率先拥抱开放。
 
英伟达的InfiniBand是一种高速网络和输入/输出(I/O)技术,旨在连接数据中心和高性能计算(HPC)环境中的服务器、存储系统和其他计算设备,具有低延迟、高带宽、可扩展和高可靠等优势。以太网则是一种广泛用于局域网(LAN)的技术,基于IEEE 802.3以太网网络标准,具有简单性、灵活性和可扩展性。
 
可以说InfiniBand是英伟达专门为机器间信息传输打造的私有协议,属于三类RDMA网络其中之一,另外两个是RoCE、iWARP。目前,英伟达已经在先进的芯片、超级计算架构和复杂的交换机方面形成产品体系,因此InfiniBand具有很高的价值。英伟达的InfiniBand技术来自迈络思(Mellanox ),后者于2020年4月被英伟达收购。目前,英伟达提供全面的InfiniBand系统,包括InfiniBand交换机、InfiniBand网卡、InfiniBand以太网网关、InfiniBand线缆和光模块、InfiniBand遥测和软件管理以及InfiniBand加速软件。目前,QUANTUM QM8700交换机单通道速度可达200Gb/s,整机的传输速度可达16Tb/s。
 
虽然InfiniBand技术性能强大,但是其兼容性并不好,以英伟达AI设备为主体的计算平台很难融入其他的设备,这让高性能计算的用户很困扰,他们希望英伟达能够支持更通用的协议——以太网。
 
目前,以太网技术已经支持RDMA,但是只限于RoCE和iWARP。就像黄仁勋所言,InfiniBand想要和以太网融合并不容易。在协议栈方面,InfiniBand 拥有自己定义的1-4层格式(物理层、链路层、传输层和网络层),是一个完整的网络协议,这些核心底层和以太网存在很大的差异,两者的融合确实不易。
 
不过,受迫于客户方的压力,英伟达也在努力推进支持InfiniBand的以太网技术的发展,比如 Spectrum X。英伟达Spectrum以太网是一个端到端平台,包括交换机、DPU、SmartNIC、线缆、收发器和网络软件。目前,英伟达以太网交换机系列包括涵盖1GbE至800GbE的全面交换机和软件产品组合。英伟达首席财务官Collette Kress此前表示,“Spectrum-X的销量正在不断增长,客户包括多个客户,其中包括一个拥有100,000个GPU的大型集群,Spectrum-X为英伟达网络开辟了一个全新的市场,并使以太网数据中心能够容纳大规模 AI。我们预计Spectrum-X将在一年内跃升至数十亿美元的产品线。”
 
对于InfiniBand和以太网的融合,黄仁勋介绍称,英伟达的策略是将InfiniBand的性能带到以太网架构中,“我们关注的焦点并非平均吞吐量,而是确保最后一个数据包能够准时、无误地抵达。然而,传统的以太网并未针对这种高度同步化、低延迟的需求进行优化。为了满足这一需求,我们创造性地设计了一个端到端的架构,使NIC(网络接口卡)和交换机能够通信。”
 

结语

过去很多年,摩尔定律都是芯片性能提升的主要手段,最新的工艺也会和顶级的芯片产品挂钩。然而,随着摩尔定律逐渐放缓和失效,目前英伟达和AMD等头部厂商已经摸索出一条自己的更新路径,这条路径里工艺制程只是助力之一,更多源于HBM技术和异构集成的系统级创新。
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分