AMD对抗英伟达的王牌,MI Instinct

描述

电子发烧友网报道(文/周凯扬)AMD在不久前发布了Instinct MI300,一个结合了CDNA3和Zen4架构的产品系列,比如率先公布的产品为128GB的MI300A。然而在这之后,AMD针对大语言模型市场,专门推出了纯CDNA 3 GPU架构打造的MI300X,集成192GB的HBM3。
 
下一代数据中心与超算的选择Instinct MI300
 
随着英伟达的A100、H100等GPU产品在今年经历大热、缺货和涨价,越来越多的厂商开始做两手准备,开始寻找替代品。在AI与HPC领域,市面上缺乏能与英伟达旗舰产品竞争的高性能成熟方案。
 
虽然相较其他厂商而言,谷歌已经凭借其TPU和OCS在同类负载中实现了不错的性能/TCO表现,但总的来说依然限制在了单个公司的单个云服务上,也很难给到厂商去提前评估的空间,所以并不算一个完善的第三方解决方案。
 
为此,AMD推出了MI300X,一个纯粹的生成式AI加速器方案,内存带宽达到了可怕的5.2TB/s。与英伟达的H100 SXM 80GB相比,MI300X带宽提升了72%,容量根据版本差异有了60%或140%的提升。
 
基于MI300X,AMD打造了一个名为无限架构的平台,将8块Instinct MI300X互联在一起,实现1.5TB的HBM3内存。这与英伟达的8路HGX板和英特尔的8路Ponte Vecchio一样,看来未来高端服务器都会采用这套8路处理器的配置。
 
目前MI300A早已送样,而MI300X也已经在Q3送样,相信明年起,我们就能在HPC和AI服务器上看到两块芯片的身影了。但这也注定了MI300系列更像是一次略显仓促的反击,AMD真正的王牌,可能还是未来的Instinct MI400。
 
3D/2.5D混合计算大成的Instinct MI400
 
在今年AMD的Q2财报会议上,AMD CEO苏姿丰提到:“从这些工作负载和我们投资的技术来看,不只是现有产品,还有下一代MI400系列等,我们打造了一个极具竞争力且性能满足需求的硬件路线图。坦白说,大家讨论到AMD往往都会提到软件路线图,我们也都看到了软件侧的一些改变。”
 
近期举办的DARPA ERI峰会上,AMD CTO Mark Papermaster也对MI400进行了一个小小的预告,它表示Instinct MI400将成为3D/2.5D混合计算集大成之作。从收购Xilinx以来,AMD已经对其整体产品的封装和互联方案进行了大刀阔斧的改革,充分结合两家厂商在这方面的深入研究。

英伟达
AMD Chiplet与封装进化路线图 / AMD

 
AMD将其称为一个全面化的设计,从芯片堆叠、封装、计算、内存、加速器、互联、软件栈和应用等方面进行系统级的优化,采用特定域的异构架构,深度集成处理器、封装与互联技术,且在所有层面都充分利用AI。
 
但上文也都反复提及了软件,这是AMD不得不去解决的一个问题。虽然AMD提供了一个简易的CUDA移植路径,但正如联想HPC与AI部门总经理Scott Tease所说的那样,还达不到一站式解决方案的程度。
 
写在最后
 
AMD作为与英伟达在消费图形领域竞争多年的对手,如今同样发力服务器与AI领域,势必也会带来新的市场格局。只要MI400在性能表现上达到预期,且发布时和发布后AMD能做好软件生态的构建,都可能会对英伟达的主导地位造成一定威胁。不过考虑到发布时间,届时AMD的MI400面对的可能是首次用上MCM封装的Blackwell GB100 GPU。
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分