AMD硬刚英伟达,推出Instinct MI300,单芯片可运行800亿参数

电子说

1.3w人已加入

描述

美国时间本周二,AMD举行了重磅发布会,推出了一款全新的人工智能GPU Instinct MI300,并表示这款处理器将于今年晚些时候开始向部分客户发货。自英伟达发布了AI芯片后,便彻底带动了市场的投资热情,也推动英伟达登上万亿美元市值的高峰。此次AMD发布重磅AI芯片,有望对英伟达当前的市场地位形成一定冲击。

AMD推出高性能AI芯片

在这次AMD的新品发布会中,核心产品无疑是用于训练大模型的GPU Instinct MI300。早在今年初,AMD便已经宣布了新一代Instinct MI300,是全球首款同时集成CPU、GPU的数据中心APU。

人工智能

如今,这款芯片的名字变成了Instinct MI300A,而纯GPU产品则命名为Instinct MI300X。据AMD的CEO苏姿丰透露,MI300A是全球首个为AI和HPC(高性能计算)打造的APU加速卡,拥有13个小芯片,总共包含1460亿个晶体管,24个Zen 4 CPU核心,1个CDNA 3图形引擎和128GB HBM3内存。

相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在发布会稍早介绍,新的Zen 4c内核比标准的Zen 4内核密度更高,比标准Zen 4的内核小35%,同时保持100%的软件兼容性。

人工智能

而GPU MI300X更是本次发布会的重点,这款芯片是AMD针对大语言模型优化的版本,该产品的晶体管数量达到1530亿个,内存达到了192GB,内存带宽为5.2TB/s,Infinity Fabric带宽为896GB/s。对比英伟达的H100,MI300X提供的HBM(高带宽内存)密度约为H100的2.4倍,HBM带宽是1.6倍。

这意味着AMD的这款产品可以运行比英伟达H100更大的模型,在现场AMD演示了MI300X运行400亿参数的Falcon模型,而OpenAI的GPT-3模型有1750亿个参数。苏姿丰还用Hugging Face基于MI300X的大模型写了一首关于活动举办地旧金山的诗。

这也是全球首次在单个GPU上运行这么大的模型,据AMD介绍,单个MI300X可以运行一个参数多达800亿的模型。而在未来随着AI模型越来越大,意味着需要更多GPU来运行最新的大模型,而AMD芯片上内存的增加,意味着开发人员不需要那么多GPU,可以为用户节省大量成本。

人工智能

苏姿丰表示,MI300X将于今年第三季度向一些客户提供样品,并于第四季度量产。同时AMD还发布了AMD Instinct Platform,集合了8个MI300X,可提供总计1.5TB的HBM3内存。对标英伟达的CUDA,AMD也介绍了自身的芯片软件ROCm,AMD总裁Victor Peng称,在构建强大的软件堆栈方面,AMD取得了真正的巨大进步,ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。

之所以将重心放在AI芯片,也是因为AMD非常看好未来的AI市场。苏姿丰认为,数据中心人工智能加速器的潜在市场总额将从今年的300亿美元增长到2027年的1500亿美元以上。

硬刚英伟达,但尚未透露大客户

从AMD所介绍的产品性能来看,将成为当下AI市场的有力竞争者,尤其在ChatGPT等生成式AI的带动下,市场对高性能GPU需求旺盛。不过当前市场中,英伟达处于绝对优势,占据80%的市场。

而AMD并没有公布这款GPU的具体价格,但是对比英伟达H100价格大多在3万美元以上,如果MI300X价格能够更加实惠,将显著的对英伟达产品造成冲击,并有助于降低生成式AI的研发成本。

有意思的是,在如此强劲的性能面前,市场却似乎并不买单。截至当日收盘,AMD股价反而下降了3.61%,市值来到2000亿元关口。而英伟达股价则拉升了3.9%,总市值达到1.01万亿美元,是AMD的五倍。

此次AMD并未透露哪些公司会采用MI300X或简配版MI300A,而在此前的发布会中,AMD都会披露新产品的大客户。这可能让市场认为,目前并没有大客户为这款芯片买单。

另一方面,AMD并没有透露新款AI芯片的具体售价,但想要有显著的成本优势可能不太现实,因为高密度的HBM价格昂贵。即便MI300X的内存达到了192GB,但这也不是显著优势,因为英伟达也拥有相同内存规格的产品。

更重要的原因在于,MI300并不具备H100所拥有的Transformer Engine。Transformer Engine能够用于加速Transformer模型,以在AI的训练和推理中以较低的内存利用率提供更好的性能。

有分析师认为,如果训练一个新的模型,需要投入数千个GPU,并耗费一年的时间,那么几乎不会有人会浪费2-3年或者投入3倍数量的GPU。而Transformer Engine能够让大模型实现三倍的性能表达。

尽管市场中认为,AMD的MI300芯片应该是除了谷歌的TPU之外,能与英伟达在AI训练端上匹敌的产品。成为当前大企业在训练AI大模型时,除了英伟达之外的另一个重要选择。

但想要在短时间内挑战英伟达,显然还是比较困难的。就如AMD总裁VictorPeng说的那样,“尽管这是一个过程,但我们在构建强大的软件堆栈方面取得了很大进展,该软件堆栈与开放的模型、库、框架和工具生态系统兼容。”

无论如何需要市场中有大客户切实的使用AMD新款芯片。

小结

AMD此次重磅发布的MI300系列芯片,无疑为AI市场注入了一剂强心针,不仅预示着AMD在持续看好未来的AI市场,也将表明AMD将在这一市场中与英伟达正面竞争。至少对于相关企业及用户而言,有更多的选择是一件好事。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分