AMD硬刚英伟达，推出Instinct MI300，单芯片可运行800亿参数

核芯产业观察 2023-06-14 3560

电子说

1.4w人已加入

描述

美国时间本周二，AMD举行了重磅发布会，推出了一款全新的人工智能GPU Instinct MI300，并表示这款处理器将于今年晚些时候开始向部分客户发货。自英伟达发布了AI芯片后，便彻底带动了市场的投资热情，也推动英伟达登上万亿美元市值的高峰。此次AMD发布重磅AI芯片，有望对英伟达当前的市场地位形成一定冲击。

AMD推出高性能AI芯片

在这次AMD的新品发布会中，核心产品无疑是用于训练大模型的GPU Instinct MI300。早在今年初，AMD便已经宣布了新一代Instinct MI300，是全球首款同时集成CPU、GPU的数据中心APU。

人工智能

如今，这款芯片的名字变成了Instinct MI300A，而纯GPU产品则命名为Instinct MI300X。据AMD的CEO苏姿丰透露，MI300A是全球首个为AI和HPC（高性能计算）打造的APU加速卡，拥有13个小芯片，总共包含1460亿个晶体管，24个Zen 4 CPU核心，1个CDNA 3图形引擎和128GB HBM3内存。

相比前代MI250，MI300的性能提高八倍，效率提高五倍。AMD在发布会稍早介绍，新的Zen 4c内核比标准的Zen 4内核密度更高，比标准Zen 4的内核小35%，同时保持100%的软件兼容性。

人工智能

而GPU MI300X更是本次发布会的重点，这款芯片是AMD针对大语言模型优化的版本，该产品的晶体管数量达到1530亿个，内存达到了192GB，内存带宽为5.2TB/s，Infinity Fabric带宽为896GB/s。对比英伟达的H100，MI300X提供的HBM（高带宽内存）密度约为H100的2.4倍，HBM带宽是1.6倍。

这意味着AMD的这款产品可以运行比英伟达H100更大的模型，在现场AMD演示了MI300X运行400亿参数的Falcon模型，而OpenAI的GPT-3模型有1750亿个参数。苏姿丰还用Hugging Face基于MI300X的大模型写了一首关于活动举办地旧金山的诗。

这也是全球首次在单个GPU上运行这么大的模型，据AMD介绍，单个MI300X可以运行一个参数多达800亿的模型。而在未来随着AI模型越来越大，意味着需要更多GPU来运行最新的大模型，而AMD芯片上内存的增加，意味着开发人员不需要那么多GPU，可以为用户节省大量成本。

人工智能

苏姿丰表示，MI300X将于今年第三季度向一些客户提供样品，并于第四季度量产。同时AMD还发布了AMD Instinct Platform，集合了8个MI300X，可提供总计1.5TB的HBM3内存。对标英伟达的CUDA，AMD也介绍了自身的芯片软件ROCm，AMD总裁Victor Peng称，在构建强大的软件堆栈方面，AMD取得了真正的巨大进步，ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。

之所以将重心放在AI芯片，也是因为AMD非常看好未来的AI市场。苏姿丰认为，数据中心人工智能加速器的潜在市场总额将从今年的300亿美元增长到2027年的1500亿美元以上。

硬刚英伟达，但尚未透露大客户

从AMD所介绍的产品性能来看，将成为当下AI市场的有力竞争者，尤其在ChatGPT等生成式AI的带动下，市场对高性能GPU需求旺盛。不过当前市场中，英伟达处于绝对优势，占据80%的市场。

而AMD并没有公布这款GPU的具体价格，但是对比英伟达H100价格大多在3万美元以上，如果MI300X价格能够更加实惠，将显著的对英伟达产品造成冲击，并有助于降低生成式AI的研发成本。

有意思的是，在如此强劲的性能面前，市场却似乎并不买单。截至当日收盘，AMD股价反而下降了3.61%，市值来到2000亿元关口。而英伟达股价则拉升了3.9%，总市值达到1.01万亿美元，是AMD的五倍。

此次AMD并未透露哪些公司会采用MI300X或简配版MI300A，而在此前的发布会中，AMD都会披露新产品的大客户。这可能让市场认为，目前并没有大客户为这款芯片买单。

另一方面，AMD并没有透露新款AI芯片的具体售价，但想要有显著的成本优势可能不太现实，因为高密度的HBM价格昂贵。即便MI300X的内存达到了192GB，但这也不是显著优势，因为英伟达也拥有相同内存规格的产品。

更重要的原因在于，MI300并不具备H100所拥有的Transformer Engine。Transformer Engine能够用于加速Transformer模型，以在AI的训练和推理中以较低的内存利用率提供更好的性能。

有分析师认为，如果训练一个新的模型，需要投入数千个GPU，并耗费一年的时间，那么几乎不会有人会浪费2-3年或者投入3倍数量的GPU。而Transformer Engine能够让大模型实现三倍的性能表达。

尽管市场中认为，AMD的MI300芯片应该是除了谷歌的TPU之外，能与英伟达在AI训练端上匹敌的产品。成为当前大企业在训练AI大模型时，除了英伟达之外的另一个重要选择。

但想要在短时间内挑战英伟达，显然还是比较困难的。就如AMD总裁VictorPeng说的那样，“尽管这是一个过程，但我们在构建强大的软件堆栈方面取得了很大进展，该软件堆栈与开放的模型、库、框架和工具生态系统兼容。”

无论如何需要市场中有大客户切实的使用AMD新款芯片。

小结

AMD此次重磅发布的MI300系列芯片，无疑为AI市场注入了一剂强心针，不仅预示着AMD在持续看好未来的AI市场，也将表明AMD将在这一市场中与英伟达正面竞争。至少对于相关企业及用户而言，有更多的选择是一件好事。

打开APP阅读更多精彩内容