由CPU和GPU小芯片组成的数据中心APU

描述

服务器

除了Zen CPU架构和RDNA客户端GPU架构的更新,AMD最近还更新了他们的CDNA服务器GPU架构和相关的Instinct产品路线图。在接下来的两年里,CPU和客户端GPU的发展可以说是一帆风顺,而AMD则打算大幅调整其服务器端GPU产品。

让我们先从AMD的服务器GPU架构路线图开始。继AMD公司目前的CDNA 2架构之后,MI200系列Instinct加速器将采用CDNA 3架构。与AMD的其他路线图不同的是,该公司此次并没有提供两年的路线图。同时,服务器GPU路线图只推出到2023年,AMD的下一个服务器GPU架构将于明年推出。

服务器

我们对CDNA 3的第一次了解发现了很多细节。AMD透漏了从架构到有关产品的一些基本信息——由CPU和GPU小芯片组成的数据中心APU。

综上所述,基于CDNA 3架构的GPU将建立在5纳米工艺上。就像之前的基于CDNA 2的MI200加速器一样,它将依赖小芯片将内存、缓存和处理器内核全部组合在一个封装中。值得注意的是,AMD称之为“3D芯片”设计,这意味着不仅小芯片堆叠在基板上,而且其他芯片也将堆叠在小芯片之上,就像AMD为Zen 3 CPU设计的V-Cache一样。

这种比较在这里特别适用,因为AMD将把它的无限缓存技术引入到CDNA 3架构中。而且,就像上面的V-Cache的例子一样,从AMD的设计来看,他们会将缓存和逻辑堆叠成独立的芯片,而不是像他们的客户端GPU那样将其集成到一个整体芯片中。由于这种堆叠的特性,CDNA 3的无限缓存芯片将位于处理器芯片之下,AMD似乎将非常耗电的逻辑芯片放在堆栈的顶部,以便有效冷却。

CDNA 3也将采用AMD的第四代无限架构。对于GPU来说,IA4与AMD的芯片创新是携手并进的。具体来说,它将使2.5D/3D堆叠芯片与IA一起使用,使一个包内的所有芯片共享一个统一的、完全一致的存储子系统。这相对IA3和目前的MI200加速器是一个巨大的飞跃,虽然提供了内存一致性,但没有统一的内存地址空间。因此,尽管MI200加速器本质上在一个封装中充当两个GPU,但IA4将让CDNA 3/MI300加速器作为单个芯片运行。

AMD的图表还显示,HBM内存再次在这里使用。AMD没有具体说明HBM的版本,但考虑到2023年的时间框架,很有可能会是HBM3。

在架构上,AMD也将采取一些措施来改善其高性能加速器的AI性能。据该公司称,他们正在增加对新的混合精确数学格式的支持。虽然还没有明确说明,但AMD在AI工作负载中的每瓦性能提升超过5倍,这强烈暗示AMD正在为CNDA 3显着改造和扩展其矩阵内核,因为5倍的性能远远超过了单是芯片改进所能提供的性能。

MI300: AMD的第一款分块数据中心APU

但是AMD不会止步于仅仅建造一个更大的GPU,他们也不会仅仅为了让GPU在共享内存池中工作而统一多芯片架构的内存池。相反,AMD的野心远不止于此。有了高性能的CPU和GPU核心,AMD在集成方面迈出了下一步,正在构建一个分体式的数据中心APU——一种将CPU和GPU核心结合到单个封装中的芯片。

服务器

数据中心APU目前的代号是MI300,AMD已经为之努力了一段时间。MI200和Infinity Architecture 3允许AMD CPU和GPU在一个连贯的内存架构下一起工作,下一步是在封装和内存架构方面将CPU和GPU进一步结合在一起。

对于内存问题来说,统一的架构给MI300带来了几个主要的好处。从性能的角度来看,这通过消除冗余的内存拷贝来改善问题;处理器不再需要将数据复制到自己专用的内存池来访问/修改数据。统一的内存池还意味着不需要第二个内存芯片池——在这种情况下,通常是连接到CPU的DRAM。

服务器

MI300将把CDNA 3GPU小芯片和Zen 4 CPU小芯片组合到一个处理器封装中。反过来,这两个处理器池将共享封装HBM内存。而且,大概还有无限缓存。

如前所述,AMD将大量利用小芯片来实现这一目标。CPU内核、GPU内核、Infinity Cache和HBM都是不同的小芯片,其中一些将相互堆叠。因此,这将是不同于AMD之前制造的任何其他芯片的芯片,这将是AMD将芯片集成到他们的产品设计中所付出的最大努力。

与此同时,AMD非常明确地表示,他们正在内存带宽和应用延迟方面争夺市场领导地位。如果AMD能做到这一点,对公司来说将是一个重大的成就。话虽如此,他们并不是第一家将HBM与CPU内核配对的公司,英特尔的Sapphire Rapids Xeon同样使用了这种方法,所以我们将拭目以待MI300如何在这方面获得优势。

至于更具体的AI性能问题,AMD声称APU将提供优于MI250X加速器8倍的训练性能。这进一步证明,与MI200系列相比,AMD将对其GPU矩阵内核进行一些重大改进。

总体而言,AMD的服务器GPU发展轨迹与英特尔和英伟达在过去几个月里公布的非常相似。这三家公司都在致力于CPU+GPU产品的结合;NVIDIA推出了Grace Hopper (Grace + H100),Intel推出了Falcon Shores xpu (CPU + GPU混合搭配),现在MI300在单个封装上同时使用了CPU和GPU芯片。在这三种情况下,这些技术的目标都是将最好的CPU和最好的GPU结合起来,以应对不受两者约束的工作负载。就AMD而言,该公司相信他们拥有最好的CPU和最好的GPU。

在接下来的几个月里,我们有望看到更多关于CDNA 3和MI300的信息。

审核编辑 :李倩

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分