AMD 3D堆叠缓存提升不俗,其他厂商为何不效仿?

描述

3D堆叠、多芯片封装大家想必都不陌生了,这年头制造工艺已经没有太多噱头,有时甚至性能提升也有限,厂商只好从架构上入手。像苹果的Ultra Fusion拼接、Graphcore的3D WoW,都是在芯片设计厂商与晶圆厂强强联合下的产物,我们今天要讲的3D堆叠缓存也不例外。
 
96MB的超大3D V-Cache
 
把3D堆叠缓存先玩出来的不是别人,正是AMD。今年CES 2022上公布的这款Ryzen 7 5800X3D可以视为5800X的升级版,为原本的32MB 2D L3缓存加上了64MB的3D V-Cache缓存,使得总L3缓存达到了96MB。这种芯片堆叠方式与常见的C4和Micro Bump不同,AMD用到了Hybrid Bond 3D技术,实现了更高的密度、更好的热管理和更好的连接性。
 

芯片
 

3D V-Cache示意图 / AMD

 
不过,AMD对Ryzen 7 5800X3D的定义是一款“游戏CPU”,这意味着在一些高性能计算场景下不一定会获得更好的性能,评测软件跑分可能也不比英特尔12代酷睿i9、AMD Ryzen 9 5900系列这些旗舰处理器,但游戏表现相当不俗。公布之际,AMD官方给出的FPS性能对比图中,5800X3D与英特尔的i9-12900K在半数项目上持平,而半数项目上高出10%的性能,甚至超过了自家的Ryzen 9 5900X。
 

芯片

Ryzen 9 5900X与Ryzen 7 5800X3D的性能对比 / AMD

 
近期,终于有抢跑的媒体展示了这块处理器的游戏测试结果,测试对象为游戏《古墓丽影:暗影》。在720p分辨率的最高画质选项下,5800X3D跑出了231FPS的成绩,比英特尔的i9-12900K高出了21.58%。你可能会问为何要用如此低的分辨率来进行测试,这自然是为了消除GPU造成的影响,让对比注重于纯粹的CPU性能差异。
 
值得一提的是,测试结果中,5800X3D系统用到的是一块3080Ti显卡,而英特尔系统用到的是一块性能更强的3090Ti显卡,前者却依然跑出了领先的层级,如此足见5800X3D在3D V-Cache加持下的实力了。
 
超算也能因此获利?
 
除了这类高性能消费级处理器外,HPC也开始看上了3D堆叠缓存的潜力,比如AMD的Milan-X服务器CPU。与游戏场景一样,更大的缓存可以为诸多核心HPC应用破除瓶颈。日本理化研究所(RIKEN)等一众机构和学府的研究人员拿AMD了两块AMD的服务器CPU进行比较,一边是256MB LLC的Milan,一边是768MB LLC的Milan-X。从下图可以看出,虽然随着输入变大优势逐渐变小,但输入规模较小时,大缓存占据了绝对的优势。
 

芯片

Milan与Milan-X的性能对比 / RIKEN

 
这之后,几位研究人员利用gem5模拟器,打造了两种LARC处理器模型,均以1.5nm工艺打造,且都用到了大容量的3D堆叠缓存。这一处理器的设计参照了当下超级计算机之王富岳中A64FX核心,都是基于Arm v8.2架构,只不过在1.5nm这样的先进工艺下,可以看出面积优势非常大,实现了近乎八倍的面积差异,如此一来核心数也从A64FX的12+1核堆上了32核。
 

芯片

A64FX和LARC的核心内存组对比 / RIKEN

 
A64FX的L2缓存并不算大,只有8MB,而他们设计的LARC处理器模型增加了3D堆叠的L2缓存,足足384MB的L2缓存相较前者有了48倍的提升。不过RIKEN提供的gem5模拟器仅仅支持2X大小L2缓存配置,所以就有了256MB和512MB的版本。为了更精准的对比,研究人员们也设计了32核的A64FX版本。
 
一半以上的测试应用中,单个512MB LARC处理器的核心内存组,要比A64FX高出两倍以上的性能,而且这些提升中多半都归功于3D堆叠缓存,并非只靠两倍以上的核心数目。再结合面积上的优势,针对这些缓存敏感的应用,单芯片的LARC处理器可以做到近10倍于A64FX的提升。不过这只是理论结果,毕竟现在既没有1.5nm的工艺,也没有基于芯片层级的实际测试对比,但确实为摩尔定律进展缓慢下的性能改进提供了另一个思路。
 
3D堆叠缓存的局限性
 
固然,这类3D堆叠的设计已经相当普遍了,但还有一个棘手的问题待设计者们优化,那就是散热。面向堆叠缓存的CPU核心势必会面临着热能蓄积,温度升高而降低效能的情况,而且寻常的散热手段面对这种内部积热效果不佳。以AMD的3D V-Cache为例,虽然AMD巧妙地将堆叠缓存置于非计算核心上,但也只是略有缓解,L3缓存与3D V-Cache很可能也会面临积热的难题。
 
从最近的消息也可以看出一些端倪,AMD官方确认首个利用3D V-Cache技术的CPU,Ryzen 7 5800X3D并不支持核心、缓存超频或核心电压调整,这还是建立在5800X3D本就比5800X频率低上0.4GHz的基础上。更重要的是,AMD技术营销总监Robert Hallock指出,这项技术目前还不算成熟,他们也许会在未来推出可超频的型号,但AMD的重心还是在可超频的非3D堆叠缓存处理器上。
 
这就很好理解了,目前无论是工艺还是材料都没有办法很好地解决3D堆叠缓存的散热问题,根据几位HPC研究人员的推测,相关的制造工艺或在2028年才能成熟,届时将先进到克服这一限制。不过在此之前,除了游戏外,3D堆叠缓存还不足以成为扭转处理器市场的Game Changer,更像是一项“战未来”的新技术。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分