AMD CPU之路-Chiplets

Linux阅码场 2023-06-30 2074

描述

在AMD的ZEN架构出现一开始，就是定义一个基本原则，一个core的架构，从laptop到desktop到server，这个也符合2015年AMD的股价，基本上没有钱做其他的路线了，而它的金主Intel的确风光呀，收购FPGA，AI公司，架构上，mobile，laptop，desktop，server上面都是百花齐放，每个方向至少两个不同的方向。记得我刚进Xilinx的时候，大家说Intel的FPGA的PCIE Gen4一直出不来，主要原因是Intel内部至少有两个team在做PCIE，一个做4.0，一个做5.0.

这个一招鲜吃遍天的做法，已经被ARM玩得炉火纯青了。一个架构的design，可以在mobile，也可以在server上。当年死在沙滩上的calxeda就是这样的。

因此。对于第一代的ZEN的架构，在Desktop上的确获得很大的成功，但是在server上面让中国的头号云计算玩家甚是失望。一个core的架构，来通吃整个市场，需要通过power和clocking的控制来实现。在下图中，基本也就在Desktop实现了突破。

amd

通过小die来提升良率，使用CCX进行互联，这个是没有免费午餐的。但是，AMD因为比较专一，在CCX的设计上的确是翻身了。

amd

架构上面，和传统的单die的CPU设计也有区别。使用ARM架构常用的Core和IO 分离的架构。

amd

通过IF互联的代价也很明确，就是天生NUMA。这个也是AMD的系统优化一直强调的NPS （NUMA Nodes per Socket)。local 和remote 之间的差距有点不忍直视。但是，既然走了这一步，AMD拼命加L3 cache的行为就说明他们还是明白“失之东隅收之桑榆”的祖训的。

amd

本文的重点是Chiplets，在AMD ISCA2021的paper 中，说明了Fabless公司面临的恶劣环境。

amd

Mooer定律没死，但是的确老了，14nm之后的成本曲线变了。因此AMD早在14nm就开始改架构了。这个是AMD Zen成功的关键。

amd

Die的大小增加了10%，但是成本只有6成，漂亮。

这个时候，最大的32Core 已经被对手的28好不少了，但是AMD的已经看到了ARM 服务器那种夸张的数量。怎么才能拉垮等等呢？

TSMC的7nm是生逢其时。

amd

另一个关键的因素是剥离了IO，让IO 和Core独立发展。原因很简单，因为IO部分拿到的制成红利不多。

amd

因此，在这个里面也充分说明了AMD精打细算的特质。在有人问到为什么要CPU上chiplets，而不是GPU时，人家说了大实话，一个cpu的计算单元很大，8个少一个，就是损失了12%，但是GPU里面的计算单元很很多，少几个没啥关系，不是有什么1080/1070/1060/1050/1040吗？

因此2代Zen真的是省上加省。

amd

同时，增加了IO Die，对于访存延时也有了改观。

amd

虽然本地的延时大了4ns，但是remote的降低了，满足全世界人民的愿望：“不患寡，患不均”。大家都一起拉垮吧。

amd

因此，Zen2 在desktop，laptop和Server上做到了复兴，南海边的Hyperscale大获成功，据说他们的口号是“省一半”。

amd

说到省，另一个没有想到的是Desktop 的io die也被拿去了做chipset。这个太高明了，以后ARM服务器出来之后，估计大部分的人IO Die可以直接做PCIE switch。

因此，在中国打压吃喝玩乐，单投硬科技的场景下，Chiplets成了一个香饽饽，这国人最迷信的“弯道超车”的白日梦中，chiplets一级本炒的火热了。好多没做过个芯片的，都要做先整个chiplets。但是chiplets真的好吗？请看AMD诚实的告白：

amd

What，你的Core不一样？

但是，AMD的用户和超市排队买便宜鸡蛋的大妈一样，我们有时间，有兴趣折腾。老板这个时候说了，便宜是硬道理，你们工程师自己去适配，这样不就锻炼了队伍吗? 同样，我这个系列就不放引用了，你们读了文章，还自己去找出处，也锻炼了大脑和翻墙的技巧。

审核编辑：刘清

打开APP阅读更多精彩内容

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

相关推荐
热点推荐
FPGA
amd
TSMC
chiplet

全部0条评论

快来发表一下你的评论吧 !

×

20

完善资料，
赚取积分