预定下代超算第一？富士通144核Arm处理器公开

E4Life 2024-06-24 3061

描述

电子发烧友网报道（文/周凯扬）相信对超算市场有过一定了解的朋友，都对曾经的第一名富岳超算不陌生。这台2021年正式启用的超算，是全球首台登顶TOP500的Arm架构超算。富岳采用了富士通设计A64FX SoC，整个超算集群的峰值性能可以达到537.21PFlop/s。如此强大的性能，甚至于日本东京工业大学、日本东北大学等都宣布将借助富岳来开发日语生成式AI。

然而在最新的TOP500排行榜上，随着更新的英特尔Xeon和AMD EPYC处理器纷纷到位，如今的富岳已经降至第四名的位置。为此，富士通也在开发A64FX的继任者，并计划用于下一代超算的开发中去。

Monaka，A64FX的继任者

作为一直在超算领域发力的头部厂商之一，富士通此前一直选择SPARC作为其计算处理器的架构，直到A64FX的出现。A64FX面世之时一度被称为最强Arm处理器，也让不少人对Arm在数据中心和HPC的前景有了新的改观。

然而这种众核处理器，除非经过特殊的架构优化，否则并不适合用于通用服务器，国产的申威26010服务器也是类似的设计思路。但不可否认在HPC应用下，众核处理器可以发挥出媲美甚至超越传统x86旗舰处理器的实力。

近日，富士通宣布了他们在研的下一代众核Arm处理器Monaka，该处理器除了改用Armv9架构，引入了SVE2之外，还采用了云原生的3D众核设计，专为数据中心做了能效优化。Monaka采用了3D Chiplet的设计方案，其中处理器核心die基于2nm工艺打造，而SRAM和IO die基于5nm工艺打造，通过TSV与核心die相连。

Monaka 3D众核架构 / 富士通

据富士通透露，2nm的核心die区域仅仅占了整个芯片面积的不到30%，从而带来极高的能效表现，只需用到风冷。同时3D众核架构使其可以塞入双插槽144个核心，实现极低的延迟和更高的带宽。

至于在软件支持上，富士通除了持续开发Linux OS中行业标准软件的支持外，也会参与发展与Arm相关的开源软件生态，加强在Python、Java、LLVM等标准工具上的性能表现。Monaka预计将于2027年正式亮相，考虑到其流片时间，富士通既有可能选择台积电、英特尔等现有的先进晶圆代工厂，也可能考虑正在建设2nm工厂的Rapidus。

HPC转向AI主导？

作为目前最有利可图的市场，AI正在驱动GPGPU聚焦在低精度计算的算力升级上。在CUDA平台的助力下，HPC生态的门槛也在持续降低。从这几年发布的新品来看，无论是FP16、FP8的算力都在成倍增长，然而在FP64这种传统HPC应用需要用到的高精度数据格式上，性能提升却相当有限。

更重要的是，要想通过堆量来提高HPC集群的FP64性能也不再现实了，因为GPU的TDP提升幅度甚至更高。为此，富士通的看法是，将更多的FP64单元放在CPU端，而将更多的HBM和低精度矩阵单元放在GPU端，这样构建HPC系统的客户就不再需要为GPU的巨额成本和巨量功耗买单，却可以利用其在深度学习上的卓越性能。同时，开发更多HPL-MxP应用，利用混合精度计算来提高效率。当然了，也可以施压GPU厂商进一步改善其FP64性能，只不过在生成式AI依旧火热的当下，让GPU厂商放弃这个摇钱树并不现实。

打开APP阅读更多精彩内容