电子发烧友网报道(文/周凯扬)相信对于超级计算机有所了解的朋友,对于富岳这一曾经称霸的日本超算系统应该不陌生。这台超算从2014年开始研发,历经数年才正式启用。而它也是全球首个获得TOP500榜首的ARM架构超算,基于A64FX打造。
尽管主打HPC应用,并未配备任何GPU组件,富岳在AI计算上依旧不逊色这些年新出的一些超算系统,富士通也在与东京工业大学、日本理化学研究所合作,打造基于日语的生成式AI。然而,面对未来要求算力节节攀升的AI应用,以及开始严控能效的数据中心,富士通已经开始了下一代旗舰CPU代号FUJITSU-MONAKA的开发。
曾经的霸主,上一代A64FX
作为由富士通专为富岳超级计算机设计的HPC/AI处理器,上一代的A64FX是为了彻底替代SPARC64 V的VIIIFX而打造的,2018年公开的A64FX不仅是首批用上7nm工艺的超算处理器,也是首个基于ARM V8.2A指令集加SVE的ARM处理器,单芯片峰值算力达到2.7TFLOPS。
A64FX集成了4个NUMA节点,每个节点包含12个计算核心,除此之外还有一个辅助核心用于非计算类的任务,不过只有在2.2GHz最高频率运行时才会启用4个辅助核心,整个处理器共计52个核心。为了支持8GB的HBM2内存,富士通还集成了一个内存控制器,且基于其自研互联技术Tofu D,为A64FX集成了一个Tofu D控制器。
正是因为有了强悍的A64FX,富士通的富岳自2020年6月起,以442petaFLOPS的算力牢牢占据着超算TOP500榜首的位置,直到两年之后被Frontier超过。毕竟从2019年到2022年,无论是芯片设计、接口标准还是工艺制程都有了巨大的发展,且为了跟进现在的AI潮流,即便是过去以HPC为主的超算,也不得不考虑起AI算力,所以富士通计划把下一代Monaka打造成次时代的高性能高能效芯片。
2nm的Monaka
为了进一步应对AI和DX的快速发展,尤其是数据中心的功耗增加,富士通计划利用ARMv9-A架构以及台积电的2nm打造全新的Monaka处理器。根据富士通公开的情报来看,该处理器集成了150个核心,支持DDR5内存、PCIe 6.0(CXL 3.0)接口,采用3D Chiplet的设计打造。
Monaka的设计目标包括节能、高速、安全性和易用性。在能效上,富士通表示Monaka具备两倍于竞品的能效,显著减少碳足迹和电力成本。第二个是高速数据处理与传输,虽然没有具体数字,但富士通表示在AI负载上的计算能力也将达到竞品的两倍。
第三是安全性,除了用于大型服务器集群中必须实现的稳定与可靠性外,Monaka还将通过Armv9-A中引入的全新CCA加密计算架构特性来确保安全性。最后是易用性,通过对富岳的开发,富士通已经有了针对Arm架构在HPC/AI上进行软件开发的经验,结合基于Arm架构开发的服务器开源软件不断面世,Monaka将拥有更加广泛的软件生态支持。
至于下一代超算处理器,富士通也表示相关的研究调查工作正在进行,不过预计2030年才会落地。Monaka虽然同样性能强大,但还是主要面向商用价值更高的数据中心/AI市场。
值得一提的是,虽然日本本土生产2nm芯片的晶圆厂Rapidus也计划于2027年量产,但富士通依然选择了使用台积电的2nm打造。富士通表示这是因为台积电在富士通处理器的量产方面有着良好的记录,为了实现MONAKA在2027年的成功上市,台积电的2nm是最佳的选择。
况且Rapidus要到2025年EUV***才到位,开始试产工作,并准备好接收额外的EUV***,Rapidus的晶圆良率和产能仍有待验证。而台积电已经准备好2025年生产2nm芯片,也给了富士通2年的时间来优化其芯片设计。
写在最后
其实从A64FX开始,基于Arm架构的大芯片就开始持续井喷,不论是Ampere的Altra、英伟达的Grace,还是平头哥的倚天710,Arm在服务器、HPC和AI领域的市场竞争力已经达到了新的高度,相信未来数据中心和超算上,都会出现更多Arm芯片的身影。
全部0条评论
快来发表一下你的评论吧 !