处理器/DSP
三年多以前,Arm宣布了他们的Neoverse系列基础架构CPU设计。决定通过专门为这些市场设计Arm CPU内核来加倍投入服务器和边缘计算市场——而不仅仅是回收以消费者为中心的Cortex-A设计——Arm开始以更加积极的方式应对基础设施市场。反过来,这些努力也为Arm及其合作伙伴带来了越来越多的回报,多亏了亚马逊的Graviton和Ampere Altra CPU等产品,他们终于能够在服务器CPU市场上占据一席之地。
但随着Arm CPU最终实现了过去十年未能实现的市场渗透,Arm需要确保它不会固步自封。在公司的三个Neoverse核心设计系列中——高效的E、灵活的N 和高性能的V——公司已经在其第二代N核心上,恰当地称为N2。现在,该公司正准备用下一代V和E内核更新Neoverse的其余产品线,这次宣布推出Neoverse V2和Neoverse E2内核。这两种设计都计划将Armv9架构带给HPC和其他服务器客户,并显著提高性能。
Arm Neoverse V2:Armv9 助力高性能计算
引领Arm新CPU内核IP的是该公司的第二代V系列设计Neoverse V2。代号为Demeter的完整V2平台标志着Arm对其高性能V系列内核的首次迭代,以及该内核阵容从Armv8.4 ISA向Armv9的过渡。虽然这只是Arm在服务器专用高性能内核方面的第二次尝试,但请不要误会:Arm有雄心勃勃的目标。该公司声称 Neoverse V2 CPU将提供市场上最高的单线程整数性能,超过AMD和英特尔的下一代设计。
虽然本周Arm发布的公告并不是对新架构的全面深入研究——更令人恼火的是,该公司并没有谈论具体的PPA指标——但Arm提供了一个高层次的视角,介绍了V2平台将带来的一些变化和功能。可以肯定的是,V2 IP已经完成并在今天交付给客户(最著名的是NVIDIA),但Arm在2023年第一批基于IP的芯片交付之前,在某种程度上对他们关于V2的说法有所隐瞒。
首先,Armv9的升级带来了最新Arm架构附带的全套功能。这包括作为架构基石功能的安全改进(尤其适用于云共享环境)以及Arm较新的SVE2矢量扩展。
对于后者,Arm通过重新配置矢量引擎的宽度,在这里做出了一个有趣的改变;V1使用2管道256位SIMD实现SVE(1),而V2移动到4管道128位SIMD。最终结果是,V2的累积SIMD宽度不比V1宽,但执行流程已更改为并行处理更多的较小向量。这一变化使SIMD管道宽度与Arm的Cortex部分相同(均为128位,SVE2的最小尺寸),但这确实意味着Arm不再通过使用更大的SIMD来充分利用SVE的可扩展部分。我希望一旦他们进行完整的V2深入研究,我们就会知道为什么Arm会走这条路,因为我很好奇这是否纯粹是一种效率游戏,或者更类似于整个Arm生态系统的同质化设计。
除此之外,值得注意的是,虽然Arm的演示幻灯片将bfloat16和int8 matmul列为功能,但这些并不是新功能。尽管如此,Arm仍然承诺V2的SIMD处理将提供比V1更高的微架构效率。
更广泛地说,V2还将引入更大的L2缓存大小。V2设计支持每个核心最多2MB的私有L2缓存,是V1最大容量的两倍。V2还将进一步提高Arm的整数处理性能,尽管公司目前不打算进一步详细介绍。从架构的角度来看,V1借鉴了Cortex-X1 CPU的设计,如果V2借鉴了X2的设计,这也就不足为奇了。在这种情况下,Snapdragon 8 Gen1和Dimensity 9000这样的消费芯片应该提供了一定的参考。
对于Demeter平台,Arm将重新使用其CMN-700网状fabric,其首次引入V1代。CMN-700仍然是一种现代网状设计,在12x12配置中支持多达144个节点,并且适合与DDR5内存以及PCIe 5/CXL 2接口以进行I/O。因此,严格地说,V2并没有在结构层面带来任何创新——即使是512MB的SLC也可以通过V1+CMN-700设置完成——但这确实意味着CMN-700Mesh及其功能现在是V2的基础。
反过来,Neoverse V2核心将成为下一代高性能Arm服务器CPU的基石。事实上,这里的旗舰将是NVIDIA的Grace CPU,这将是2023年第一款(如果不是第一款)V2设计。NVIDIA之前宣布Grace将基于Neoverse设计,因此本周Arm的声明最终证实了长期以来的怀疑,即Grace将以下一代NeoverseV核心为基础。
就NVIDIA而言,他们的秋季GTC活动计划在几天内举行。因此,我们很可能会听到更多关于Grace及其Neoverse V2基础的信息,因为NVIDIA希望在明年发布之前推广该芯片。
Neoverse E2:Cortex-A510用于N2
除了Neoverse V2的发布,Arm还利用本周的简报发布了NeoverseE2平台。与V2版本不同,这是一个规模小得多的公告,Arm只提供了一些技术细节。最终,E2投入使用的日子即将到来。
也就是说,E2平台正在交付给合作伙伴,着眼于与现有N2平台的互操作性。为此,Arm将Cortex-A510 CPU与Arm的小型/高效Cortex CPU核心配对,并将其与CMN-700网格配对。这旨在为服务器运营商/供应商提供更多灵活性,为N2提供替代CPU核心,同时仍提供Arm mesh的现代I/O和内存功能。强调这一点,E2系统背板甚至与N2背板兼容。
Neoverse Next: Poseidon, N-Next, and E-Next
最后,Arm本周发布的公告为公司所有三个Neoverse平台的未来路线图提供了一些信息,毫不奇怪,Arm正在开发每个平台的更新版本。
值得注意的是,所有三种平台都要求支持PCIe 6支持以及CXL 3.0。这将来自Arm的CMN网格网络的下一次迭代,正如Arm今天已经做的那样,它在所有三个平台之间共享。
同时,有趣的是,看到Poseidon的名字再次出现在Arm的路线图中。回到Arm的第一个Neoverse路线图,Poseidon是附在Arm的5mn/2021平台上的名字,自N2和V1/V2以各种形式出现以来,Poseidon就是一个位置。由于V2直到2023年才在硬件上登陆,Poseidon/V3还需要几年时间,但Arm保留代号(例如新的微体系结构)可能有一定的意义。
但首先推出的将是N-Next平台——可能的Neoverse N3。随着Neoverse N平台领先其他平台一代(N2于2020年首次宣布),它将是下一个更新的平台。N3将于2023年提供给合作伙伴,Arm广泛宣传新一代的性能和效率改进。
编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !