电子说
随着人工智能和云计算等技术的不断发展,处理器需要处理的数据量越来越大,对性能和效率的要求也越来越高。另一方面,摩尔定律逼近极限,在过去十几年中,单个处理器中晶体管数目的增加速度逐渐放缓,芯片工艺制程接近1nm时,开始接触到量子效应的极限。
当制造工艺很难再发展的时候,人们更多是希望在处理器架构设计多下功夫,以提高计算效率,NUMA架构应运而生。本篇文章,跟大家介绍一下,什么是NUMA架构?
早期的时候,每台服务器都是单CPU,随着技术的发展,出现了多CPU共同工作的需求。NUMA(Non-Uniform Memory Access,非一致性内存访问)和SMP(Symmetric Multi-Processor,对称多处理器系统)是两种不同的解决多CPU共同工作的硬件体系架构。
SMP架构是比较常见的多CPU构建方式。其主要特征是共享,所有的CPU共享使用全部资源,例如内存、总线和I/O,多个CPU对称工作,彼此之间没有主次之分,平等地访问共享的资源。但是缺点也显而易见,这样势必引入资源的竞争问题,随着核数增多,内存控制器读取内存的性能瓶颈越来越明显,从而导致它的扩展内力非常有限。
为了解决这个问题,硬件设计师们将内存控制器平分到每个 die上,从而形成了NUMA 架构。
NUMA架构通过将CPU划分成不同的组(Node),每个Node由一个或多个(物理)CPU组成,并且有独立的本地内存、I/O等资源。在NUMA架构中,每个节点都有自己的内存和计算资源,这使得处理器可以更灵活地分配资源,提高了整体性能和效率。此外,NUMA架构还可以通过增加节点数量来扩展处理器的计算和存储能力,这使得它成为一种非常适合大规模并行处理的架构。
目前业界都认为摩尔定律接近极限,NUMA技术是CPU发展的一种必然趋势。
摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的。其内容为:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。换言之,处理器的性能大约每两年翻一倍,同时价格下降为之前的一半。
然而,在过去十几年中,单个处理器中晶体管数目的增加速度逐渐放缓,促使许多厂商推出双核及多核计算机。在这样的背景下,NUMA架构处理器可带来更高的性能、核心密度和能效,也会适用于更广泛的计算环境。
说了这么多,NUMA架构处理器表现如何?国内外都哪些品牌采用了多NUMA架构的方式去设计处理器?
(1)AMD
AMD 的“Zen”架构带来全新的处理器设计,较原来的 AMD “推土机”架构实现了大幅的性能提升。 “Zen”有三大目标 — 卓越的性能、非凡的可扩展性以及出色的能效。
为实现出色的可扩展性,AMD 在处理器中大胆采用全新理念:小芯片。AMD 没有构建更大、更昂贵的单片芯片,而是采取了称为小芯片的处理器构建块。每个小芯片都包含许多基于“Zen”的核心,而且封装的小芯片越多,处理器性能就越强。目前,“Zen”处理器的核心数少则两个,多则 128 个。这种创新为消费者带来可扩展性和灵活性。
AMD Zen架构诞生于2017年,迄今已经先后有了14nm Zen、12nm Zen+、7nm Zen 2、7nm Zen 3,以及现有的已应用于AMD 4代服务器的5nm Zen 4Genoa处理器产品。比如,早期的zen1如下图所示4个numa的结构
AMD官网上展示的zen4的多numa架构
从AMD的产品路线图上可以发现,采用多NUMA的架构设计,能扩展更多的物理Core,提供更强的性能,例如:从zen1的32物理核,到zen2/3的64物理核,虽然zen2采用7nm制程,但是多NUMA方式让zen2集成更多的核心,性能也是提升2+倍不止。
型号 | 核心数 | 线程数 |
基频 (GHz) |
最高加速频率 (Ghz) |
CPU2017 Integer Rates |
Zen1 7551 | 32 | 64 | 2.0 | 3.0 | 136 |
Zen2 7662 | 64 | 128 | 2.0 | 3.3 | 335 |
目前最新发布的zen4多达96核,多NUMA架构的方式让处理器可带来更高的性能、更高的核心密度和更低的能效。从AMD的产品路线图上,AMD一直在多NUMA上设计,产品性能也是遥遥领先。
(2)Intel
英特尔今年创新推出的Sapphire Rapids,也为下一代数据中心处理器树立了标准参考。
据英特尔Linux工程师Andi Kleen提交的内核补丁可知,Sapphire Rapids将采用Golden Cove架构核心,而不是目前Tiger Lake使用的Willow Cove架构核心,这意味着Sapphire Rapids将于即将到来的Alder Lake拥有同款架构核心。Sapphire Rapids芯片采用了与AMD霄龙服务器处理器类似的“胶水”设计,4个MCM小芯片有望提供多达80个CPU核心,单颗处理器则由4个NUMA组成。
英特尔在2023年推出了至强铂金 8490H 是一款 60 核服务器/工作站处理器,四个DIE(NUMA)的实现方式。 通过lscpu可以看到9490H单颗处理器4个NUMA结构。
(3)海光
在海光官网上直观的看到海光也是4NUMA的设计,同时,在现有的服务器验证结果来看,海光确实是4NUMA结构,并且在高频计算方面表现在同行业中表现出众,海光在国内市场也已经挤进主流处理器的行列中。
在NUMA架构技术加持下,海光在诸多场景下都能发挥出性能优势。
如在数据库管理系统领域,在大量读写的数据库操作中,NUMA架构可以显著提高数据库的性能,许多数据库管理系统,如Oracle、MySQL等,支持NUMA架构,可以利用NUMA特性进行优化;在科学计算领域,常常需要处理大量的数据,使用NUMA架构可以提高处理器的内存访问速度,从而提高整体性能;在服务器应用领域,NUMA架构可以帮助平衡负载,提高服务器的整体性能;在云计算领域,NUMA架构可以用于平衡虚拟机的资源分配,从而提高整个云环境的性能。
据说,海光四号将采用Chiplet技术,在原有的NUMA架构上,进一步优化互联技术、提升计算能力。海光不断的技术创新,以持续自研迭代,带来好用、易用的国产处理器。
综上所述,NUMA架构是处理器发展的一个重要趋势,产品表现相对而言是不错的。当然,技术发展都是任重道远的,未来处理器架构的发展,还需要不断的创新优化,以克服未知的挑战。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !