基于Arm架构服务器释放更高CPU利用率

描述

作者:安谋科技 (Arm China) 高级业务发展经理 Donald Liu;安谋科技 (Arm China) 首席软件工程师 常瑞

在大型云服务提供商的数据中心中,CPU 利用率长期偏低,造成了大量资源闲置。根据 CAST AI 的分析,超过 1,000 个 CPU 的大型集群平均占用率仅约 17%[1],不同云服务商之间略有差异,但这一数据仍具有一定代表性。同时这也意味着云计算仍有巨大的降本增效空间。

Arm Neoverse:

简洁高效架构,带来更高利用率

基于 Arm Neoverse 平台的服务器 CPU 以简洁高效的架构设计著称。在运行同样的工作负载时,相比工作在 SMT 模式下的 x86 服务器,能够提供平均高 20% 的 CPU 使用率,并且性能增长呈现线性且可预测的特性。这种架构优势不仅提升了资源利用率,还为云服务的稳定性和一致性提供了保障。

为什么 Arm 能做到更高效?

Arm 选择非 SMT (Simultaneous Multithreading) 设计,即一个物理核心只承载一个硬件线程。这意味着软件在运行时可以独享 CPU 流水线的所有执行单元、L1/L2 缓存及相关资源,避免了硬件资源竞争带来的性能波动。相比之下,x86 CPU 的 SMT 技术在高负载下,两个线程共享执行单元,性能提升往往变得非线性且不可预测。更多技术细节可参考《一文解谜 SMT 系统上 CPU 使用率的盲点》一文。

实践验证:

更高的安全水位*,更稳定的性能

* 安全水位表示在 SLA 可接受范围内的长期 CPU 利用率上限

阿里云智能集团在部署倚天服务器的过程中积累了丰富经验。在近期的公开演讲中,阿里云弹性计算高级架构师张先国提到:

Arm 平台通常有更低的功耗,这有赖于它精简指令集设计 (RISC)、更小的核心面积以及高效的中断处理机制。倚天平台的 L1/L2 尺寸相比同代 x86 更大,数据搬移更少,整体计算效率更高,对降低功耗也有极大帮助。

在倚天平台上,常规情况下 CPU 占用率可提升至 50%,而 x86 平台通常是 30%。在突发流量、离线数据处理等高负载场景下,Arm 平台的安全水位可达 70%,相比 x86 平台的 50%,提升到 1.4 倍。Arm 平台由于固定频率和物理核设计(非 SMT)仍能保持线性性能增幅,即使在高负载下也能为云计算用户带来一致性的体验。

能效优势:降低 TCO 的关键

传统 x86 平台保持低 CPU 使用率,部分原因在于历史设计理念,如应对突发流量、保障系统稳健性和节能等。而 Arm 通过高能效架构提供了另一种解决方案:

更低 TDP:同等性能下,基于 Arm 架构的 CPU 的 TDP 通常低于 x86。

固定频率 + 非 SMT 设计:为线性性能提升和可预测的 SLA (Service Level Agreement) 提供基础。即使在固定频率运行时,Arm 架构服务器在实际负载下也更难达到标称 TDP,这意味着能实现更高效的能耗表现。

总  结

Arm Neoverse 平台通过简洁高效的架构设计,实现更高的 CPU 利用率和线性性能扩展,帮助云服务商降低系统总体拥有成本 (TCO),提升性能与能效,为未来云计算基础设施带来新的可能。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分