Arm架构助力Azure Cobalt 100虚拟机工作负载性能提升

Arm社区 2025-12-15 497

描述

自从微软推出基于 Arm 架构的 Azure Cobalt 100 虚拟机 (VM) 以来，已有众多客户选择这款新实例运行各类用例。目前，Cobalt 100 虚拟机已在全球微软 Azure 云的 32 个地区上线，并且持续快速扩展，为新一代数据中心工作负载带来了性能、能效和可扩展性的大幅提升。这些提升源于专为赋能现代云原生应用设计的创新 Arm Neoverse 计算子系统 (Compute Subsystems, CSS) ，能实现更高的吞吐量和更低的能耗。

包括 One Trust 和 Databricks 在内的领先软件供应商对于该款实例均给予高度认可，强调不仅能显著提升性能和能效，还有助于节省成本。这与行业向异构计算架构转型的趋势相契合，Arm 可扩展且高能效的计算平台让超大规模云服务提供商在满足日益增长的性能需求时，不用牺牲可持续发展目标。与此同时，Teams 和 Microsoft Defender for Endpoint 等微软服务在此类实例上的性能最高提升了 45%。

Arm 近期在 Cobalt 100 实例上，对内存数据库、Web 服务器和量化金融等多项工作负载进行了基准测试，并和基于 AMD Genoa 的 Azure 实例进行了比较。测试结果直观展现了在基于 Arm 架构的 Azure Cobalt 100 虚拟机上运行工作负载，能获得的性能与能效提升，也印证了 Cobalt 100 的设计目标：提供显著的性价比优势、广泛适配各类工作负载，以及大幅节约成本。

Cobalt 100 上通用工作负载的性能提升

Redis 仍是现代分布式应用的核心组件，尤其是在实时数据处理和缓存方面。D4ps_v6 Cobalt 100 实例在性能和性价比上表现亮眼，与 AMD Genoa D4as_v6 实例相比，性能提升 48%，性价比提高 91%。这充分体现了在微服务和对延迟敏感的实时数据交互主导的云原生应用软件栈中，Arm 架构能有效提升实际运行性能。

同时，对 Nginx 等 Web 基础设施和网络工作负载的测量，显示了 Cobalt 100 在计算、内存和 I/O 方面具有均衡的性能。基准测试显示，在负载均衡业务上，基于 Arm 架构的 D4ps_v6 Cobalt 100 实例与 AMD Genoa D4as_v6 实例相比，性能提升 53%，性价比提高 99%。

最后，在 QuantLib（一个用于金融工具建模、定价和风险管理的开源量化金融库）的 GCC/G++-15 基准测试中，D4ps_v6 Cobalt 100 实例相较于 AMD Genoa D4as_v6 实例，性能提升 47%，性价比提高 89%。

虚拟机

能效、可扩展性与实际价值

Arm 与 Microsoft Azure 在创新技术方面不断保持密切合作，包括近期 Cobalt 200 处理器的推出。双方的合作展示了基于 Arm 架构的定制芯片正助力 AI 驱动的云基础设施规模化地实现新的性能与能效水准。

Cobalt 100 实例延续了 Arm 标志性的能效优势——在性能提升的同时，能耗并没有同比增加。这一特性让云计算运营商和云服务客户都能获得更优的性价比。例如，ONNX Runtime 中的 Arm 优化与 Cobalt 100 处理器相结合，大幅提升了大语言模型 (LLM) 推理的 AI 性能，与基于 AMD Genoa 的实例相比，性能最高提升 1.9 倍，性价比最多提高 2.8 倍。

无论客户是运行高频交易系统、缓存层、API 前端还是 Java 微服务，Cobalt 100 都能提供卓越的性能与能效，助力客户自信地推进未来的规模化发展。随着 Arm 生态系统在软件、工具和芯片合作伙伴方面的持续拓展，开发者将受益于这一专为云计算长期创新和可持续发展打造的平台。

* 脚注：所有基准测试结果均在可控且可重复的测试环境中获得，采用了最新可用的软件与平台配置。测试基于 Ubuntu 25.04 系统机型，所有对比平台（Cobalt100、Genoa 和 Emerald Rapids）均使用一致的内核、编译器与运行时环境。每项工作负载均执行多次，以确保测量结果的一致性和统计有效性。

通用测试原则

所有平台的基准测试均采用相同的线程数、客户端配置和运行时参数。NUMA 和内存设置按实例类型进行了统一； HugePages、THP 与 swapiness 设置进行了标准化。所有系统均使用相同的操作系统映像、编译器版本 (GCC/G++ 15.0.1) 和库版本 (OpenSSL 3.4.1, GlibC 2.41)。

基准测试范围

Redis、PostgreSQL 和 MySQL：通过 Memtier 和 HammerDB (TPROC-C) 测量吞吐量和每美元吞吐量。

SPECjbb 2015：在 Ubuntu 25.04 上使用 OpenJDK 21，评估综合性能、max-jOPS 和 critical-jOPS /$。

Nginx：使用 wrk 工具，在固定连接数和线程数的条件下，测量第 99 百分位延迟下的 HTTPS 负载均衡吞吐量。

QuantLib：采用 GCC 15 与供应商 LLVM 工具链构建金融分析工作负载，分别测量单线程与使能所有 vCPU 时的性能。

打开APP阅读更多精彩内容