AMD最新一代服务器芯片得到众多云计算公司青睐。
AMD 第 4 代“热那亚”Epyc 服务器芯片的扩展阵容——建立在“Zen 4”核心之上,采用了 L3 增强 3D V-Cache技术——本周在旧金山举行的一次备受瞩目的活动上亮相并进入云端。
Microsoft 和 Amazon Web Services 都公布了其云的新增功能,Oracle 也制定了在其 Oracle 云基础设施中使用新 E5 实例的计划。
AMD 通过数据中心和 AI 技术首映式活动,突出其在数据中心方面的积极努力,该公司继续缓慢地削弱竞争对手英特尔的市场份额。根据 Mercury Research 的数据,英特尔在 2022 年第四季度的服务器市场份额为 82.4%,较上年同期的 89.3% 有所下降。与此同时,AMD 的份额从 2021 年最后一个季度的 10.7% 跃升至一年后的 17.6%。我们等待 2023 年第一季度和第二季度的更多最新数据。
Hyperscalers 正在用越来越多的芯片来武装他们的云环境进一步运行他们的基础设施,并且由于 AMD 在过去几年中的敏锐执行力,其 Epyc 处理器是这个环节的重要组成部分。
作为AMD 的 Epyc 扩展的一部分,微软正在其 Azure HPC 稳定版中推出最新的虚拟机,并为其配备采用 AMD 虚拟缓存技术的服务器处理器,并与 Nvidia 的高速 InfiniBand 连接相结合。
这家软件和云巨头于 2022 年 11 月宣布了新的 HX 系列和 HBv4 系列 VM 的公开预览版,旨在处理计算流体动力学 (CFD)、渲染、AI 推理、分子动力学和天气模拟等工作负载。当时,这些虚拟机由 AMD 的第四代 Epyc“Genoa”处理器提供支持。
为了本周的 VM 全面上市,它们升级到了采用 AMD 的 3D V-Cache 技术(代号“Genoa-X”)的第 4 代 Epyc 处理器。3D V-Cache 是一种先进的封装技术,使 AMD 能够在每个芯片上放置另外 64 MB 的 L3 缓存,从而使每个芯片的总容量达到 96 MB,即 768 MB 的总 L3 缓存。
随着更多的工作负载缓存在 L3 中,带宽密集型工作负载的吞吐量显著增加,从而使诸如数字运算之类的过程可以更快地访问内存。
Azure HPC 高级产品经理 Jyothi Venkatesh 和高级技术项目经理 Fanny Ou写道,新产品中每个 VM 的 2.3 GB L3 缓存可提供高达 5.7 TB/秒的带宽,从主内存释放高达780 GB /秒的带宽,带来平均 1.2 TB/秒的有效内存带宽。
根据 Microsoft 的内部测试,对于流行的内存带宽受限工作负载,如 OpenFOAM(开源计算流体动力学 (CFD) 软件),这意味着性能比具有标准第 4 代 Epycs 的 VM 高出 1.49倍。与 Milan-X 处理器之前的 HBv3 系列相比,HBv4 和 HX 系列的性能也有显著提升。
在公司活动上与 AMD 首席执行官 Lisa Su 交谈时,微软 Azure、HPC、AI、SAP 和机密计算总经理 Nidhi Chappelle 阐述了新 VM 将带来的其他好处,包括两倍的计算密度和HBv4 VM 中的 HPC 工作负载速度提高 4.5 倍,HX 虚拟机上数据密集型工作负载的性能提高 6 倍。
“对于这些客户中的许多人来说,这意味着他们现在可以在相同数量的内核或更少的内核上安装大量现有工作流,并且总体上拥有更好的总拥有成本,因为它们节省了很多软件许可,”Nidhi 说。
微软详细介绍了新 VM 的其他技术,包括来自 Nvidia 的 400 Gb/s Quantum-2 InfiniBand、80 Gb/秒 Azure 加速网络和 3.6 TB 本地 NVM-Express SSD,提供高达 12 GB/秒的读取和7 GB/秒的写入存储带宽。
新的 HX 和 HBv4 系列 VM 将很快进入美国东部地区,然后是美国中南部、美国西部和西欧地区。
AWS于2018 年开始推出基于 Epyc 的云实例,此后已推出 100 多个此类实例,今年晚些时候将推出由新 AMD 芯片提供支持的新一代 Amazon EC2 M7a 实例,并将提供50%的性能提升到当前的M6a实例。新实例以预览版形式提供,并将在第三季度全面上市。
M7a 实例支持 AVX-512 进行高性能计算,支持 FP16 和 BFloat16 半精度进行机器训练和推理。M7a 实例还包括 DDR5 内存,内存带宽比 DDR4 高 50%。AWS 的 Amazon EC2 副总裁 Dave Brown 在与 Su 同台时表示,此类功能将“使客户能够获得额外的性能,并为 AWS 带来更广泛的工作负载”。
Brown还表示,这家云计算巨头——占据云基础设施服务市场 32% 的份额,其次是 Azure 占 23%,谷歌云占 10%——计划在未来扩大基于热那亚的 EC2 实例数量。
甲骨文表示,其即将推出的配备最新 AMD 芯片的 E5 实例将于今年下半年全面上市,OCI 软件开发高级副总裁 Donald Lu 表示,在其平台上使用基于 AMD 的实例的组织总共可节省 40 美元万每年。
“借助为我们的 OCI Compute E5 实例提供动力的下一代 AMD 处理器,我们为客户提供了更快、更高效地运行任何工作负载的能力,”Lu 说。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !