IPU和CXL如何提高数据中心的电源效率?

描述

DPU、IPU 和 CXL 技术有可能显著提高数据中心的能效。

数据处理单元 (DPU)、基础设施处理单元 (IPU) 和 Compute Express Link (CXL) 技术可从服务器 CPU 卸载交换和网络任务,具有显著提高数据中心能效的潜力。事实上,美国国家可再生能源实验室 (NREL)认为,使用此类技术并专注于降低功率的企业可以实现约 33% 的效率提高。

 使用新的网络技术提高电源效率

去年,出现了几项新技术,重新审视了数据中心的功耗。虽然采用了不同的方法,但这些解决方案都试图通过从 CPU中卸载交换和网络工作来提高能源效率,就像 GPU 和基于硬件的加密减少 CPU 的负载(从而降低整体功耗)一样。以下是一些值得关注的主要进展:

 什么是数据处理单元 (DPU)?

数据处理单元 (DPU) 是一项相对较新的技术,可将处理密集型任务从 CPU 卸载到服务器中的单独卡上。从本质上讲,DPU 是一种微型板载服务器,针对网络、存储和管理任务进行了高度优化。(服务器上的通用 CPU 从未设计用于这些类型的密集型数据中心工作负载,并且经常会使服务器陷入困境。)

DPU 能产生什么影响?“在 DPU 中使用硬件加速来卸载处理密集型任务可以大大降低功耗,从而提高效率或在某些情况下减少服务器、更高效的数据中心,并通过减少电力消耗和减少成本来显著节省成本。”ZK Research 的创始人兼首席分析师Zeus Kerravala 说。

DPU 可以节省多少功率?提供英伟达BlueField DPU的英伟达的一份报告估计,卸载网络、存储和管理任务可以将服务器功耗降低多达 30%。此外,该报告还指出,随着服务器负载的增加,节电量也会增加,对于拥有 10000 台服务器的大型数据中心,在服务器的 3 年使用寿命内,可以节省 500 万美元的电费。在冷却、供电、机架空间和服务器资源成本方面将会有额外的节省。

 什么是基础设施处理单元 (IPU)?

虚拟交换、安全和存储等基础设施服务会占用大量 CPU 周期。基础设施处理单元 (IPU) 可加速这些任务,释放 CPU 内核以提高应用程序性能并降低功耗。

去年,英特尔和谷歌云推出了一款代号为 Mount Evans 的联合设计芯片,旨在让数据中心更加安全和高效。该芯片接管了 CPU 为网络打包数据的工作。它还在可能共享 CPU 的不同应用程序和用户之间提供更好的安全性。

根据英特尔的定义,IPU 是一种具有强化加速器和以太网连接的高级网络设备。它使用紧密耦合的专用可编程内核来加速和管理基础设施功能。IPU 在使用软件定义网络 (SDN) 和日益复杂的管理软件的现代计算环境中特别有效。这些解决方案结合在一起会耗尽计算资源。英特尔估计,在某些高度虚拟化的环境中,网络可以消耗主机 CPU 周期的 30% 。

 什么是计算快速链路 (CXL)?

Compute Express Link (CXL) 是一种开放互连标准,用于在主机(例如处理器)和设备(例如硬件加速器或智能 NIC)之间实现高效、一致的内存访问。该标准旨在解决所谓的冯诺依曼瓶颈问题,其中计算速度受限于 CPU 从存储器中检索指令和数据的速率。

CXL 以多种方式解决了这个问题。它采用了一种新的方法来在多个计算节点之间进行内存访问和共享。它允许内存和加速器分解,使数据中心完全由软件定义。

池中的某些内存设备可以允许在多个主机之间共享内存,这为应用程序提供了新的机会和可能性,可以在适当的位置读取、修改和写入数据,而无需通过网络在节点之间移动数据或传递消息。多台主机映射和使用数据的能力可以提高基础设施资源利用率。

CXL 有多重要?“CXL 技术可能会显著影响未来的服务器架构,” Omdia 云和数据中心研究实践分析师 Aaron Lewis 说。具体来说,CXL 可以在满足容量和带宽要求的同时降低服务器中的内存成本。

Lewis 还指出,很大一部分主板区域用于内存。通过 CXL 内存分解,内存资源可以像存储驱动器或物理外形的 PCIe 卡一样处理。这可能会使服务器计算更加密集,并且主要受热因素限制,而不是缺乏主板空间。

 为什么 DPU、IPU 和 CXL 技术很重要

几十年来,企业一直关注运行其数据中心和 IT 运营的日益增长的电力需求。随着计算和存储需求的增长,能源消耗也在增长。具有更强大 CPU 的服务器直接使用更多电力。更快的处理器产生的热量需要越来越多的冷却,从而增加了电力负荷。

为了解决这些问题,已经尝试了各种能效解决方案,通过将一些计算和安全任务卸载到针对特定任务优化的协处理器(例如 GPU 或基于硬件的加密器)来解决这个问题。

除了使用 GPU,企业还使用虚拟化和节能实践来显著改善数据中心的功耗。因此,电源使用效率 (PUE) 这一描述计算机数据中心使用能源效率的标准指标下降了。(这是一件好事。)它从 2007 年的平均 2.5 左右下降到 2011 年的 1.98。这一下降是通过使用电源优化技术实现的,包括通过虚拟化最大化工作负载、改进冷却和其他举措。

不幸的是,这些用于降低数据中心电源效率的方法在十年内几乎没有改善,因为 PUE 比率变化很小。研究表明数据中心的 PUE 值范围很广,但目前的总体平均值约为 1.8。

最近,注意力已经转移到降低开关和网络工作的功率需求上。美国国家可再生能源实验室 (NREL)认为,使用此类技术并专注于降低功耗的企业可以实现约 33% 的电源效率提升。






审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分