AI时代,数据是驱动智能的关键引擎。作为存储和处理这些数据的核心基础设施,数据中心持续滋养着我们的数字世界——
对大众生活而言,AI大模型的参与,让搜索和内容生成进入一个全新阶段;
对企业而言,要实现工业自动化,需要基于AI分析优化改进控制流程;
对政府机构亦是如此,更多、更广泛的数据将促进决策和政策制定......
据施耐德电气估算,到2028年,人工智能电力消耗将占数据中心总电力消耗的15%-20%。AI需要愈加澎湃的算力助其不断演进,也为数据中心的设计和运营带来颠覆性的变革。
急需“重塑根骨”的数据中心将何去何从?
施耐德电气通过分析人工智能工作负载的相关属性和趋势,针对数据中心多个物理基础设施类别提供应对指南,帮助大家寻获破局之法。
4个根本原因 驱动数据中心革新
当前数据中心相关企业主要面临三个挑战:
首先是如何在确保计算与存储能力提升的同时,建设可持续发展的数据中心;
第二个挑战是在数字化基础设施方面,如何更好地利用覆盖全生命周期的数字化软件,贯穿设计、建造和运营维护,从而提升速度、准确性和可持续性;
第三个挑战是如何实现由传统基础设施建设向智能、数字化的基础设施转变。
其中,传统的基础设施之所以面临挑战,与生成式人工智能(如ChatGPT)的涌现和AI相关的数据需求激增密切相关。
为了更好地实现大规模的高性能计算,数据中心需要解决由人工智能工作负载、GPU的热设计功耗(TDP)、网络延迟、人工智能集群规模所带来的一系列问题。因此,拥有更智能与数字化的物理基础设施,将成为AI席卷下数据中心升级过程中的重要发力点。
锚定关键挑战 重塑高性能数据中心
数据中心基础设施演变涉及供配电、制冷、机柜等多个方面。依托前沿的行业洞察和丰富实践经验,施家基于创新技术与解决方案,融合数字化服务与创新型服务,为数据中心的重塑提供四个可靠思路。
01优化供配电系统,提高数据中心韧性
AI工作负载主要分为训练和推理。训练所需的大规模机柜阵列,组成了“人工智能集群”,增加了供电压力。而推理所需工作负载通常为业务关键型负载,需要具备更高韧性。因此,我们可采取以下5点措施,对供配电系统进行优化:
加大配电模块的规格,满足高密度集群的需求。
改用多个现成的标准rPDU,或采用额定电流大于60A和63A的定制化rPDU增加容量。
通过弧闪风险评估和负载分析,使用适当的连接器、插座和rPDU,以减少弧闪危害。
人工智能负载缺乏变化,易增加上游断路器脱扣的风险。需确保主断路器与负载总和匹配,不建议过载使用。
分析人工智能集群内的所有负载,以确保使用适当的连接器和插座。避免机柜温度过高,增加故障风险和安全隐患。
02改变传统的制冷方式,从风冷转向液冷
尽管风冷一直是IT行业的主流选择,但大型人工智能集群中的服务器难以分散放置等诸多因素,正迫使数据中心逐渐从风冷向液冷转变。
然而,液冷的应用也存在很多的挑战,如缺乏标准化设计、缺乏运维经验等。数据中心需采取以下6点针对性措施,应对制冷挑战:
机柜功率密度20kW以下可采用风冷,人工智能集群机柜功率密度超过20kW,推荐采用液冷服务器。
部署液冷技术之前,需要对液冷负载和设施的现有条件进行设计评估。
由于不确定的未来TDP增加了制冷设计淘汰的风险,建议在设计制冷系统时要考虑到风冷和液冷技术的兼容性。
由专家对液冷设计进行全面评估,并制定详细规划,减少操作失误和故障风险。
选择可靠的供应商,并应制定应急操作流程(EOP),减少IT机柜内漏液的风险。
为实现可持续发展,建议使用采用水作为冷却液的冷板式液冷。
03升级所需机柜,实现量体裁衣
由于人工智能服务器深度和重量不断增加,因此,机柜也需要针对性变化,以适配优化后的机群。
建议至少采用750毫米宽的机柜,以容纳所需的配电和制冷装置安装空间。
为IT机柜配有可调节的安装轨道,以适应不同IT设备深度。
建议将人工智能训练集群部署在48U或高度更高的机柜上。
建议指定机柜的静态承重能力大于1,800kg,动态承重能力大于1,200kg,并评估数据中心地板,确保其满足承重需求。
04应用软件工具,赋能运营管理
在管理人工智能集群时,应用软件工具可降低复杂电气网络出现意外故障的风险,并为布局的决策提供依据。其中,EPMS和DCIM能准确查看当前的配电能力及其趋势,包括IT空间内的大容量电力和配电级别,电气设计(又称电力系统工程)软件工具可简化数据收集和计算工作,数字化单线图(iSLD)优化安全评估过程,更是让维护工作的复杂性大大降低。
通过软件工具,对整个IT空间(包括机柜中的设备和虚拟机)创建数字孪生,实现数据中心可视化,也能尽可能增大动态环境中的容错裕量,降低运营风险,解锁数据中心运维的“新境界”。
凡事预则立,无论是“东数西算”工程,还是“算力基础设施高质量发展行动”等,都在进一步明确数据中心产业变革在加速推进。面对“万物皆可AI”的智算浪潮,施家正积极从产品、技术到服务多方面,持续赋能数据中心的升级迭代。
未来
以创新为引擎的施耐德电气
将持续以行业前沿理念为基础,推动面向未来的数字化基础设施建设,助力数据中心提升能效、提高可用性和实现可持续发展,帮助更多企业共赢数智未来。
审核编辑:汤梓红
全部0条评论
快来发表一下你的评论吧 !