作者Michael McNerney,Supermicro
在《液冷时代的到来,远超想象》中,我们探讨了液体冷却的兴起,以及为什么它对如今的数据中心如此重要。这篇文章将重点介绍每种液冷方案的细节和利弊,并提供一些初步指引,为不同类型的企业所适用的液冷方案提供相关说明和建议。
液冷技术主要有三种类型:直接冷却芯片、浸没式冷却和后门热交换器。就像我们在上一篇文章中探讨在数据中心的空气冷却和液体冷却方案之间如何做出选择时所说的那样,不同的部署项目和设备有着不同的需求,因此更适合采用某种特定的液冷方案。
直接冷却芯片
第一种方案采用所谓的直接冷却芯片(D2C)技术。大多数人都比较熟悉这种液冷方案,因为它在PC爱好者中广为采用。D2C装置让冷液流过发热的电子设备,直接吸收芯片产生的热量。之后受热的液体被泵入冷却系统,利用风扇和气流将其冷却至指定的温度。最后,冷却的液体回流至高温电子设备,开始下一个冷却循环。
D2C是一种非常可靠的冷却方式,但其装置比较复杂。大多数D2C装置都配备了多重液体“回路”,意即:将冷液泵送至计算机特定部位(如CPU、GPU和/或内存)以实现冷却。如果服务器机柜上有几十个CPU、GPU和内存插槽需要冷却,那么就必须设置多重回路。因此,许多企业选择创建水液分配模块,类似于机柜的PDU。这样可以更加轻松地创建和连接多重回路。
因为D2C仍然有赖于空气冷却,所以它并不是最有效的冷却方案,实际上,它的冷却效率只有70%左右。因此,许多制造商积极探索其他更有效率的液冷方案。
浸没式冷却
在D2C之后最直接的冷却方式是效率更高的浸没式冷却。浸没式冷却是指将整个服务器浸没在装有非导电液体的储罐中。当服务器释放热量时,周围液体的温度升高,同时液面也会上升,而冷液则从底部泵入储罐。接着,较热的液体被泵出储罐,在外部进行冷却。浸没式冷却是一个闭环,因此它不仅不需要风扇,而且实践已经证明它可以非常有效地移除CPU和GPU产生的热量。
浸没式冷却方案还有一个额外的优势,那便是可以提高硬件的寿命和可靠性,因为硬件不用暴露在氧气及其他腐蚀性材料中。阿里巴巴2018年开展的一项研究表明,对于在高海拔地区运行的服务器和数据中心来说,浸没式冷却的优势尤为显著。因为高海拔地区空气密度发生变化,空气冷却的效率往往有所降低。事实上,相较于所有其他冷却类型,浸没式冷却在高海拔地区的成功率最高。
然而,这并非意味着浸没式冷却是最佳解决方案。实施浸没式冷却的最大挑战是服务器和数据中心的长久以来的设计:目前的标准数据中心都是针对立式机柜而非立式储罐而建造。浸没式冷却储罐要求安装悬挂式升降机,以便将服务器从储罐中垂直吊取出来,但这样会导致成本高昂,一些数据中心根本不具备这样的条件。
此外,由于浸没式冷却储罐装满了非导电液体,因此维修浸没其中的服务器可能会相对费力。在技术人员对服务器进行操作之前,需要先将服务器从储罐中吊取出来,并清除掉所有液体。因此,大多数专家建议聘用浸没式冷却团队,以协助企业实施浸没式冷却方案。虽然这需要一定程度的资金投入,但其结果可以显著降低数据中心的总体功耗和成本。
后门热交换器
另外一种靠近热源散热的常用方法是安装后门热交换器(RDHx),从技术上来讲它并不属于液冷系统。RDHx是在现有立式机柜的背面安装一些附件,包括一系列有冷却液体流动的管道。有了RDHx冷却服务器背后的空气(废气),机柜本身就可以通过标准风扇冷却系统获得更加有效的冷却。
该方案允许数据中心保留其现有的空调系统,同时以较低强度运行。RDHx还可以连接传统的立式机柜和服务器,因此无需更换设备或重新设计数据中心。此外,许多RDHx还配备了湿度检测传感器,以便服务器在发生泄漏时自动关闭,从而更好地保障操作人员的安全。总的来说,RDHx方案成本更低,也更容易为许多企业所接受。
结论
每个企业和数据中心都有自己独特的需求,因此必须匹配最合适的冷却方案。总体而言,现有的众冷却方案都能够确保新一代系统以最高性能运行,同时降低数据中心的总体能耗,通过液冷方法提升服务器的电源使用效率(PUE)可谓极具吸引力。数据中心采用各种液冷技术可以将PUE降低至1.1到1.25,从而优化计算性能并大幅节省运营成本。
作者简介
Michael McNerney是Supermicro的市场营销与网络安全副总裁。他在企业级硬件领域积累了20多年的丰富工作经验,并在产品战略和软件设计方面创造了优秀的业绩。在加入Supermicro之前,Michael还曾在Sun Microsystems和惠普公司担任过领导职务。
审核编辑:符乾江
全部0条评论
快来发表一下你的评论吧 !