电子发烧友网报道(文/梁浩斌)AI技术在近年快速发展,应用领域越来越广泛的同时,也带来了巨大的算力需求,数据中心建设规模不断扩大,算力芯片功率越来越高,导致数据中心的能耗暴增。
有数据显示,目前全球正在建设或处于不同开发阶段的数据中心有7000多个,是2015年的2倍。而目前全球数据中心消耗的电力大概占总电力消耗的1%至2%,预计到2030年,数据中心电力需求还会增长160%,到本世纪末,数据中心在全球电力消耗占比可能高达4%。
根据国家能源局数据,2022年中国数据中心耗电量达到2700亿千瓦时。预计到2030年耗电量将飙升至接近4000亿千瓦时,这是什么概念?三峡电站年设计发电量仅882亿千瓦时。
因此,解决数据中心电力消耗高的问题,一方面是提高使用清洁能源的比例或增加发电量,另一方面是从数据中心本身着手,提高效率,降低能耗。
为降低数据中心能耗作出的努力
数据中心的能耗主要来自于几大部分,包括核心的服务器机柜中各种设备;为机房提供恒温恒湿的精密空调,以及服务器板卡上的散热风扇,甚至是水冷系统等;供配电系统,比如变压器、不间断电源(UPS)、配电柜等,它们在电能转换和分配过程中也会产生能耗。
当然最关键的就是算力芯片,比如英伟达最新推出GB200AI加速卡由2个B200 GPU和一个Grace CPU组成,估算单卡的峰值功率将高达2700W。
而一个用于训练万亿参数级别大模型的数据中心,过去动辄需要超过上万块AI加速卡。以英伟达2017年推出的V100 GPU来看,当时单卡最大热设计功耗是250W,FP64算力是7TFLOPS,FP32算力是14TFLOPS。
通过在过去几年工艺制程的提升,以及芯片架构设计上的改进,从V100到A100再到H100,2022年H100的最大热设计功耗是300W-350W,相比V100提高了20%到40%。但同时它的算力增长幅度更大,FP64算力26TFLOPS,相比V100提升371%;FP32算力51TFLOPS,相比V100提升364%,能效比提升幅度巨大。
而GB200更是采用NVLink-C2C 片上互联技术,集成两个GPU和一个CPU核心,构成一个超大芯片,这是封装和高速互连技术所带来的提升。
所以在算力芯片上,尽管摩尔定律式微,工艺制程带来的性能提升越来越小,但英伟达CEO黄仁勋又提出了“黄氏定律”,GPU能效每两年将增加一倍以上。除了芯片工艺制程之外,芯片架构设计、封装技术的发展,依然能够推动GPU能效的持续提升。
在算力芯片之外,数据中心的电源、供配电系统也是能耗大户。数据中心的电源效率通常用电源使用效率(PUE)来衡量,PUE是数据中心消耗的所有电力与IT设备使用的电力之比。PUE的值越接近1,表示数据中心的电源效率越高,能耗越低。
简单来说就是,当数据中心的所有电力消耗都被用于真正起到计算和存储作用的机柜时,PUE就是1。但由于数据中心还有空调、供配电、监控、建筑照明等外围用电设备,所以在实际应用中PUE远大于1。
根据2018年的统计数据,全球数据中心的PUE平均值为1.58。一些地区或国家可能有更严格的要求,比如在中国,北京和深圳对新建数据中心的PUE要求在1.4以下,上海的要求更为严格,要求PUE达到1.3以下。
为了降低PUE,有些企业尝试在冷却上下功夫,比如微软在2018年启动了一项实验,在苏格兰海岸外 117 英尺的水下安装了拥有864台服务器的数据中心,测试利用海水散热降低数据中心能耗的可行性。2020年微软公布了测试结果,表示水下服务器的设备故障率仅为陆地数据中心的 1/8,同时海水温度稳定,可以稳定为服务器散热。然而有趣的是,微软今年却宣布未来不会在世界任何地方建设海底数据中心,耐人寻味。
除此之外,服务器电源转换效率对于目前功率越来越大的服务器来说,收益更大,因此近年服务器电源效率就受到了更多关注。
第三代半导体,助力服务器电源效率突破
服务器电源需要在服务器机架有限的空间里提供大功率供电,一方面需要更高的功率密度,其次是需要更高的转换效率。业界对电源有多个等级标准,比如铜牌电源的转换效率大于等于82%,在50%负载下效率要在85%以上;最高级的钛金牌电源,在50%负载下转换效率要达到96%,在10%和100%负载下效率也需要超过90%。
由于服务器需要常年24小时不间断运行,那么几个百分点的效率差距,就能产生巨大的成本收益。比如将1000W的服务器上的白金电源换成钛金级电源,每年可以节省200千瓦时电力消耗。如果在一个十万台服务器的超大型数据中心中,一年就可以节省2000万千瓦时,大大降低数据中心运营成本。
所以结合高效率和高功率密度的两大需求,第三代半导体开始应用到服务器电源上。比如华为PAC3000S12-T1钛金级3000W服务器电源,就采用了GaN功率器件,功率密度超过6W每立方毫米,转换效率超过96%,最高可达98%。
英飞凌今年发布的数据中心电源路线图上也表示,将推出两款混合使用硅、GaN、SiC三类晶体管开关以实现100W每英寸立方的高功率密度和97.5%的高转换效率的服务器电源,采用全数字控制交错式无桥图腾柱PFC搭配全桥GaN LLC电路设计。
英诺赛科去年推出了一款2kW的服务器电源方案,功率密度达到76W每立方英寸,效率达到96.5%,采用 InnoGaN 650V 氮化镓芯片以及图腾柱无桥 PFC+LLC 结构。
纳微半导体去年也推出了一款3.2kW数据中心电源平台,功率密度接近100W每立方英寸,且效率超过96.5%。按照此前发布的路线图,纳微半导体今年还将发布一款全新的4.5kW电源平台,将GaN技术和SiC技术结合,功率密度提升至135W每立方英寸以上,效率超过97%。
小结:
随着数据中心大基建时代加速,数据中心能耗将受到更多关注,从发电端到绿色能源利用再到降低数据中心能耗,或许还将加速更多的新技术发展以及落地。
全部0条评论
快来发表一下你的评论吧 !