电子发烧友网报道(文/李弯弯)近些年,我国算力设施建设发展迅速,截至今年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模约2000万台,算力总规模超过150EFlops,近五年年均增速超过30%,算力规模排名全球第二。
算力作为数字经济的核心生产力,正在像水和电一样成为人们社会活动中不可或缺的基础需求,根据《中国算力发展指数白皮书》,每1元的算力投入,可以带动3-4元的经济产出,因此在算力的发展上持续投入意义重大。
数据中心投资,将以每年超20%的速度增长
数据中心是算力的承载基础。为了推动数据中心协同化、规模化发展,今年初国家正式启动“东数西算”工程,同时在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,8个算力枢纽内规划设立10个数据中心集群。
日前国家发改委创新和高技术发展司副司长孙伟透露,今年以来,全国10个国家数据中心集群中,新开工项目25个,数据中心规模达54万标准机架,算力超过每秒1350亿亿次浮点运算,约为2700万台个人计算机的算力,带动各方面投资超过1900亿元。预计十四五期间,大数据中心投资还将以每年超过20%的速度增长,累计带动投资超过3万亿元。
从目前的竞争格局来看,我国数据中心主要以电信运营商为主导,凭借着网络带宽、机房资源和资金等优势,占据超过60%的市场,第三方IDC厂商正在加速发展,位列数据中心行业第二梯队,另外,云服务厂商,基于自身业务需求,也在积极建设云基础设施。
那么接下来算力发展呈现怎样的趋势呢?在日前举办的首届中国算力大会上,中国电信董事长柯瑞文谈到,传统的单一算力将逐渐发展为通用算力、智能算力、超算算力以及前沿算力等专业化算力体系,算力资源正在从集中部署方式向中心+边缘的多级化方向发展,双碳战略将进一步加快算力向绿色低碳方向演进。
在低碳战略目标下,如何降低能耗是产业界极为关注的话题。柯瑞文表示,中国电信持续建设新型绿色数据中心,采用深度定制服务器、优化资源运营调度等手段提升算效水平,加大信息基础设施共建共享力度,自研基站采用AI节能技术,推进低集成度、小容量、高能耗的老旧设备逐步退网。公司引入绿色电能,不断提升可再生能源占比,在青海地区打造了国内首个100%清洁能源可溯源的零碳绿色数据中心。
华为在降低数据中心能耗方面也做了很多研究,要降低能耗,数据中心要能实现自然冷却,并具备能效自动优化能力,来高效利用自然冷源,据报道,华为的间接蒸发冷却结合AI能效优化技术,只需一次换热,可让PUE(数据中心能耗指标)低至1.15,与传统方案相比,能效提升15%以上,节省用水超过33%,成为自然冷却代表性的技术。
华为认为,未来是多样性算力并存时代,针对超级计算、智能计算及部分高密基础算力场景,基于间接蒸发冷却的风液融合和热回收技术,将有利于数据中心全面降碳。
数据中心产业链上游芯片企业将受益
算力产业链主要由算力基础软硬件构成,包括芯片、服务器、交换机、光模块、路由器、操作系统等,服务器是数据中心基础设施的重要组成部分,在硬件成本中占比70%左右。
从服务器的构成来看,主要由CPU、GPU、PCB主板、DRAM、SSD、BMC、电源、内存、风扇和总线等部分组成。其中,CPU、GPU 决定了服务器的算力。
根据IDC的研究数据,CPU、GPU、DRAM三个模块的芯片成本在基础型服务器中占比约30%。在更高性能的服务器中,芯片成本占比达50%-80%。
目前这几类芯片多由国外的英特尔、英伟达、AMD等厂商供应,另外还有博通、高通、Marvell等,比如英特尔,该公司数据中心与人工智能集团副总裁兼中国区总经理陈葆立日前表示,面对日益多元的数字化创新需求,英特尔提出XPU产品战略,提供从CPU到GPU、FPGA、IPU等多种异构算力资源,迄今为止已有总数超过10亿颗英特尔至强处理器核心部署在云上,超过100家中国云服务商和互联网公司采用该处理器。
另外值得关注的是,随着数据规模爆发式增长和算法模型复杂化程度加深,具备AI芯片级服务器、高速互联、深度学习的智能计算数据中心将实现规模落地,这将会给不少新兴的AI芯片厂商带来机会,比如昆仑芯、天数智芯等。
昆仑芯科技目前已实现两代AI芯片产品的量产及规模落地,昆仑芯1代、2代及多款基于自研芯片的AI加速卡,在互联网、智算中心、智慧城市、生物计算等领域均有规模部署,
其中昆仑芯2代AI芯片搭载新一代自研架构昆仑芯XPU-R,采用7nm先进工艺,是国内首款采用GDDR6显存的通用AI芯片,相比1代产品,昆仑芯2代AI芯片的通用计算核心算力提升2-3倍,性能超过市场领先水平,可为数据中心高性能计算提供高达256 TOPS@INT8及128 TFLOPS@FP16算力,且支持高性能硬件视频编解码。
天数智芯全自研云端训练通用GPU芯片天垓100是国内第一款全自研、GPU架构下的云端训练芯片,采用7纳米制程工艺和2.5D CoWoS晶圆封装技术,集成240亿晶体管,多精度数据类型支持标准/混合训练。
凭借GPU架构、通用性的指令集和完善的算法,目前天垓100已支撑百余个客户进行超过两百个不同种类模型训练,ResNet50、SSD、BERT等骨干网络模型的性能接近国际主流产品。
天垓100还支持传统机器学习、数学运算、加解密及数字信号处理等领域,当前广泛适用互联网、运营商、智能安防、生物医疗、教育科研、智算中心等不同行业众多应用场景。
小结
从目前的情况来看,我国在算力建设方面已经取得非常优秀的成绩,算力作为数字经济的核心生产力,未来还需要持续投入,另外在双碳战略背景下,绿色低碳化发展将会未来趋势,因此产业链企业也在积极探索降低功耗的策略。另外目前数据中心不少重要芯片仍然由国外厂商供应,未来在这方面还需要有所突破。