近日,NIDA发布的《工信部首提数据通信产业,赋能算力互联网新征程》一文引发广泛关注。文章解读工信部最新发布的《算力互联互通行动计划》,清晰地揭示了数据通信产业与算力互联网之间千丝万缕的联系。
算力互联网,作为互联网面向算力应用与调度需求进行能力增强和系统升级形成的新型基础设施,其构建离不开高速、稳定、低延 迟的数据通信网络。数据通信产业像是一条条坚固的“纽带”,负责将这些算力资源高效地连接起来,让数据能够在其间稳定、快速传输,进而达成全网异构算力的协同运作。
其中,“跨域算间无损互联”是算力互联网的核心目标之一,旨在打破算力孤岛,实现全国公共算力标准化互联,提升算力资源利用效率。而华为推出的AI WAN智算IP广域网解决方案通过一系列技术创新,有效解决了跨域算间无损互联的难题,为算力互联网的发展提供有力支撑。
在长距无损传输方面
跨DC协同训练算力卡之间的通讯距离扩展到几百甚至上千公里,而传统广域网在长距离传输时,网络拥塞极易导致延迟增加与丢包现象,这将直接带来训练效率的大幅下降。华为AI WAN智算IP广域网通过部署星河AI路由器,实时感知网络拥塞状况,一旦出现拥塞迹象,便迅速对数据流进行精准流控,实现了千公里0丢包,保障了跨DC协同训练时数据传输的可靠性,如同为算力互联网铺设了一条“高速公路”,使不同地区的数据中心能够紧密协作。
在高运力网络构建方面
随着模型规模和数据量呈指数级增长,跨DC协同训练中大规模数据并发传输对带宽提出了极高要求。华为AI WAN智算IP广域网部署星河AI路由器,通过内置大数据流识别的AI能力,并对负载分担算法进行精细化优化,实现千万流的秒级调度,大幅提升了网络带宽利用率,极大地满足了大数据流传输需求,使得数据能够快速抵达各个计算节点,加速训练进程,为算力互联网的高效运行提供充足的“运力”保障。
在全局协同调度方面
华为AI WAN智算IP广域网实现不同DC跨广域网的全局协同调度,从全局视角对各数据中心的算力资源、网络资源和任务分配进行统一管理和优化,智算流量在传输过程中全程可视可管,实现不同数据中心跨广域网的全局协同调度,确保训练任务的高效进行,充分发挥各数据中心的优势,让算力互联网中的各个“齿轮”能够紧密咬合、协同运转。
在实际落地应用中,华为配合多家运营商客户完成现网验证,通过部署华为星河AI路由器,保障流量在智算网络中高效传输和安全性,实现长距跨AIDC联合训练且算效不下降,业务吞吐率达到95%以上。
华为AI WAN智算IP广域网解决方案凭借上述技术创新,成功突破了跨域算间无损互联面临的技术瓶颈,为算力互联网的建设提供了坚实的技术保障与实践经验,推动着算力互联网从概念逐步走向现实,让算力资源在更广阔的范围内实现高效流通与协同,推动了算力互联互通的进程。
全部0条评论
快来发表一下你的评论吧 !