华为发布星河AI数据中心网络优雅自适应路由全网负载均衡技术成果

华为数据通信 2024-05-14 1838

描述

5月11日至12日，以“算力互联网与信息安全”为主题的泰山科技论坛在国家超级计算济南中心科技园隆重召开。论坛上，基于国家超级计算济南中心（以下简称“济南超算”）人工智能计算集群和山东算网环境，华为发布星河AI数据中心网络优雅自适应路由全网负载均衡（NSLB-gAR）技术成果，该技术针对AI时代对高有效带宽的需求，提出了创新性解决方案，旨在解决网络负载不均衡的问题。

超级计算

华为数据通信产品线数据中心网络布尔实验室主任郑晓龙发布NSLB-gAR技术成果

会上，华为数据通信产品线数据中心网络布尔实验室主任郑晓龙发布了联合济南超算测试优雅自适应路由全网负载均衡（NSLB-gAR）技术（以下简称“NSLB-gAR技术”）成果，他表示：“在AI技术日新月异的今天，业务需求的激增和大模型计算应用的兴起正深刻影响着我们的工作和生活。这一趋势不仅使得算力需求急剧增加，还对算力效率和算力可用率提出了更高的要求。

面对以上挑战，华为推出了创新的NSLB-gAR技术，目的是解决AI网络因Hash不均导致链路拥塞，带宽利用率下降问题。为了验证这项技术的实际应用效果，我们基于济南超算的人工智能计算集群和山东算网环境进行了性能测试。

测试结果表明：使用华为的NSLB-gAR技术，星河AI数据中心网络在集合通信测试中比InfiniBand（IB）网络平均有效吞吐提升了10%；在GPT1.3B模型的训练中性能比传统以太ECMP网络提升了15.3%。这些结果进一步证实了NSLB-gAR技术能够有效保障AI网络的超高吞吐，为AI算力集群保驾护航。”

面向未来，华为将继续深化与行业伙伴的开放合作，紧密把握行业发展动态，深入探索不同领域的应用需求，持续推进数据中心网络领域技术创新，助力AI产业高速发展，为产业发展创造更大价值。

审核编辑：刘清

打开APP阅读更多精彩内容