华为郑晓龙受邀出席CNCC 2025并发表主题演讲

华为数据通信 2025-10-30 660

描述

第22届中国计算机大会（CNCC2025）在“冰城”哈尔滨盛大启幕，主题为“数智赋能，无限可能”。华为数据通信产品线研究部部长郑晓龙在大会上发表题为《大模型推理加速与演进：网络如何破局？》的演讲，首次提出“网络+”破局模型，为十万卡智算集群面临的通信瓶颈提供了创新方案。他指出，在单卡算力提升日益趋缓的背景下，唯有通过网络、计算与存储的跨层协同，才能将集群效率推向全新量级。

为支持十万卡智算集群的规模化部署与高效运行，华为提出“网络+”破局模型，旨在系统化解决超大规模集群中的通信瓶颈问题。该主题演讲涵盖架构设计、协议优化与调度策略等多个层面，为构建下一代智算基础设施提供完整技术路径。

网络级负载均衡，应对大EP部署带来的动态通信模式挑战，性能提升20%+。

DeepSeek的出现，将大模型架构引向了更稀疏的大EP部署。随之而来的是通信模式及通信关系的变化。面对通信的随机性和非对称性，华为提出的网络级负载均衡，将通信性能提升20%+，显著降低P99完成时间。

从Chat LLM进入Agentic AI，“超节点”助力实现极致的TPOT需求

大模型应用从聊天式的Chat LLM向Agentic AI演进，对于token生成速度的要求从50ms提升到了10ms以下。这在当前的部署实践中，存在多个挑战：推理阶段以小消息通信为主，控制面时延占比高；单纯卸载控制面，则会消耗计算资源SM。华为推出了CloudMatrix384超节点及对应的超节点网络，为满足极致的TPOT需求提供了可能。

多模态LMM流量混战，网络调度“四两拨千斤”，提升推理性能

大模型从语言文本的处理向多模态转变，智算集群内的流量模式也更加复杂。采用EPD分离的部署方式，引入EP和PD之间的传输流量，与推理的all2allv等集合通信流量相互干扰，对应用性能产生很大影响。华为提出了针对不同流量类型进行网络识别、隔离不同推理流量、进行差异化调度、提升推理性能的技术目标。

“网络+”不是简单的带宽升级，而是让网络成为AI集群的‘第七代算力’。”郑晓龙最后呼吁，华为愿与业界共建标准，与合作伙伴及行业组织一起，共同定义大模型时代的下一代智算网络接口。

打开APP阅读更多精彩内容