华为郑晓龙受邀出席CNCC 2025并发表主题演讲

描述

第22届中国计算机大会(CNCC2025)在“冰城”哈尔滨盛大启幕,主题为“数智赋能,无限可能”。华为数据通信产品线研究部部长郑晓龙在大会上发表题为《大模型推理加速与演进:网络如何破局?》的演讲,首次提出“网络+”破局模型,为十万卡智算集群面临的通信瓶颈提供了创新方案。他指出,在单卡算力提升日益趋缓的背景下,唯有通过网络、计算与存储的跨层协同,才能将集群效率推向全新量级。

为支持十万卡智算集群的规模化部署与高效运行,华为提出“网络+”破局模型,旨在系统化解决超大规模集群中的通信瓶颈问题。该主题演讲涵盖架构设计、协议优化与调度策略等多个层面,为构建下一代智算基础设施提供完整技术路径。

网络级负载均衡,应对大EP部署带来的动态通信模式挑战,性能提升20%+。

DeepSeek的出现,将大模型架构引向了更稀疏的大EP部署。随之而来的是通信模式及通信关系的变化。面对通信的随机性和非对称性,华为提出的网络级负载均衡,将通信性能提升20%+,显著降低P99完成时间。

从Chat LLM进入Agentic AI,“超节点”助力实现极致的TPOT需求

大模型应用从聊天式的Chat LLM向Agentic AI演进,对于token生成速度的要求从50ms提升到了10ms以下。这在当前的部署实践中,存在多个挑战:推理阶段以小消息通信为主,控制面时延占比高;单纯卸载控制面,则会消耗计算资源SM。华为推出了CloudMatrix384超节点及对应的超节点网络,为满足极致的TPOT需求提供了可能。

多模态LMM流量混战,网络调度“四两拨千斤”,提升推理性能

大模型从语言文本的处理向多模态转变,智算集群内的流量模式也更加复杂。采用EPD分离的部署方式,引入EP和PD之间的传输流量,与推理的all2allv等集合通信流量相互干扰,对应用性能产生很大影响。华为提出了针对不同流量类型进行网络识别、隔离不同推理流量、进行差异化调度、提升推理性能的技术目标。

“网络+”不是简单的带宽升级,而是让网络成为AI集群的‘第七代算力’。”郑晓龙最后呼吁,华为愿与业界共建标准,与合作伙伴及行业组织一起,共同定义大模型时代的下一代智算网络接口。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分