华为发布全新昇腾950PR,Atlas 350单卡算力接近3倍于H20
电子发烧友网报道 近日,在中国合作伙伴大会2026上,华为发布并展出搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡Atlas 350。与前一代昇腾芯片相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。
昇腾芯片是华为AI算力战略的基石。自2018年发布首款昇腾310芯片,到2019年的昇腾910芯片,再到2025年昇腾910C芯片随Atlas900超节点规模部署,昇腾系列芯片逐渐走进大众视野。
去年9月华为全联接大会2025上,徐直军首次介绍昇腾950系列芯片,宣布昇腾950PR将于2026年第一季度推出,支持标卡和超节点服务器产品形态。该系列分昇腾950PR和昇腾950DT,前者面向Prefill和推荐场景,采用自研低成本HBM HiBL 1.0,可降低推理及推荐业务投资。
与前代相比,昇腾950PR提升显著。Atlas 350单卡算力达英伟达H20的2.87倍,是国内唯一支持FP4低精度的推理产品,HBM容量是H20的1.16倍,达112GB,多模态生成速度提升60%,内存访问颗粒度减小,小算子访存效率提升4倍。支持FP4意义重大,是用精度换效率的极致推理方案,70B参数模型仅需35GB显存,单卡可加载,推理延迟大幅降低。展厅显示其FP4精度算力1.56P,带宽1.4TB/s,功耗600W,是H20的1.5倍。
单卡指标上,昇腾950PR与英伟达H20不相上下,但在FP8/FP16算力及显存带宽上与H200有差距。不过在训练场景,华为提出超节点战略,今年巴展上展示的Atlas 950超节点,最大支持8192张昇腾950DT卡全光互联,与英伟达计划2027年上市的NVL576相比仍有优势。
在会上,华为的七大核心合作伙伴——昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信发布基于Atlas 350的服务器整机产品,标志昇腾950代际推理算力正式进入商用阶段。
其中,软通动力旗下软通华方发布的“超强A860 A5”引人关注。软通动力相关负责人称其为赋能大模型时代的“核武级”算力。这款6U2路AI服务器,搭载鲲鹏920新型号处理器,支持8块昇腾Atlas350加速卡,具备超强算力、灵活拓展、安全可靠等特性,适用于AI大语言模型训练和推理、AI加速计算、视频分析等场景。
科大讯飞集团副总裁、星火企业军团总裁刘江表示,讯飞新一代星火大模型将与昇腾910/950系列算力底座充分适配,为用户提供整体AI解决方案。会上,昇腾联合20家行业头部伙伴发布2026昇腾AI应用场景解决方案,覆盖辅助办公、电子病历等多个行业核心场景,以“轻量部署、快速落地、可规模复制”的特点,破解行业智能化部署复杂、周期长的痛点。
技术突破后,生态建设是关键。2025年8月5日,华为明确昇腾全量软件开源开放。截至目前,CANN等软件已完成架构解耦,安装包从8个拆分为29个,支持开发者按需使用,编译效率提升58%。华为还将全流程支持和贡献三方开源生态,从算子编程框架Trion到AI框架PyTorch,再到训推加速引擎FSDP、vLLM等,已累计支持50多个三方开源社区和项目,贡献650多个关键特性。
为体现昇腾易用性,华为昇腾计算业务总裁张迪煊提到,智谱基于昇腾在3个月内完成多模态大模型GLM-Image的训练,该模型创新采用自回归加扩散的混合架构,开源不到24小时登顶全球最大开源社区Hugging Face的Trending榜单,证明昇腾可训练出世界级领先大模型。
当下“养虾”热潮激起一体机需求,过去一个多月已有十几家合作伙伴推出基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造400多款行业一体机,服务客户逾2700家,占据国内一体机市场80%以上份额。
全部0条评论
快来发表一下你的评论吧 !