百亿Token一分钱!云天励飞喊出“推理成本万倍降”,公布三年三芯路线图

描述

电子发烧友网报道(文/莫婷婷)当前,全球人工智能迈入具身智能(Agentic AI)时代,云天励飞董事长兼CEO陈宁博士在“大算力芯片战略前瞻会”上强调:公司将聚焦大模型推理芯片。在大会上,云天励飞阐述了GPNPU架构的技术内涵,并公开了未来三年大算力芯片路线图,致力于成为“最懂AI的推理芯片领军企业”。

AI
 
GPNPU:打造中国版TPU的最优解

自2025年起,AI推理芯片将迎来未来5至10年的高光时刻,核心驱动力在于大模型推理需求的爆发式增长——尤其是Token数量的指数级攀升。
 
以字节跳动的豆包为例:2024年5日均Token量仅为0.12万亿;到2025年9月,已飙升至30万亿;仅三个月后(2025年12月)便突破50万亿。按此每季度近翻倍的增速推算,当前日均Token量很可能已达70–80万亿。
 
AI

大模型训练与推理在计算范式上的根本差异:训练追求算力绝对值、高精度和大规模集群互联,而推理则聚焦成本敏感、能效比与极致性价比。训练芯片需要百万卡级的高性能互联,依赖FP64/32/16等高精度计算,对成本不敏感;而推理场景——如手机上的豆包、耳机中的同声传译、眼镜里的智能助手——更关注每个Token背后的真实成本。
 
陈宁博士表示,云天励飞将持续推进“百万Token推理成本每年两位数下降”的目标,力争到2030年实现“百亿Token仅需一分钱人民币”,最终达成“推理算力平权”。
 
面对全球AI算力重心从训练向推理迁移的历史性拐点,云天励飞指出“训练追赶、推理超车”是公司未来五年的核心策略。2025年,云天励飞提出其第五代芯片架构——GPNPU。
陈宁博士表示, GPNPU架构是大模型推理的最佳载体。
 
GPNPU是一套覆盖硬件微架构、系统集成和软件生态的综合解决方案,其本质是“GPGPU + NPU + 3DM + 算力积木”四维融合,具备了通用性、高效性、大带宽、低延时等特点,且采用了算力积木架构。
 
云天励飞CTO李爱军进一步介绍,GPNPU实现对CUDA兼容,支持“一行代码迁移”;采用NPU级SIMD矩阵计算单元,实现单位面积更高的计算密度;该架构引入自研3D Memory堆叠架构,带宽达HBM的10倍,有效破解“内存墙”瓶颈;通过3DM高效访存架构实现10纳秒级延迟,满足实时交互类应用需求。
 
值得一提的是,云天励飞在过去五年深耕国产工艺,率先探索了 Chiplet算力积木架构,而这一架构与当前大模型推理所需的超节点设计理念异曲同工。为此,公司定义下一代芯片的Scale-Up超节点架构,从而高效支撑万亿级乃至十万亿级MoE大模型的推理需求。云天励飞也是国内少数掌握D2D Chiplet和C2C Mesh互连技术的企业之一。

 AI
李爱军提到,GPNPU系统级芯片,相比当前主流以训练为主的GPGPU架构,在推理效率、性能表现和成本控制方面均实现了显著领先。更进一步的在Agent 时代,多模型、多智能体的自主多模型的推理时代,对于推理的时延到了毫秒级,这个时候我们的领先优势将会实现跨代的领先。
 
公布三年三芯路线图

在发布会上,云天励飞公布了未来三年大算力芯片规划,以“PD分离 + AFN细粒度优化 + 超节点集群”为核心设计理念,精准应对大模型推理中prefill(计算密集)与decode(访存密集)阶段的不同需求。
 
2025年:推出第一代超节点P芯片(DeepVerse 100),专注百万长上下文场景的prefill推理,算力对标英伟达Hopper架构的H100;
 
2026年:发布第一代超节点D芯片(DeepVerse 200),聚焦超低延迟decode推理,性能看齐Blackwell架构的B200;
 
2027年:迭代至第二代超节点P芯片(DeepVerse 300),实现毫秒级端到端推理时延,算力目标直指英伟达下一代Rubin架构。
 
AI

云天励飞以大模型推理为核心应用场景,覆盖大模型云推理、多模态理解等当前主流。云天励飞透露,公司的产业也可以应用到深空探测领域,推进“算力进太空”,开启AI航天新篇章。
 
目前,云天励飞已构建多元化的生态布局,其客户群体包括AI大模型企业、涵盖互联网大厂、科技领军企业等行业头部客户,以及政企与基础设施客户。
 
可以看到,云天励飞不仅拥有领先的技术,还具备强大的供应链韧性与交付能力。尤为值得关注的是,云天励飞已成功实现全国产化工艺闭环。仅用五年时间,公司完成了从芯片设计、先进制造工艺到先进封装的全链条自主可控,并推动全国产推理算力芯片持续迭代。
 
至今,云天励飞已构建“1+4”组织架构,包括:
 
政企事业部:作为公司基石,聚焦智慧城市、交通、安防等领域,正在规划建设区域级千卡智算集群,赋能城市级AI渗透;
噜咔(Luka)事业部:打造面向儿童的AI原生硬件智能体,被内部称为“Token吞金兽”,有望成为消费级爆品;
岍丞(Qiancheng)事业部:蓝牙耳机模组年出货超3200万颗,占中国手机品牌35%以上份额,2026年将启动自有AI C端品牌探索;
智算事业部:服务互联网大厂与运营商,已斩获16亿大单,正与多家头部客户推进深度合作。
 
这四大事业部,让云天励飞形成从技术研发到市场落地的完整闭环。
 
 
小结

站在第四次工业革命的门槛上,云天励飞正以GPNPU为支点,撬动中国在全球AI基础设施格局中的新地位。在发布会上,云天励飞强调,“到2030年,通过GPNPU推理架构的持续创新,坚定推进百万Tokens推理成本万倍降低,最终实现推理算力平权!”
 
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分