云天励飞亮相ICCAD-Expo 2025

描述

当大模型从技术探索迈向规模化应用深水区,“算力供需失衡”与“推理成本高企”已成为制约产业发展的关键瓶颈。

在近期举办的ICCAD 2025“IC设计与应用创新论坛”上,云天励飞副总裁罗忆发表主题演讲,立足全球AI算力格局从训练转向推理的时代变局,解读了通过基础设施优化实现推理降本的核心逻辑,并重点分享了云天励飞创新的GPNPU架构,为国产AI芯片的发展提供了切实可行的思路。

行业双拐点将至:推理算力成主力,国产芯片迎替代窗口期

“从训练‘狂飙’到推理‘深耕’,AI产业正进入价值落地的关键阶段。”罗忆在演讲中开篇点题。他引用数据称,2025年年中我国AI日均Token推理量已突破30万亿,一年半内增长超300倍;预计到年底,AI推理算力消耗将首次超过训练,成为驱动算力需求的核心引擎。

与此同时,国产芯片的替代浪潮正在加速。在海外高端GPU供应受限及国内“人工智能+”行动等政策支持的双重影响下,国产AI芯片市场占比持续提升,预计年底其使用量有望首次超越国外芯片,迎来历史性的替代窗口期。罗忆强调:“第四次工业革命中,AI推理芯片是核心。中国要实现算力自主可控,必须在效率与成本上找到差异化突破路径。”

解码AI推理降本:四个维度协同优化提升大模型推理性价比

大模型规模化落地的核心挑战,在于“效果-性能-成本”的平衡难题,高质量大模型推理的百万Token成本高企,是产业规模化的重要瓶颈。

云天励飞给出了“Token经济学公式”:百万Token成本 = (年资本开支+年营运成本) ÷ (加速卡年吞吐量×设备利用率),将大模型推理成本优化指向“硬件投入、运维消耗、软件优化、生态适配”四个维度。

云天励飞解法:GPNPU 打造国产自主算力底座

面对国产工艺约束与产业规模化需求,云天励飞创新性提出 GPNPU架构,核心是融合 GPU 的通用性与 NPU 的高能效,通过“算力积木” 架构、3D 堆叠存储等关键技术破解行业痛点。“算力积木” 架构实现了国产工艺下的全链路自主可控,达成 “一次流片、多规格输出”,算力覆盖 8T 至 256T,贯穿端、边、云全场景部署需求。

罗忆最后提到,云天励飞正加速迭代第五代GPNPU架构“Nova 500”,聚焦带宽与能效升级,全力冲刺“百万Token成本1元内”目标。未来,云天励飞愿携手产业链伙伴,让算力从精英资源走向普惠,成为社会智能化的公共底座,为中国抢占第四次工业革命制高点贡献力量!

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分