阿里旗下平头哥自研GPU芯片已实现规模化量产

描述

近日,阿里旗下平头哥自研GPU芯片已实现规模化量产,累计交付量达到47万片,其中超过60%的算力服务于外部商业化客户,覆盖互联网、金融、自动驾驶等核心场景。阿里集团CEO吴泳铭更是放出豪言:目前阿里的服务器内几乎没有一张卡是闲置的,基于未来三到五年的需求判断,公司大量投入AI数据中心的回报"非常确定"。

受此消息驱动,阿里宣布将超出此前计划的3800亿元资本支出,未来数据中心规模将实现对比2022年十倍以上的增长。

平头哥的GPU故事要从2019年说起。那一年,阿里成立平头哥半导体有限公司,立志自研芯片。从最早的玄铁RISC-V处理器,到后来的含光800 AI推理芯片,再到如今的GPU产品线,平头哥走过了一条从IP授权到自研芯片、从单点突破到全栈布局的完整路径。

此次财报披露的47万片交付量,是平头哥GPU从"能用"走向"规模商用"的关键里程碑。更值得关注的是,这47万片中有超过60%并非阿里自用,而是卖给了外部客户。这意味着平头哥的GPU已经通过了互联网大厂、金融机构、自动驾驶公司等高要求客户的实际业务验证,不再是内部"自产自销"的试验品,而是真正具备市场竞争力的商业化产品。

在当前全球高端GPU被英伟达高度垄断的背景下,平头哥能拿到如此规模的外部订单,本身就说明其产品在性价比、适配性或供应链安全等维度上找到了差异化的生存空间。

吴泳铭在财报电话会上的表态颇为罕见。他直言,阿里服务器内几乎没有一张GPU是闲置的。这句话同时透露了两层信息:一是阿里自身的AI业务对算力的需求已经到了极度饥渴的状态;二是平头哥的产能基本被吃满,供不应求。

这与几个月前英伟达CEO黄仁勋的表态形成了有趣的呼应。黄仁勋说全球对AI算力的需求"远远超过供给",而吴泳铭用自家数据中心的运转实况给出了中国视角的注脚。当全球都在抢卡的时候,阿里选择了一条不同的路——自己造。

吴泳铭进一步表示,基于未来三到五年的需求预判,阿里大量投入AI数据中心的投资回报"非常确定"。这一判断的底气,一方面来自阿里云AI相关收入的持续高增长,另一方面也来自平头哥自研芯片带来的成本优势。不用完全依赖英伟达的高价GPU,意味着阿里在算力成本上拥有更大的主动权。

阿里原本计划在未来几年投入约3800亿元用于AI基础设施建设。但最新财报显示,这一数字将被大幅超出。吴泳铭透露,未来阿里数据中心的规模将对比2022年实现十倍以上的增长。

十倍是什么概念?2022年阿里的数据中心算力规模已经位居全球前列,十倍增长意味着阿里正在以一种近乎激进的速度扩建AI基础设施。这背后的逻辑很清晰:大模型训练和推理对算力的消耗远超传统云计算,而阿里既是算力的最大消费者之一,也在通过平头哥成为算力的供给者。自建芯片加自建数据中心,阿里正在走一条类似亚马逊AWS加自研Graviton芯片的全栈路线。

在英伟达一家独大的GPU市场,自研芯片是一条投入巨大、回报不确定的路。但对阿里而言,这几乎是必选项。

首先是成本。英伟达的高端GPU价格持续走高,H100和Blackwell系列的单卡价格已达数万美元,且供货紧张。自研GPU能大幅降低阿里云和自身AI业务的算力成本。其次是供应安全。在中美科技博弈持续升级的背景下,高端芯片的出口管制随时可能收紧,拥有自研GPU意味着阿里不会被"卡脖子"。最后是差异化。平头哥的GPU可以针对阿里自家的大模型和业务场景做深度优化,在能效比和性价比上做出英伟达标准品无法提供的定制能力。

当然,挑战同样巨大。GPU的生态壁垒远比CPU更高,CUDA生态的护城河不是一朝一夕能翻越的。平头哥能否在软件生态上打开局面,让开发者愿意迁移,将决定这47万片的交付量是起点还是天花板。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分