苹果转向谷歌芯片训练AI,或成弃用英伟达GPU首例

描述

  在7月29日这个令全球瞩目的日子里,苹果公司对外展示了其iPhone AI应用的首次预览版本,并同步发表了相关研究论文,而这篇论文十分明确地指出,苹果的深度学习人工智能模型正是在Google的TPU(张量处理单元)之上得到锻炼与提升的。在这篇论文中,我们可以详细了解到苹果为了支持其Apple Intelligence功能而精心打造的基础语言模型,其中包括一个专为在设备上高效运行而设计的大约三十亿参数模型以及一个基于私有云计算的云端大模型。

  苹果公司在其官方发布的论文中对基础模型的建模过程进行了全面概述。

  值得注意的是,苹果在发布的论文中明确表示,他们在八千一百九十二片TPU v4芯片上成功训练了云端AFM(Apple Foundation Model),并且采用了四千零九十六的序列长度和四千零九十六个序列的批量大小,完成了高达六点三万亿token的训练任务。同时,端侧AFM则在两千零四十八片TPU v5p芯片上进行了深度强化训练。由此可见,苹果此举无疑彰显了其在人工智能训练领域对包括英伟达图形处理单元在内的其他解决方案的探索意愿。

  此外,根据某些具有影响力的芯片行业媒体报道,苹果此番举措其实已经拉开了其逐步脱离英伟达GPU依赖的序幕。分析师们在今年六月初对日本证券公司瑞穗证券做出的估算显示,英伟达在此前占据主导的AI芯片市场中,控制着用于训练和部署OpenAI的GPT等模型所需的AI芯片的70%-95%。虽然一些专家将这种市场份额形容为英伟达的“护城河”,但归根结底,他们还是认为这家实力雄厚的公司,凭借AI图形处理单元GPU(如标志性的H100)与自家独特的CUDA软件相结合的策略优势,才在这场激烈的竞争中抢占先机。

  同样值得一提的是,包括谷歌、Meta(原Facebook),甲骨文及特斯拉在内的多家科技巨头也一直在倾力研发和打造自己的人工智能系统和产品。心智观察所的研究员潘攻愚先生对此表示,苹果宣布其Apple Foundation Model(AFM)在谷歌自主开发的Tensor处理单元(TPU)上进行训练,并且还租赁了谷歌的云服务。他进一步指出,苹果在AI训练方面的决策反映出了英伟达通用型AI加速器与谷歌的ASIC定制化AI服务体系之间的竞争愈发白热化。

  始自2015年,谷歌一直依赖自主研发的TPU进行AI模型的训练与部署。其特殊之处在于并非以设计通用处理器见长,而是致力于打造具备矩阵处理能力的专用处理器,用于优化神经网络相关的大量运算与数据传输流程,无需直接访问内存,使得整体效率大幅提高。

  今年五月份,谷歌发布公告,宣布推出全新的AI数据中心芯片Trillium。对比此前版型,该芯片性能实现了惊人的近乎5倍提速。公司透露,此款芯片将主要用于开发自身的AI模型,其中包括备受关注的Gemini以及Imagen项目。

  谷歌方面公开表示,若早三年前预定,最新款TPU每小时使用费用甚至不足2美元。该产品最初于2015年应用于公司内部工作负载领域,随后于2017年公开对外销售,至今已成为专为AI量身定做且技术最为成熟的定制芯片之一。

  然而,谷歌依然保持着对英伟达的高度忠诚,后者依然成为其最大的合作伙伴。利用英伟达的GPU和自家的TPU共同训练AI系统,同时在其云服务平台售卖英伟达技术的访问权限。

  如同潘攻愚所分析的那样,“尽管英伟达在当前高端AI芯片市场拥有高达80%的份额,而谷歌等大型云服务商则占据了其余市场。特别值得一提的是,苹果今年采用的谷歌TPUv5虽在通用性上相较英伟达同类产品略显逊色,却主打性价比优势,总体拥有成本低于英伟达的四倍,且供货周期更短。现在,鉴于与谷歌之间微妙的竞争与合作关系,英伟达暂时不会轻易涉足ASIC领域。”

  Meta首席执行官马克·扎克伯格及Alphabet首席执行官桑达尔·皮查伊在上周均发表观点,认为他们的企业以及业界同行可能在AI基础设施建设上投入过多,但同时也承认,如果不这样做,那么商业风险将会极高。一旦落伍,就意味着将失去未来10至15年内最具价值的技术主导权。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分