微软与Anthropic深度绑定,Maia 200芯片每美元Token效率飙升30%

描述

近日,微软CEO萨蒂亚·纳德拉在最新财报电话会议上抛出一枚重磅炸弹:微软自研第二代AI芯片Maia 200,相较现有最新硬件,可实现超过30%的每美元Token生成效率提升。几乎同一时间,Anthropic开发者后台惊现"claude-opus-4.8"模型标识,叠加此前泄露的51万行源代码中Sonnet 4.8的明确引用,预示Anthropic正以令人窒息的速度连发新牌。微软与Anthropic围绕Maia 200的芯片供应谈判也浮出水面,一场关乎AI算力版图重塑的深层博弈正在加速展开。

纳德拉所言的30%每美元Token生成效率提升,并非一句营销口号,而是建立在Maia 200扎实的硬件参数之上。这款于今年1月正式发布的第二代AI推理加速器,基于台积电3纳米工艺打造,单颗芯片集成超过1400亿个晶体管。其配备原生FP8/FP4张量核心与重新设计的内存系统,搭载216GB HBM3e高带宽内存,带宽高达7TB/s,另有272MB片上SRAM与专用数据传输引擎。在750W的SoC热设计功耗下,Maia 200可提供超过10 PetaFLOPS的FP4性能和超过5 PetaFLOPS的FP8性能,FP4性能据称达到第三代Amazon Trainium的3倍。

目前,Maia 200已在微软位于爱荷华州德梅因附近的美国中部数据中心投入运行,并计划扩展至亚利桑那州菲尼克斯附近的美国西部数据中心区域。该芯片已为包括OpenAI最新GPT-5.2在内的多个大模型提供推理支持,同时服务于Microsoft Foundry和Microsoft 365 Copilot等核心产品。值得一提的是,Maia 200采用了"零浪费"水冷设计方案,在追求极致性能的同时回应了数据中心水资源消耗的可持续发展挑战。

纳德拉明确表示,微软计划在自研模型与自研芯片之间建立闭环,根据自身需求设计微架构并持续迭代模型。与此同时,微软已开放Maia SDK预览,为开发者提供构建和优化模型的工具链。不过纳德拉也强调,微软的AI硬件战略并非全面自研,而是坚持"自研加外购"的双轨路线,将继续向英伟达和AMD采购芯片。

在自研芯片推向外部客户方面,微软目前仍落后于亚马逊和谷歌。而Anthropic,正是微软眼中最具战略价值的潜在客户。据知情人士透露,双方正在就Anthropic使用Maia 200芯片驱动其Claude模型一事展开谈判,但截至目前尚未达成最终协议。

这场谈判的背后,是Anthropic日益严峻的算力饥渴。Anthropic联合创始人兼CEO达里奥·阿莫代本月早些时候公开坦言,公司在算力资源方面遇到了"困难"。长期以来,Anthropic主要依赖英伟达GPU训练和运行其生成式AI模型,但随着Claude助手和AI编程工具Claude Code的热度快速攀升,算力需求急剧膨胀。SpaceX在招股书中更是披露,Anthropic将在2029年5月前每月支付12.5亿美元用于购买算力,足见其对算力的渴求程度。

为缓解算力压力,Anthropic已构建起涵盖亚马逊Trainium、谷歌TPU和英伟达GPU的多元化算力体系。今年4月,Anthropic宣布与AWS达成一项为期10年、总价值超过1000亿美元的合作,采用Trainium定制芯片;去年10月还宣布计划采用谷歌TPU。此次与微软洽谈Maia 200供应,是这一多芯片战略的自然延伸。若协议达成,Anthropic不仅将获得Claude模型运行的又一算力选项,还有望参与影响Maia芯片下一代产品的设计方向,使其更贴合自身模型需求。

从商业利益来看,若云服务商愿意对自研芯片给予一定补贴,使用定制芯片理论上可为Anthropic带来更高性价比。微软目前已是Anthropic的重要客户之一,预计将购买至少5亿美元的Claude模型访问权限用于驱动Copilot产品,去年11月更宣布向Anthropic投资最高50亿美元,而Anthropic承诺在Azure上投入300亿美元云计算支出。芯片层面的合作,将把这层关系推向更深的绑定。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分