定制的 AI 和 HPC 解决方案往往能提供强大的性能,但制造起来相当困难且昂贵。
如今的半导体行业可以观察到一些趋势。一方面,采用领先制造技术的片上系统 (SoC) 的开发和生产变得越来越昂贵。另一方面,尽管成本较高,但越来越多的公司选择设计自己的 SoC,以区别于竞争对手。这种趋势并没有让 AMD、英特尔和高通等标准 CPU 和 SoC 供应商受益。但这对于其他行业参与者非常有利,例如 EDA 软件开发商、IP 公司、合同芯片设计人员,当然还有代工厂。
几个全球大趋势影响着微电子的发展。它们包括 5G 和边缘计算(我们更愿意称之为互联设备的爆炸性增长)、自动驾驶和软件定义车辆 (SDV)、人工智能、云计算和高性能计算( HPC)。
像AI,云和HPC这样的应用程序可以吞噬提供给它们的任何性能,它们的主要限制是数据中心的功率和空间,而不是硬件成本。
同时,自主 SDV和边缘计算设备也可以利用更高的计算性能。但是,除了功率和空间之外,它们还受到成本的限制(例如,它们使用的芯片数量以及这些芯片的芯片尺寸)。
人工智能、汽车、云、边缘计算和高性能计算是非常不同的应用,它们可以通过广泛使用的现成芯片来解决。但是,根据芯片要运行的工作负载精确定制芯片,可以从成本和功耗的角度更有效地实现所需的性能和功能水平。
“我们看到越来越多的公司意识到一刀切的方法不再满足他们的计算需求,相反,他们正在探索定制 SoC 项目,以确保他们可以为正确的应用程序使用正确的计算级别, ”Arm 基础设施业务线产品解决方案副总裁 Dermot O'Driscoll 说道。
此外,IP 保护、提供差异化功能、设计灵活性和供应寿命等考虑因素比以往任何时候都更加重要。这些因素促使许多公司(无论是老牌公司还是初创公司)开发内部 SoC 或从芯片合同制造商处订购。这些公司的数量正在增长。
Ansys 首席技术专家兼工程模拟和 EDA 软件开发人员 Christophe Bianchi 表示:“设计自己芯片的公司数量肯定有所增加。这种向‘定制芯片’的转变在北美更为明显,但欧洲、中东和非洲和亚太地区也在追随这一趋势。”
英国合同芯片设计公司 Sondrel 的创始人兼首席执行官 Graham Curren 表示:“拥有定制 SoC 意味着您拥有独特的解决方案,其中融合了您特殊的差异化技术,并且很难复制。”这是深深嵌入到芯片中的。此外,它是一个完美定制的解决方案,在功率、性能和面积方面完全符合任务规范。
苹果公司就是一个很好的例子,它设计了自己的 SoC(首先为智能手机,然后为个人电脑),并获得了巨大的收益。
该公司一开始要求三星在 2000 年代末将其一些定制 IP 实施到其 iPhone 的应用处理器中,但随后迅速建立了自己的芯片开发团队,并开始设计具有定制 CPU 微架构和加速器的高度复杂的移动 SoC。为其 iPhone、iPad 和 Apple TV 机顶盒等产品增加价值。最近,该公司开始为其 PC 构建 SoC,再次整合各种定制 IP,以在要求苛刻的应用中获得更低的功耗、更长的电池寿命和更高的性能。
“设计定制 SoC 的几个主要原因是附加专门的加速、实施独特的系统和封装拓扑以及通过垂直集成优化成本,”O'Driscoll 说。
苹果从 M 系列 SoC 的努力中获得了巨大收益:该公司在 PC 市场的份额从2019 年第一季度的 6.4%(出货量 379.1 万台)增长到2022 年第一季度的 9.3%(销量 732.4 万台)。苹果2022 财年的研发支出为 262.51 亿美元(高于2019 财年的162.17 亿美元),其中很大一部分与芯片开发有关。
过去,芯片设计是 IBM和思科等拥有利润丰厚产品的大公司的特权。随后,苹果向世界展示了消费电子 SoC 的用途,华为和三星等公司纷纷效仿。
到 2010 年代中期,互联网巨头变得如此庞大且盈利,以至于他们设计自己的芯片变得有意义。
如今,汽车制造商正在走苹果的道路。
TechInsights 副主席丹·哈钦森 (Dan Hutchenson) 表示:“近年来,自行设计芯片的公司数量呈爆炸式增长。” “最初是 IBM、Amdahl、思科和Oracle加入了无晶圆厂/代工运动。随后苹果公司加入进来,移动应用程序的发展势头开始升温。到 2015 年,谷歌、Meta、亚马逊、百度和特斯拉等所有超垂直行业都在设计自己的芯片。然后风险投资家开始为人工智能和智能电力初创企业提供资金。从2021年开始,各大汽车制造商开始设计自己的芯片。”
超大规模企业处于领先地位
目前,苹果是唯一一家设计自己的定制处理器的大型个人电脑制造商。鉴于 PC 制造商对 Windows 开发的控制力显然不如苹果对 MacOS 开发的控制力,他们不太愿意构建自己的 SoC,因为他们的成功将取决于微软的支持。
与 PC 制造商不同,超大规模企业对其硬件和软件拥有几乎绝对的控制权,这使得他们很有可能开发自己的定制 SoC。
“定制芯片的最初驱动力来自超大规模企业:人工智能计算和云性能需求都推动了这种增长。”比安奇说。
谷歌运营着一些世界上最受欢迎的互联网服务,并拥有多方面的定制数据中心芯片战略,包括用于人工智能训练和推理加速的张量处理单元(TPU)、用于 YouTube 的视频转码单元(VCU),甚至据报道还有服务器 SoC。谷歌传闻中的服务器 SoC 是否会比 AMD 的 Epyc 或英特尔的 Xeon CPU 更适合该公司还有待观察。
与此同时,该公司的 TPU 和 VCU 已经带来了谷歌扩展其人工智能和视频服务所需的性能、可扩展性、功能和成本。
Cambrian-AI Research 创始人兼首席分析师 Karl Freund 表示:“成本和定制化促使这些公司开发自己的芯片。”他表示,他相信如今的 AI 工作负载是超大规模企业希望通过其解决方案解决的关键应用之一。
EDA 工具和 IP 巨头 Cadence 数字和签核小组产品管理副总裁 Kam Kittrell 表示:“超大规模企业可以比大量购买芯片更便宜,从而省去中间环节。” “通常,这些公司是自己的云的消费者,并且拥有有价值的专业软件。他们可以制造在交付软件工作负载时更加节能的特定硬件。”
亚马逊网络服务 (AWS) 是全球领先的云服务提供商 (CSP) 之一,支持亚马逊自己的在线商店和仓库管理以及 Netflix 等服务,其芯片策略与 Google 不同。
为了向客户提供足够的计算性能和功能以及可预测的数据中心功耗,AWS 设计了自己的用于通用计算的服务器级 Graviton SoC。AWS 的 Graviton 现已发展到第三代。
“内部生产芯片的公司数量显著增加,特别是在超大规模领域,他们可以根据数据中心的工作负载获得差异化,”Synopsys的营销和战略副总裁 John Koeter 表示。
AWS、百度、谷歌、Meta 和 Microsoft Azure 等公司运行着如此多不同的工作负载,因此将所有工作负载转换为定制芯片以提高性能效率似乎只是时间问题。这些公司财力雄厚,有能力开发定制 SoC。
Alphawave Semi 营销主管 Sudhir Mallya 表示:“我们看到最大的增长是在数据基础设施领域,其中包括云、数据输入、网络、存储和 5G 基础设施。” “当你今天看到它时,数据中心基础设施的定制芯片的增长是惊人的。几年前,当谷歌、微软、AWS 和 Facebook (Meta) 等大型超大规模企业开始设计自己的芯片时,我们就看到了这一趋势。”
人工智能和高性能计算:不同的方法
与此同时,有多家数据中心级 SoC 开发商通过其定制处理器、SoC 和多芯片系统级封装专门针对 AI 和 HPC 应用。Koeter 表示,这些定制的 AI 和 HPC 解决方案往往能提供强大的性能,但制造起来相当困难且昂贵,因为其中一些的芯片尺寸接近 EUV 光罩 (858 mm2)。
老牌厂商有很多针对人工智能和高性能计算的标准产品。AMD 通过其 Instinct 计算 GPU 和 EPYC 处理器(使用小芯片设计)解决 AI 和 HPC 工作负载。
英特尔拥有多方面的战略,其中包括用于人工智能的单片 Habana 处理器、用于人工智能和 HPC 的多芯片数据中心 GPU Max,以及用于几乎所有功能的多芯片第四代 Xeon 可扩展 CPU。
相比之下,Nvidia的最新 H100 产品采用了单片设计。所有这些都是现成的产品,具有自己的特点,来自拥有大量研发预算和人员的公司。
尽管如此,仍有许多新来者将在未来几年挑战行业巨头。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !