借助Arm芯粒技术构建计算未来

描述

作者:Arm 基础设施事业部营销副总裁 Eddie Ramirez

在我们近期与业界伙伴的多次交流中,明显发现芯粒时代的大幕已徐徐拉开,行业已经不再抱存对芯粒的质疑态度,而是正在合作解决如何借助芯粒技术,在集成电路的生态系统中设计、验证和部署多供应商系统的实际问题。这样的转变让行业聚焦芯粒实现的探讨,而将芯粒由定制化工程项目转向可扩展行业实践则必须从以下三大关键领域谈起。

可扩展芯粒应用的三大支柱

要充分释放芯粒潜力,我们必须恪守三大核心准则:

为软件开发者提供便利的开发体验

如果没有可扩展的软件支持,再精妙的硬件也将黯然失色。软件必须能跨越多代 IP 保持稳定兼容。开发者必须能够在不增加复杂度的情况下,轻松实现基于芯粒设计的编程、配置和部署。这就要求行业确立通用通信协议、模块化固件以及一致化的软件接口。

为整个供应链构建可复用的芯片

现如今,多数芯粒设计仍限于单一供应商内部完成。但真正的规模化需要将芯粒转化为产品,包括跨不同设计点,甚至跨代际的可复用性、互操作性和可组合性。这需要晶圆代工厂、IP 供应商、封装合作伙伴和 OEM 厂商之间更深层次的整合。

全面推进系统级标准

虽然 UCIe 等接口标准已取得重大突破,但这仅解决了部分问题。真正的互操作性取决于系统级规范,包括芯粒通信机制、启动流程、内存共享及遥测数据接口。而这正是 Arm 芯粒系统架构 (Chiplet System Architecture, CSA) 的愿景所在,CSA 目前已得到 70 多家合作伙伴的大力支持。

从超大规模云服务到边缘侧

AI 正在推动转变

为何选择芯粒,又为何是现在?答案唯有一个:人工智能 (AI)。

AI 工作负载正在重塑计算堆栈的方方面面。从数据中心到汽车系统再到边缘设备,加速器不仅占用了更多的空间,也消耗了更多的电力。随着 AI 的扩展,业界亟需更灵活、更高效的方式来集成 CPU、NPU、GPU、内存和 I/O。

这正是芯粒技术的优势所在:芯粒支持模块化设计,可以独立地扩展计算单元或内存,高效地实现 SKU 多样化配置,并且更加精准地优化功耗/散热预算。对于小型企业来说,芯粒技术更能让他们无需投入单片系统级芯片 (SoC) 研发成本即可进军应用需求更为复杂的市场。

与此同时,借助 Arm KleidiAI,Arm 确保开发者可以横跨云端到诸如树莓派的边缘侧设备等各类硬件实现,在一致的 AI 软件栈上运行推理。

生态系统工程:

Arm 全面设计和 Project Leapfrog

为了支持芯粒的大规模应用,业界不仅要继续完善规范,还需要产业链协同推进。这一共同诉求催生了 Arm 全面设计 (Arm Total Design) 生态项目,Arm 联合晶圆代工厂、设计公司、IP 供应商、EDA 提供商及 OEM 厂商的力量,加速开发经过芯片验证、具备互操作性的芯粒解决方案。

此次合作最具突破性的成果当属 Project Leapfrog。Project Leapfrog 是一项由多家行业供应商联合推进的雄心计划,旨在打造基于芯粒的 AI 训练平台,该平台不仅可媲美 NVIDIA GB200 等单片架构,更在能效、扩展性和开放性方面具有显著优势。

它的底层技术包括:

计算子系统:ADTechnology 通过使用 Arm Neoverse 计算子系统 (CSS) 构建面向 AI 密集型工作负载的 64 核芯粒。

AI 加速器:由 Rebellions 提供专为深度学习训练与推理优化的高性能加速器芯粒。

结构芯粒:封装内计算和 AI 引擎的高效互连逻辑。

内存和 I/O:借助先进 UCIe 连接将基于 HBM 的内存子系统和先进 I/O 进行集成。

封装和工艺:利用三星代工厂领先的 3nm/4nm 工艺和 2.5D I-Cube 封装技术。

Project Leapfrog 的突破性不仅体现在硬件上,更在于其协作模式。这率先证明了,通过模块化多供应商芯粒组合,同样能实现媲美垂直集成 SoC 的出色性能。早期测试表明,Project Leapfrog 成果的能效可优于传统 GPU 架构 AI 训练系统的三倍。

这勾勒出了半导体产业的未来:专用芯片设计、协同技术创新,以及可大规模实现的性能优化。

标准、软件和未来之路

在硬件不断进步的同时,行业最大的瓶颈或许在于软件和系统集成层面。基于芯粒的设计需要采用如下新方法来实现:

跨分解式组件的安全启动和遥测

跨芯粒边界的调试

固件模块化和平台支持

芯片前阶段的系统级验证

这就是 Arm 开发 CSA 规范的核心动力。该规范汇集 70 余家合作伙伴共同制定,涵盖了安全和遥测接口、固件启动序列和一致加速器集成等各种问题,并已于今年初正式发布。针对不同用例(如计算到加速器、基于 I/O 的设计),我们创建了相应的配置文件,每个方案均包含明确定义的接口和协议。

自该规范发布以来,市场反馈令人振奋。业界对扩展 CSA 应用表现出浓厚兴趣,特别是在安全实现方案、机密计算,以及汽车与航空航天领域的低延迟实时系统等方面。

此外,Arm 还与新思科技、Cadence 和西门子等 EDA 行业前沿企业合作,共同开发芯片前的建模、协同验证和仿真环境等解决方案,让基于芯粒的系统与单片系统一样稳健可靠。

更令人振奋的是:OEM 厂商已开始就芯粒方案(而不仅仅是 SoC)采购意向书 (RFI)。这表明,相关市场思维正在生根发芽。

齐头并进的行业目标

预计五年内,云计算、汽车、移动设备和工业领域的主流企业都将采用相关的定制芯片方案。而芯粒是让这一切成为可能的关键技术。这不仅仅是一种封装解决方案,更是企业获取能效优势、差异化性能和加速上市的战略推动力。这一转型离不开全行业协同推进。

芯粒经济依赖于一个集体愿景:可灵活组合的系统、可互操作的产品和跨企业的通用语言。Arm 致力于通过开放标准、可扩展 IP 和 Project Leapfrog 等实际合作项目,推动这一愿景落地。

我们正朝着共同的目标,一步一个脚印,齐头并进,扎扎实实地构建计算未来。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分