作者:Arm 架构与技术部产品管理总监 Francisco Socal
Arm 长期以来携手生态系统,通过高级微控制器总线架构 AMBA 共同解决复杂的全行业问题。如今,随着行业对芯粒 (chiplet) 的采用,AMBA 也是时候从单个片上拓展至多芯片了。
本文将简要介绍 AMBA 的一致性集线器接口 (Coherent Hub Interface, CHI) 芯片到芯片 (C2C) 方法。CHI C2C 是对片上 CHI 的拓展,该方法目前正处于开发阶段,旨在使 CHI 适用于芯片间及芯粒间的互连。
此外,本文还将阐述 AMBA CHI C2C 如何完善比如通用芯粒互连技术 (UCIe) 等芯粒的标准化工作,以进一步推动协同合作。
为何选择芯粒,又为何是现在?
行业目前正处于一个拐点,芯粒正被广泛用于各个细分领域和应用。
当前系统级芯片 (SoC) 设计面临的巨大经济压力推动了行业对芯粒的投资。SoC 的复杂性和性能要求持续增加,同时每个新的先进芯片工艺节点(5 纳米及以下)的成本也在不断攀升。然而,这些新节点带来的好处并没有相应增加。例如,虽然逻辑器件持续扩展,但 I/O 和内存的收益却在递减。高昂的成本也阻碍了新的 SoC 或衍生产品的开发。
这种情况为芯粒创造了绝佳的机会。芯粒使芯片性能不再受到尺寸的限制,同时还能管理芯片成本,并提供更高的可组合性。
标准化至关重要
AMBA[1] 一直是片上通信的开放标准。它为各种设计提供了一个通用标准,确保 SoC 上的不同组件之间相互兼容。它还具有灵活性、可扩展性、设计复用以及低摩擦设计集成的优点。
AMBA 规范(如 CHI 和 AXI)是免费提供的[2],并由行业合作伙伴共同参与制定。AMBA 被广泛应用于 Arm 生态系统及其它领域。它具备久经验证的可靠性和可信赖度,在过去 27 年中已被用于数十亿颗芯片中,覆盖各个细分市场和应用领域。
AMBA 实现的标准化成为当今 SoC 设计和无晶圆厂半导体模式的基础。这种标准化为构建繁荣生态系统和兼容 IP 和工具的综合市场奠定基础。其中包括处理器、加速器、互连、控制器和外设,以及来自芯片合作伙伴、IP 供应商和其他合作伙伴的验证 IP (VIP)、建模工具和性能工具。
标准化对芯粒的采用同样至关重要。随着行业从当前的定制芯粒平台向多供应商的可组合芯粒发展,标准化对于未来实现开放芯粒生态系统更为关键。
具有定义明确的可互操作层对标准化方法也十分重要。定义明确的可互操作层可支持设计复用,降低成本并缩短产品上市时间。根据用例和需求的不同可以优先选择合适的实现方案,从而提供更大的灵活性并促进创新。
芯粒的发展依赖于物理层、传输层和协议层的标准化,外加软件模型、机械、散热和功耗的标准。另外,还少不了芯片验证、可靠性测试、合规性测试及许多其它工作。
为何选择 AMBA CHI?
AMBA CHI[3] 架构可为连接大量处理器、加速器和内存的系统提供所需的性能和规模。更根本的是,CHI 具有高速、可靠和可分组特性,因此非常适合用于芯粒。同时,CHI 是广泛使用的开放标准,为采用芯粒提供了一种低风险且简单直接的途径。
CHI 协议提供了一个全缓存一致性模型。该模型与架构无关,支持通过 snoop 过滤器和基于目录的系统进行扩展。该协议于 2013 年公布后便不断发展演进[4],不仅增加了新功能,还进行了性能提升[5]。CHI 有着广泛的功能和特性,例如:
原子级和独占事务 (transactions)
用于降低延迟的优化流程,如 DMT、DCT 和 DWT
基于奇偶校验的接口保护
低功耗,具有多种不同的控制级别
写零、数据省略和本地复制,以减少数据传输
分布式虚拟内存 (DVM) 管理
用于机密计算的机密领域管理扩展 (RME)
CHI 作为超大规模计算、服务器和网络基础设施应用的基石,已经取得了巨大成功。CHI 现已广泛用于移动设备和汽车等多个细分市场的诸多应用并得到了验证,而这些应用也需要完整的硬件一致性和高性能。
AMBA CHI C2C 的推出
我们很高兴介绍 AMBA CHI C2C,这是对 CHI 的扩展,并将主要用于芯片(芯粒)间互连。
对于芯片(芯粒)到芯片(芯粒)(C2C),我们指的是芯粒(即多芯片或芯片间)和芯片间(即通过 PCB 连接的多芯片)。
CHI C2C 面向先进异构系统用例以及基于 Arm 架构的一致性 SMP。它为设备连接提供了统一的接口,包括计算、加速器和内存。这不仅适用于全一致性传输,也适用于 I/O 和非一致性传输。
CHI C2C 专注于协议层和分包层。它利用现有的片上 CHI 协议并对其分包方式进行定义,使其适合通过芯片(芯粒)间链路进行传输。分包格式对链路利用率和延迟进行了优化,同时避免了复杂的分包和解包方案。
相同的架构特性可以跨越芯片(粒)间的边界,芯片(粒)间可以共享相同的内存和安全模型。这可以避免出现协议转换、不兼容和额外的时延。这种分层方法可以与底层传输彻底分离,因此 CHI 可以在 UCIe 等选项上使用,无论它们是否已标准化。
使用 CHI 和 UCIe 串流
行业领导者纷纷加入 UCIe[6] 以提供标准化的芯片间 (die-to-die) 接口,其发展势头强劲[7]。UCIe 提供了针对芯片间集成而优化的物理层 (PHY) 和适配器,以及软件模型和合规性测试。
UCIe 还提供了极大的协议灵活性。该技术采用了一种多堆栈方法,允许在单个物理链路上使用多个协议。PCIe 和 CXL 可用于传统片外设备,而串流接口可用于插入其它协议,因此非常适合用于传输 AMBA CHI。
下面列举了一个使用 UCIe 串流的基于 CHI 的多芯片系统。该系统具有以下显著优势:
无缝使用架构特有的功能:由于是传输相同的片上 CHI 协议,因而允许无缝使用架构特有的功能,而无需转换协议。
链路稳健性:UCIe 串流接口使用 UCIe 定义的数据链路 CRC 和重试等方式实现链路稳健性。
总结
CHI C2C 规范目前正处于开发阶段,与所有其它 AMBA 规范一样,它将按照现有的 AMBA 许可和治理模型发布。这意味着,除了免费提供、免版税且无架构要求外,它还具有广泛和永久的实现权[注],换言之,非常适合广泛采用。
通过利用现有的 AMBA 许可和治理模型,CHI C2C 将能够与 CHI 协议本身保持同步发展,并符合现有 AMBA 生态系统的要求。当然,我们要确保它针对 UCIe 等传输进行了优化。
该模型沿用了分层的标准化方法和其它协议的现有治理模型,如 CXL 和 PCIe,也可以与 UCIe 一起使用。基于此,我们预计 CHI C2C 将广泛用于各个细分市场和应用领域。随着时间的推移,将从高性能基础设施应用拓展到汽车行业等等。此外,现有基于 AXI 设计的数量庞大,这对于在 C2C 中的实现至关重要。
展望未来,我们期待继续围绕 C2C 与各方展开合作,并为行业提供各种工具,以构建基于标准的优秀芯粒解决方案。
审核编辑:汤梓红
全部0条评论
快来发表一下你的评论吧 !