共封光学器件有何优势和劣势

光电显示

1078人已加入

描述

过去 50 年来,移动技术创新每十年都会推出一次。移动带宽要求已从语音通话和短信发展到超高清 (UHD) 视频和各种增强现实/虚拟现实 (AR/VR) 应用。尽管 COVID-19 疫情对电信基础设施供应链产生了深远影响,但全球消费者和企业用户仍在继续创造对网络和云服务的新需求。社交网络、商务会议、超高清视频流、电子商务和游戏应用将继续推动增长。

每个家庭和人均连接互联网的设备的平均数量正在增加。随着功能和智能不断增强的新型数字设备的出现,我们观察到采用率逐年上升。此外,智能电表、视频监控、医疗保健监控、互联驱动器和自动化物流等不断扩展的机器对机器应用程序极大地促进了设备和连接的增长,并推动了数据中心基础设施的扩展。

由于预算削减,共封装光学 (CPO:co-packaged optics) 社区面临着困难时期,因为可插拔器件(pluggables )已经可以实现 CPO 所承诺的成本节约和低功耗。只有当可插拔技术失去动力时,CPO 才会得到全面部署。至少在接下来的两代交换机系统中,它很难与可插拔模块竞争,而可插拔模块在很长一段时间内仍然是首选。CPO 最近因其在数据中心 (DC) 中的网络能效而受到广泛关注。我们的分析表明,与 DC 的总功耗相比,网络节省的功耗可以忽略不计。只有博通、英特尔、Marvell 等少数 CPO 厂商会将专有解决方案推向市场。为了满足市场需求并让最终用户相信 CPO 的可行性,

最迟到 2029 年,随着 6.4T 光模块的到来,CPO 和可插拔光学器件之间可能会发生激烈的竞争。CPO 系统中的多个技术障碍预计届时将得到解决。然而,收发器行业正在不断致力于创新,以推动可插拔光学器件市场的发展。在 CPO 系统实现网络应用的批量出货之前,可插拔器件将采用联合封装方法,光学引擎将在高性能计算和分解的未来系统中获得更普及。围绕机器学习 (ML) 系统供应商 Nvidia 和 HPE 的工业生态系统,包括 Ayar Labs、Intel、Ranovus、Lightmatter、AMD、GlobalFoundries 等已取得了不错的进展,计划在 2024 年至 2026 年间批量出货产品。

CPO市场产生的收入在 2022 年达到约 3800 万美元,预计到 2033 年将达26亿美元,2022-2033 年复合年增长率为 46%。对快速增长的训练数据集大小的预测表明,数据将成为扩展 ML 模型的主要瓶颈,因此我们可能会看到人工智能 (AI) 进展放缓。在 ML 硬件中使用光学输入/输出 (I/O) 有助于克服此分析的负面结果。这些负面前景是下一代高性能计算 (HPC) 系统采用光学互连的主要驱动力。

机器学习

光子集成电路可实现低功耗且经济高效的光学互连的共同封装

我们预计 800G 和 1.6T 可插拔模块将受到高度欢迎,因为它们利用 100G 和 200G 单波长光学器件,因此可以在技术上和成本效益上以 QSFP-DD 和 OSFP-XD 外形尺寸实施。可插拔外形尺寸在所需的电和光密度、热管理和能源效率方面支持 6.4T 和 12.8 容量的能力将受到限制。由于采用分立电气器件,功耗和热管理正在成为未来可插拔光学器件的限制因素。使用硅光子技术平台的共封装旨在克服上述挑战。

光纤距离芯片组越来越近。利用光将数据引入并进行集中处理是架构设计师的主要目标之一。这一趋势始于十年前,当时是安装在印刷电路板 (PCB) 上的光学组件的专有设计。这些嵌入式光学互连 (EOI:embedded optical interconnects ) 的理念在板载光学联盟 (COBO:Consortium for On-Board Optics) 中得以延续,以制定规范,允许在网络设备制造中使用板载光学模块。CPO 是一种创新方法,将光学器件和交换机专用集成电路 (ASIC) 紧密结合在一起。由于在50T交换芯片周围放置16个3.2Tbps光模块对于当今的技术来说是具有挑战性的,近封装光学 (NPO) 通过使用位于主板上的高性能 PCB 基板(中介层)来解决这个问题,而 CPO 则将模块包围在多芯片模块基板上的芯片周围。NPO 中介层更加宽敞,使得芯片和光学模块之间的信号路由更加容易,同时仍满足信号完整性要求。相比之下,CPO 将模块和主机 ASIC 限制得更近,通道损耗更低,功耗也更低。

随着技术的进步使得通信和计算技术在商业系统中的集成更加紧密,网络硬件正在出现越来越多的通用组件。此外,人工智能模型的规模正在以前所未有的速度增长,芯片到芯片或板到板的传统架构(基于铜的电气互连)的功能将成为扩展机器学习的主要瓶颈。因此,针对高性能计算 (HPC) 及其新的分解架构出现了新型超短距离光学互连。分解设计区分服务器卡上的计算、内存和存储组件,并将它们单独集中。对各种处理单元 (xPU),特别是中央处理单元 (CPU)、数据处理单元(DPU)、图像处理单元(GPU)和可编程逻辑器件(FPGA)使用基于光学的互连,而ASIC、存储等则通过先进光学共封装方法以获得更快的速度和更高的带宽。

机器学习

数据中心运营商将更喜欢经过验证的低成本且灵活的解决方案

如今,光插拔模块市场供应链已十分完善。它由分立或集成元件供应商、生产发射器和接收器光学组件(TOSA 和 ROSA)的光学公司、多路复用器、数字信号处理器 (DSP) 和 PCB 以及组装/测试集成商组成。在这种多供应商市场模式中,涉及许多不同的供应商。此外,一个开关盒中多个不同可插拔模块的互操作性有助于提高行业的灵活性。这些是目前相对于严重依赖硅光子学的 CPO 的主要优势。凭借高度集成的光学和硅芯片,人们非常需要新的工程能力和代工厂,这对于传统的中型企业来说是无法接受的。

需要指出的是,尽管高端CPO解决方案的主流部署主要针对大型云运营商,但仍有大量小型企业数据中心尚未采用最新的互连技术,因此技术交流非常多。这意味着,即使 CPO 成为主流技术,对于 CPO 在技术或经济上不可行的多种应用(例如长途应用和边缘数据中心),可插拔模块的需求仍然很高。我们预计可插拔技术在未来 10 年内不会被淘汰。然而,可插拔光学器件行业可能会整合,而 CPO 市场将被塑造为支持多供应商商业模式。

2020年,光互连与交换设备行业对CPO的进一步发展展开了深入而广泛的讨论。此后宣布了多项战略合作,并且出现了第一个概念验证。业界认真对待这一问题的证据是,光互连论坛 (OIF)、COBO 和多源协议 (MSA) 组织等标准机构已经建立了内部项目来创建 CPO 规范。四大超大规模云运营商中的两家——Meta 和微软——积极支持 CPO 渗透到其云网络中。

2022 年,将运送数千台 CPO 发动机进行试点测试。今年,我们将看到一些宏观经济逆风将对预算密集型项目产生负面影响,特别是对于CPO等新兴技术。最近的消息表明,大多数 CPO 的主要支持者已经暂停了对 CPO 计划的支持。甚至最终用户也不再关注 CPO。Broadcom 仍然是最后一家 CPO 供应商。CPO 失去吸引力有几个原因。第一个原因是围绕可插拔设备的完善的工业生态系统。此外,用于可插拔外形尺寸的新光学技术,包括薄膜铌酸锂(TFLN)、钛酸钡(BTO)、碳和聚合物调制器,可以帮助实现所需的低功耗,并且可以在不改变现有网络的情况下引入市场系统设计。

AI/ML 系统的 CPO 情况有所不同。未来数十亿个光学互连、芯片-芯片和电路板的潜力将推动大型代工厂为大规模生产做好准备。由于大部分光子制造知识产权 (IP) 都由非代工公司持有,塔尔半导体/英特尔、格芯、日月光集团、台积电和三星等大型代工厂正在准备硅光子工艺流程,以接受任何光子集成电路( PIC)设计公司的架构。所有这些都在外围组件互连 Express (PCIe)、Compute Express Link (CXL) 和通用 Chiplet Interconnect Express (UCIe) 等行业联盟中联合起来。小芯片互连的通用规范使得能够构建超过最大掩模版尺寸的大型片上系统 (SoC) 封装。这允许在同一封装内混合来自不同供应商的组件,并通过使用更小的芯片来提高制造产量。每个小芯片可以使用适合特定设备类型或计算性能/功耗要求的不同硅制造工艺。

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分