双向4Tbps、兼容PCIe5.0!英特尔光学I/O chiplet再突破

描述

数据中心高速传输是提升目前算力的重要技术之一,光通信已经在数据中心内部服务器互联中广泛应用,而在更微观的角度,光互连还能够被应用到主板上CPU与GPU的互连,甚至是更小尺度下的片上互连。
 
在2024年光纤通信大会(OFC)上,英特尔集成光子解决方案(IPS)部门展示了业界首款完全集成的光学计算互连(OCI)chiplet芯粒,该芯粒与英特尔CPU封装在一起,将过去通过铜线实现的电气I/O接口传输数据,变成采用光学I/O解决方案,实现了高带宽片上互连的突破。
 
AI数据中心,需要更高带宽的互连
 
随着“百模大战”的打响,目前市面上琳琅满目的AI大模型产品都需要大量的算力进行支撑,包括模型研发阶段的训练以及在实际落地中进行的推理计算都需要海量算力。随着AI模型变得越来越复杂,它们需要更多的计算资源和数据交换能力。高带宽互连可以提供必要的数据吞吐量,以支持这些大型模型的训练和推理。
 
而目前数据中心算力提升主要包括两部分,一是采用算力更高的计算卡,二是提高大规模数据中心服务器或CPU和GPU之间的带宽,提高整体系统的效率,比如英伟达的NVLink、AMD/英特尔/谷歌/微软等巨头共同组建的UALink标准等。
 
而从更加微观的角度来看,在算力芯片中,每个模块或者说每个Die、chiplet模块之间其实也需要进行互连。以往芯片上都采用传统的电互连,铜作为电传输信息的介质。但毕竟铜是有电阻的,在高速数据传输过程中,发热、损耗、功耗等都较高,相比之下,光传输损耗极低,且过程中不产生热量,非常适合解决数据传输瓶颈问题。
 
在AI计算中,尤其是深度学习算法通常需要大量的并行计算,更高带宽的互连能够让芯片上信息交换效率大大提升,从而实现更高效的并行处理。另外在chiplet封装的趋势下,多个模块封装在同一基板上集成为单颗SoC,更高速的片上互连则能加快这些芯粒之间的数据传输,从而提升计算能力。
 
从结构上看,片上光互连其实是一种光子集成芯片技术,将不同功能的有源器件和无源器件集成在同一块光电基板上。光电基板上具有光子路由波导,这些波导被用于数据通信,和用于电路走线的多层金属层。CMOS电芯片堆叠在硅光芯片上,在光电基板上形成二维阵列。
 
光从基板上的激光光源中发出,输入到基板上的路由波导,通过波导到达光芯片上的调制器。这个时候电芯片上的信息数据,通过电芯片和光芯片之间的微凸块加载到环形调制器中,将数字1和0转换为光的强度差异。
 
调制后的光信号通过光电基板上的波导传播,到达其他光芯片上的光电探测器中。这个时候光信号就被转换成电信号,这些信息就被不同的电芯片所接收。
 
当然在实际应用中,每个CMOS芯片和光芯片之间,都有数以千计的微凸块被用于数据传输。因为光信号传播不需要铜导线,损耗小,延迟低,这样就实现了在光电基板上进行高能效、高带宽密度、低延迟的光互连。
 
英特尔的集成OCI芯粒有哪些亮点?
 
据英特尔介绍,在OFC上展示的OCI芯粒集成了硅光子集成电路,包括片上激光器和光放大器、与电子集成电路。OCI芯粒除了在现场展示的与英特尔CPU封装在一起外,还可以与下一代的CPU、GPU、IPUs以及其他SoC集成。
 
英特尔OCI支持高达4Tbps的双向数据传输速率,与第五代PCIe兼容。在OFC现场光学链路演示展示了两个CPU平台之间通过单模光纤(SMF)跳线连接的发射机(Tx)和接收机(Rx)。CPU生成并测量了光比特错误率(BER),演示展示了在单根光纤上8个波长、200GHz间隔的Tx光谱,以及一个32Gbps的Tx眼图,展示了强大的信号质量。
 
目前的OCI芯粒支持每个方向上64个通道的32Gbps数据传输,传输距离可达100米(尽管由于飞行时间延迟,实际应用可能限制在几十米以内),使用八对光纤,每对携带八个密集波分复用(DWDM)波长。共封装解决方案的能效也非常高,每比特仅消耗5pJ,相比之下,可插拔光收发模块大约为15pJ/bit。这种超高效能水平对于数据中心和高性能计算环境至关重要,并且可能有助于解决人工智能不可持续的功率需求问题。
 
作为在硅光领域投入多年的半导体巨头,英特尔的主要优势就是高度集成化,采用混合激光器晶圆上技术和直接集成,这带来更高的可靠性和更低的成本。这种独特的方法使英特尔能够在保持效率的同时提供卓越的性能。英特尔强大、高容量的平台已经出货超过800万个光子集成电路(PICs),集成了超过3200万个芯片级激光器,显示出时间失效(FIT)率低于0.1,可靠性极高。
 
小结:
 
除了英特尔之外,目前在片上光互连领域还有曦智科技、Ayar Labs等企业在投入研发,并取得了一定成果。2023年Hot CHIPS会议上,曦智科技展示了其片上光互连技术上的最新进展,该系统的通道数为512,单通道最长广播距离为50mm,广播延时1ns,单通道频率4GHz,片上总带宽达到2Tbps。可以预见,随着数据中心算力需求的提高,片上光互连将会加快落地的进程。
 
 
 
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分