智算中心出现带宽缺口,1.6T以太网力大砖飞

描述

随着AI计算大量的数据训练与推理负载,我们对于扩张和建设大型数据中心瓶颈的认知,也早已经历了数个阶段的变化。首先是算力的空缺,接着是内存墙,最后我们到了网络性能上。多年以来,以太网作为互联网的主心骨,为数据中心提供了通用高速的网络连接。

据IDC预测,到2025年全球数据中心和云端的流量将突破至175ZB。正因如此,我们开始打造更为复杂的多机架系统,以及复杂的网络架构。与此同时,随着新标准的开发和发布,每一代以太网的数据传输速率都在翻倍,以数据中心的网络架构而言,尤其是以AI负载为主的智算中心,从400G过渡到800G,以及未来走向1.6T,已经是大势所趋。

1.6T以太网,打破智算中心的连接限制

从目前数据中心的系统能耗变化来看,AI正在慢慢成为增长最快的负载之一。据福布斯报道,从2023年到2030年,AI负载将把数据中心的能耗提高80%,而常见的数据中心架构中,以太网连接相关的功耗占比高达60%。

AI不仅消耗了大量的算力资源,也为互联网络带来的极大的压力,不只是服务器内部芯片、加速器之间的互联,还有服务器与架顶式交换机之间的互联。对于超大规模LLM这样对服务器要求极高的AI应用而言,做到更快的互联速度,更低的延迟和更低的功耗,就能更高效地为用户提供服务器。

高速网络因此成了每个大力发展智算的数据中心研究的重点,AI应用开发商也会将这些指标纳入考量。作为主要连接方式的以太网,也已经在探索1.6T网络的开发。要想支持更快的以太网络,就少不了高速SerDes接口。为了实现800G和1.6T的高速以太网,必须用到224GB的SerDes以及PAM-4调制方式。在给定的波特率下,PAM-4可以实现两倍于传统NRZ的比特率。

但采用PAM-4调制致使眼高有所降低,进而使得信噪比降低。因此PAM-4相较NRZ对噪声更为敏感,误码率增高,必须靠FEC(前向纠错)才能保证其误码率,保证其在长距离下接收信号。不过有了FEC的辅助,更高速率的以太网受到的距离限制因素更多,所以其支持的距离往往会随着速率增加而逐步递减。

对于1.6T的以太网标准而言,参与制定标准的IEEE 802.3dj工作组预计会在2026年定稿,但相关的基础特性已经基本确定确定下来,比如最大支持1.6Tb/s的MAC速率,MAC层最大误码率,芯片到模组和芯片到芯片应用可选支持16路1.6Tb/s AUI等。

从现在看来,正式的标准离我们尚有一段距离,但不代表着相关的解决方案没有成型。面对竞争日益激烈的光模块、交换机等市场,对于博通、Marvell之类的设计厂商而言,他们并不会静静等待标准定稿才开始行动。如果想要抢占市场先机,现在就是了解1.6T以太网设计方案的最佳时机,新思科技作为以太网IP解决方案的领头羊,早在几年前就开始部署相关的解决方案。

高带宽以太网方案,IP先行

从硬件角度来说,支持以太网数据连接的架构往往由两部分组成,一个是控制器,一个是PHY(物理层)。其中控制器在芯片内部实现的基础的以太网协议特性,由MAC、PCS和PMA组成。PHY负责传输和接收数据,由PMA和PMD组成。

新思科技早在800G以太网的萌芽阶段,就已经开始了1.6T的布局。在2022年的ECOC大会上,新思科技就展示了BER小于1e-6的224G接收器PHY方案。去年的DesignCon上,新思科技在224G接收器PHY的Demo上,展示了5nm 224 PAM-4 PAM-4 TX眼图。去年的OFC、SC23等会议上,新思科技的224G demo都展示出了优异的回路BER性能。

智算中心

新思科技1.6T以太网解决方案 / 新思科技

今年二月底,新思科技正式发布了完整的1.6T以太网IP解决方案,包括1.6T以太网控制器IP、224G以太网PHY IP和验证IP。新思科技称这一完整的1.6T以太网解决方案可以显著减少互联功耗,相比上一代功耗低至50%。在标准的支持上,该方案支持IEEE 802.3、OIF-224G标准等过个电气规范。

相较于目前已有的800G以太网控制器IP方案,新思科技提供的全新多通道/多速率以太网控制器方案除了提供对1.6T速率以太网支持外,凭借PCS提供的RS-FEC架构,还实现了最高40%的时延改善,设计占用面积最大减少了50%。

新思科技的224G以太网PHY IP则提供了优秀的信号完整度和抖动性能,可以做到0 post-FEC BER。除了传统的NRZ外,也支持到逐渐成为主流的PAM-4。针对光模块、AI/ML处理器、NIC等不同硬件的设计需求,新思科技的以太网PHY IP可以定制化,用于支持芯片到芯片、芯片到模组以及铜线连接等不同的以太网互联方案。

除此之外,新思科技提供了业内首个1.6T验证IP,支持前期RTL验证、SoC调试以及系统层级的校验等,加快设计者的验证进度。据了解,新思科技也在关键生态合作伙伴、芯片厂商、标准制定协会等合作,未来会继续扩展对1.6T以太网的支持,包括车载以太网及其他的速度模式等。

值得一提的是,新思科技 224G 以太网 PHY IP 已经在台积电的N3E工艺中成功实现流片,所以工程师只需要专注在产品的差异化设计上。硅验证的以太网PHY IP、时延优化的以太网控制器IP以及首个1.6T验证IP结合,已经为设计者铺好了迈向更高速率以太网络的路径。与行业主要参与者打通的互操作性,也为多供应商设备兼容做好了保证。

写在最后

新思科技表示,其完整的1.6T以太网IP解决方案已经被多个客户采用,相信下一代1.6T以太网连接的产品和系统都已经在紧锣密鼓的开发过程中。与此同时,我们还需要持续关注下一代光模块封装方式面临的挑战。

新思科技的以太网IP已经支持可插拔、NPO(近封装光学)和CPO(共封装光学)的不同方案,究竟哪一种方案技术成熟度更高、成本可观,仍是未来光模块厂商需要考虑的问题。但可以肯定的是,1.6T以太网势必会为智算中心带来新一轮的性能升级。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分