在当前的AI算力军备竞赛和数据中心建设中, NPO(Near Packaged Optics,近封装光学) 是一项被疯狂关注的核心硬件技术。
NPO技术解决的正是AI算力面临的终极物理瓶颈之一: 数据传输的耗电与发热问题 。
为了让你通俗易懂地理解这项技术,我将结合生活中的比喻,为你做一次深度的技术科普。
要理解NPO,首先要明白现在的AI集群在面临什么麻烦。
在大模型训练(比如跑几十万张英伟达GPU)时,GPU之间需要疯狂地交换数据。目前的数据传输方式是: 电信号 -> 光信号 -> 电信号 。
在传统的交换机里,我们使用的是 可插拔光模块(Pluggable Optics) ,它就像我们电脑上的U盘一样插在交换机的面板上。
物理法则的惩罚来了:
交换机的核心大脑(ASIC交换芯片)在机器的正中央,而光模块在机器的边缘面板上。电信号从核心芯片走到光模块,需要在主板(PCB板)上跋涉十几到二十几厘米。
在普通网速下,这点距离不算什么。但在AI时代(单通道达到100G、200G甚至更高),高频电信号在这段距离中会面临巨大的 信号衰减 和 电磁干扰 。
为了让信号能顺利到达,唯一的办法就是 “大力出奇迹”——加大电流(加功耗),沿途加信号放大器 。
结果就是: 光模块加上这段传输路径,吃掉了整个交换机近一半的电力,并且产生了恐怖的热量。 如果不解决这个问题,未来的AI数据中心将没有足够的电来支撑计算,全用来传输数据了。
NPO(Near Packaged Optics,近封装光学) ,顾名思义,就是把光电转换模块 “挪到离核心芯片非常近的地方” 。
一个贴切的比喻:打工人的通勤革命
既然CPO(住工位)是终极目标,为什么现在大家都在大谈特谈NPO(住隔壁)?因为 工程落地需要权衡 。
* 省电降温: NPO大大缩短了电信号走线的距离,功耗可以降低 30%以上 。
* 提升密度: 交换机面板不用再插满光模块,可以腾出空间来做水冷/液冷接口,帮助整个机器散热。
* 良率与维修(最重要的考量): 光器件是非常容易坏的(尤其是激光器受不了高温)。如果用CPO,光模块和核心芯片封装死在一起,光模块坏了,价值几万美金的核心交换芯片也得跟着报废,这让客户无法接受。
* NPO的优势: NPO把芯片和光模块解耦,虽然它们挨得很近,但仍然是独立的部件。光引擎坏了可以单独换,且光引擎不在核心芯片的发热中心,寿命更长。 它是目前技术成熟度、成本和功耗之间最完美的平衡点。
在2024-2026年这个时间段,NPO及相关的硅光技术(Silicon Photonics)是AI硬件基础设施最确定性的增量赛道之一。
总结一句话:
NPO(近封装光学)不是一项凭空出现的魔法,而是面对AI时代狂暴的数据洪流和能源危机时,工程师们对物理法则的妥协与突围—— 既然电传输又慢又费电,那就让光和芯片的距离无限拉近。目前市场上炒作的、落地中的 NPO / CPO: 是光模块跟 网络交换芯片(Switch ASIC) 贴贴。解决的是网络中枢堵车耗电的问题。(中际旭创等龙头目前主攻的正是这个战场)
全部0条评论
快来发表一下你的评论吧 !