处理器/DSP
在当前计算芯片的设计中,内存的不足已成为一个显著的问题,随着人工智能(AI)和高性能计算(HPC)等领域的工作负载不断增加,迫切需要寻找一种更好的方法来平衡计算和内存之间的关系,以提高整体性能。
NuLink PHY技术通过双向传输功能和灵活的设计,为构建更优越的计算引擎提供了新的途径。相比传统的硅中介层封装技术,NuLink PHY能够提高计算与内存之间的平衡,提高带宽利用率,并降低制造成本。
Part 1
Eliyan的设计方案
在最近的MemCon 2024会议上,Eliyan公司的首席执行官Ramin Farjadrad展示了他们的创新产品NuLink PHY,展示了如何利用这一技术构建比当前基于硅中介层封装技术更优越的计算引擎。
NuLink PHY是一种物理网络传输设备,能够链接交换芯片、网络接口或计算引擎上的其他类型接口到物理介质上,如铜线、光纤或无线电信号。
传统的2.5D封装技术,如台积电的CoWoS和英特尔的EMIB,虽然提供了高带宽的芯片间连接,但存在诸如尺寸限制、生产周期长、成本高等问题。而Eliyan的NuLink技术通过修改的2D MCM流程,克服了这些局限性,提供了更大的设计灵活性和成本效益。
通过NuLink技术,可以构建更大的计算引擎,如包含24个或更多HBM堆栈的设备,这将显著提升GPU的内存容量和带宽。此外,NuLink技术还可以实现更大的设备尺寸,同时保持低成本和高性能。
UMI概念通过NuLink PHY实现了同步双向流量,为构建更大、更平衡的Blackwell GPU复杂提供了可能。UMI的设计可以使计算和内存恢复平衡,并使这些设备变得更便宜。
对于更大的计算复合体,Eliyan的NuLink Switch技术可以提供更广泛的连接选项,使得任何内存、任何共同封装的光学器件、任何PCI-Express或其他控制器都可以连接到任何XPU,极大地扩展了系统架构的可能性。
通过去除硅中介层或等效物,并转向有机基板和NuLink PHY,可以显著降低制造成本。这种成本效益对于大规模部署高性能计算设备至关重要。
Part 2
NuLink PHY的主要特点
传统的硅中介层是一种特殊电路桥,用于将HBM堆叠式DRAM内存连接到计算引擎。这种传统方法受到尺寸限制,而NuLink PHY则通过创新的设计提供了更大的灵活性和性能。
通过NuLink PHY,Eliyan展示了一种修改后的2D多芯片模块(MCM)流程,使得数据传输速率达到了传统MCM封装的10倍。此外,NuLink PHY之间的走线长度可以增加20到30倍,与其他2.5D封装选项相比,为计算引擎的设计带来了巨大的变化。
● 创新性: NuLink PHY是一种物理网络传输设备,可以链接交换芯片、网络接口或计算引擎上的其他类型的接口到物理介质上。传统的硅中介层受到尺寸限制,而NuLink PHY通过创新的设计提供了更大的灵活性和性能。
● 双向传输: 可以同时进行传输和接收数据,从而提高了带宽利用率,对于在内存和ASIC之间进行数据传输的应用特别有益,可以最大程度地利用计算资源,提高整体性能。
● 性能提升和成本降低: 可以实现更大、更平衡的计算引擎,而无需依赖昂贵的硅中介层,使得更多的计算资源可以被纳入同一块芯片上,还降低了制造成本,并提高了设备的良率。
● 广泛前景:不局限于GPU,还适用于各种类型的计算引擎,包括CPU、ASIC等。这意味着这项技术有着广阔的应用前景,可以推动整个计算领域的发展。
小结
计算能力的显著提升,内存带宽和互连带宽的提升速度相对较慢,这导致了数据移动和存储的瓶颈。因此,未来的GPU设计需要重点关注内存层次结构和互连技术的优化。
Eliyan公司的NuLink PHY技术提供了一种创新的解决方案,在有机基板上使用更厚的凸块和较长的连接距离,实现更高的数据传输速率和更远的连接距离。可以尝试和理解一下。
审核编辑:黄飞
全部0条评论
快来发表一下你的评论吧 !