指数级增长的AI计算量，给光子计算带来了新的机遇

E4Life 2023-07-04 2480

描述

电子发烧友网报道（文/周凯扬）在生成式AI爆发和计算量指数增长的当下，不少传统的AI加速器以及网络芯片公司都因此受益，纷纷在已有的架构上针对AI或HPC进行优化。但与此同时，也有不少企业将希望寄托于创新的硅光计算架构上，指望光子能带来全新的计算与互联方案。

Lightmatter

2021年，Lightmatter推出了Envise这一通用光子AI加速器方案，可以完成各种先进AI模型（GPT-3、Megatron）以及主要神经网络（BERT-Large、DLRM、ResNet-50）的高性能推理。与之一同推出的还有Lightmatter针对AI应用专门打造的软件栈，Idiom，用于在Envise上编译和执行神经网络模型，并提供查错、分析和优化的工具。

最有野心的自然还是一同公布的晶圆级光子互联方案，Passage。该方案基于硅光和共封装光学（CPO）方案，将Chiplet处理器互联在一起。就像是我们在英伟达HGX A100上看到的PCB/电路方案一样，只不过这次NVSwitch这样的互联方案换成了光子通路，芯片与芯片之间的互联带宽最高可达100Tbps。根据Lightmatter提供的示意图，他们直接跳过了2.5D CPO和3D CPO的方案，转为集成激光器件的3D CPO方案。

为了应对这股AI潮，并成功在未来将更多光子产品交付给客户，比如大型云服务厂商、半导体公司等，Lightmatter在今年5月底开启了C轮融资，最终成功从SIP Global、谷歌、HPE等企业获得了1.54亿美元的融资，为公司迄今以来最大的一笔融资。为了进一步提高其设计实力，Lightmatter还在去年招募了谷歌Tensor项目主导人以及英特尔数据中心封装的主导人。

曦智科技

曦智科技作为光子计算的领头厂商之一，于2021年底发布了其第二代光子计算处理器PACE。PACE采用了64x64的光学矩阵乘法器作为核心，整个处理器由一块集成硅光芯片和一块CMOS微电子芯片3D封装堆叠而成。该结构下的PACE单个光子芯片中集成了10000多个光子器件，加上1GHz的时钟频率，据曦智科技的说法，PACE运行某些神经网络算法的速度可达彼时高端GPU的数百倍。

而这仅仅是曦智科技在光子矩阵计算（oMAC）上的应用，为了进一步打破内存墙，他们需要在互联技术上有所突破。近日，曦智科技发布了全新的大数据互联解决方案，Hummingbird。Hummingbird是全球首个光子片上网络（oNOC）处理器，专为特定领域的AI负载所设计。

光子计算
Hummingbird PCIe板卡 / 曦智科技

在Hummingbird上，曦智科技为64个核心打造了一个低延迟的全通广播网络，加上64个发射器与512个接收器，Hummingbird提供了一个灵活配置的高密度光学拓扑结构。此外，Hummingbird采用了光学IC与电子IC共封装进PCIe卡的方式，因此可以直接用于标准服务器中。曦智科技表示他们将在今年第三季度推出Hummingbird PCIe卡和SDK，并在今年的闪存峰会和HotChips上展示Demo和更多情报。

写在最后

其实追求光子计算的原因并不仅仅只有突破计算或互联瓶颈而已，在AI把计算量进一步拔高的当下，在维持性能扩张速度的同时控制功耗和碳排放已经变得越来越难了。要想解决这个问题，就不得不换一种出路，利用光子计算的结构来抵消晶体管的能耗。

固然光子计算芯片对于大部分半导体公司，还属于和量子计算一样够不着的概念。但现在看来，随着晶圆厂在硅光工艺上的成熟，EDA厂商逐渐完善的光电设计工具，光子计算依然是值得深入探索的新兴技术领域。

打开APP阅读更多精彩内容