指数级增长的AI计算量,给光子计算带来了新的机遇

描述

电子发烧友网报道(文/周凯扬)在生成式AI爆发和计算量指数增长的当下,不少传统的AI加速器以及网络芯片公司都因此受益,纷纷在已有的架构上针对AI或HPC进行优化。但与此同时,也有不少企业将希望寄托于创新的硅光计算架构上,指望光子能带来全新的计算与互联方案。
 
Lightmatter
 
2021年,Lightmatter推出了Envise这一通用光子AI加速器方案,可以完成各种先进AI模型(GPT-3、Megatron)以及主要神经网络(BERT-Large、DLRM、ResNet-50)的高性能推理。与之一同推出的还有Lightmatter针对AI应用专门打造的软件栈,Idiom,用于在Envise上编译和执行神经网络模型,并提供查错、分析和优化的工具。
 
最有野心的自然还是一同公布的晶圆级光子互联方案,Passage。该方案基于硅光和共封装光学(CPO)方案,将Chiplet处理器互联在一起。就像是我们在英伟达HGX A100上看到的PCB/电路方案一样,只不过这次NVSwitch这样的互联方案换成了光子通路,芯片与芯片之间的互联带宽最高可达100Tbps。根据Lightmatter提供的示意图,他们直接跳过了2.5D CPO和3D CPO的方案,转为集成激光器件的3D CPO方案。
 
为了应对这股AI潮,并成功在未来将更多光子产品交付给客户,比如大型云服务厂商、半导体公司等,Lightmatter在今年5月底开启了C轮融资,最终成功从SIP Global、谷歌、HPE等企业获得了1.54亿美元的融资,为公司迄今以来最大的一笔融资。为了进一步提高其设计实力,Lightmatter还在去年招募了谷歌Tensor项目主导人以及英特尔数据中心封装的主导人。
 
曦智科技
 
曦智科技作为光子计算的领头厂商之一,于2021年底发布了其第二代光子计算处理器PACE。PACE采用了64x64的光学矩阵乘法器作为核心,整个处理器由一块集成硅光芯片和一块CMOS微电子芯片3D封装堆叠而成。该结构下的PACE单个光子芯片中集成了10000多个光子器件,加上1GHz的时钟频率,据曦智科技的说法,PACE运行某些神经网络算法的速度可达彼时高端GPU的数百倍。
 
而这仅仅是曦智科技在光子矩阵计算(oMAC)上的应用,为了进一步打破内存墙,他们需要在互联技术上有所突破。近日,曦智科技发布了全新的大数据互联解决方案,Hummingbird。Hummingbird是全球首个光子片上网络(oNOC)处理器,专为特定领域的AI负载所设计。
 

光子计算
Hummingbird PCIe板卡 / 曦智科技

 
在Hummingbird上,曦智科技为64个核心打造了一个低延迟的全通广播网络,加上64个发射器与512个接收器,Hummingbird提供了一个灵活配置的高密度光学拓扑结构。此外,Hummingbird采用了光学IC与电子IC共封装进PCIe卡的方式,因此可以直接用于标准服务器中。曦智科技表示他们将在今年第三季度推出Hummingbird PCIe卡和SDK,并在今年的闪存峰会和HotChips上展示Demo和更多情报。
 
写在最后
 
其实追求光子计算的原因并不仅仅只有突破计算或互联瓶颈而已,在AI把计算量进一步拔高的当下,在维持性能扩张速度的同时控制功耗和碳排放已经变得越来越难了。要想解决这个问题,就不得不换一种出路,利用光子计算的结构来抵消晶体管的能耗。
 
固然光子计算芯片对于大部分半导体公司,还属于和量子计算一样够不着的概念。但现在看来,随着晶圆厂在硅光工艺上的成熟,EDA厂商逐渐完善的光电设计工具,光子计算依然是值得深入探索的新兴技术领域。
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分