描述
电子发烧友网报道(文/周凯扬)要说RISC-V社区最炙手可热的AI芯片初创公司,除了Ventana和Tenstorrent的话,当属打造出千核RISC-V芯片ET-SoC-1的Esperanto了。近日,Esperanto公开了他们在AI软件生态上所做的进一步努力,也透露了下一代千核RISC-V芯片的部分细节。
下一代千核RISC-V处理器结合HPC和ML
ET-SoC-1作为专门用于机器学习,尤其是推荐系统这类AI负载的RISC-V处理器,采用台积电7nm工艺打造,集成了1092个低功耗RISC-V核心。这上千个RISC-V核心中包括1088个ET-Minion核心,用于ML应用的计算,而另外4个ET-Maxion核心则提供更高的单线程性能,用于运行操作系统等任务。
根据ET-Minion工作频率的不同,ET-SoC-1的峰值算力在100到200TOPS之间,大多数负载下功耗甚至不会超过20W,不过单个PCIe模块由于集成了DRAM等组件,还是会达到30多瓦的功耗,可这已经是很优异的表现了。
但ET-SoC-1毕竟从一开始就是为了ML这种低精度运算的应用而设计的,至于多数利用双精度计算的HPC领域,ET-SoC-1是没办法打入这一市场的。为此,Esperanto计划打破CPU+GPU或CPU+其他加速器的现状,让RISC-V芯片从HPC和ML两个方向同时下手,这一解决方案正是他们尚在研发的ET-SoC-2处理器。
ET-SoC-1已经证明了RISC-V非常适合用于机器学习,而ET-SoC-2则打算同时攻克HPC计算。据Esperanto所述,ET-SoC-2的目标是除了支持FP16/FP8外,还要引入对FP64/FP32高精度的支持,并实现10Tflops以上的FP64算力。
为此他们将采用更为先进的半导体工艺,以及全新的HBM内存,同时还要进一步提高扩展性,可以将大量芯片无缝组合在一起,共享庞大的内存与计算资源。即便有了如此强劲的性能,Esperanto依然将低功耗作为设计目标之一,其表示未来五年内,基于RISC-V的超算系统一定会在Green500这一能效榜单上名列前茅。
软件生态仍需努力
即便芯片设计中RISC-V在算力上能与其他GPU、AI加速器媲美,但没有软件生态的支持是远远不够的。届时必将面临绝大多数新AI芯片横亘在眼前的问题,那就是开发者更愿意去选择软件生态成熟度更高的GPU。
所以Esperanto也已经开始了加速其芯片的软件支持,比如将Meta的LLM移植到ET-SoC-1上。同时Esperanto也推出了针对ET-SoC-1的通用SDK,允许开发者对1024个ET-Minion核心并行编程。但这些努力也只能算是走出了第一步而已,对于服务器这个通用性称王的市场,如果没办法运行大部分主流的AI模型,客户借助该硬件打造应用程序的意愿也会大大降低。
这也就是为何大部分AI初创公司也要建立规模不小软件团队的原因,除了需要支持和优化主流AI模型与框架外,还需要对部分服务器软件进行移植。跨不过这个门槛的话,始终难以迈进主流市场。
写在最后
最近另一家RISC-V AI芯片初创公司Tenstorrent,也从现代、起亚和三星这一众韩国厂商那拿到了1亿美元的投资。由此可以看出,AI芯片会是RISC-V开发的下一个大方向,无论是汽车芯片,还是数据中心加速器,都会进一步推动RISC-V在AI扩展指令上的标准化加速。
打开APP阅读更多精彩内容