FPGA在加速AI算法上的独特优势

电子说

1.3w人已加入

描述

电子发烧友网报道(文/李弯弯)当前许多行业都采用人工智能来解决棘手问题,包括工业制造领域,随着工业4.0在2010年代早期进一步演进,AI在制造环境中的重要性与日俱增。

如今,许多应用都会利用AI来促进制造和业务经营、流程、安保和供应链等更加流畅高效。通过运用预测性算法,AI可以监控设备状况,优化维护日程,最终还能预报机械故障。

在持续兴旺发展的工业4.0和正在演进的工业5.0中,AI依然是一个重要的组成部分。然而,AI算法的蓬勃发展离不开实时数据。

与4G相比,5G网络可提供100倍的带宽和500倍的信道数量。5G网络与IoT结合之后,海量的输入数据在计算机领域中引出了一种新范式,即对数据加速器的需求。

FPGA在加速AI算法上的独特优势

数据加速的赛场上有三种各异的硬件方式,即GPU、FPGA和定制ASIC。ASIC的效率与性能最为出色,但功能完全固定,缺乏必需的灵活性,无法适应AI算法的变化、新兴技术的参数改动、供应商要求和负载优化。

GPU是传统核心数据中心的主力,仅限于纯粹运算这样的使用场景,而不能提供大多数场景中需要利用到的联网与存储加速的能力,并且能耗和成本较高。

FPGA可以加速联网、运算和存储,速度与ASIC相仿,也具备了必需的灵活性,能够为如今的核心与边缘数据中心提供理想的数据加速。

除了数据加速之外,FPGA还将在传感器融合和传入数据流合并等领域发挥关键作用,为数据消费打下了坚实的基础。

“FPGA提供了类似于ASIC的性能和比图形处理器(GPU)更高的灵活性。”Achronix产品营销高级经理Tom Spencer在接受电子发烧友采访的时候说到。

Achronix的产品解决AI/ML硬件中的普遍痛点

Achronix是一家高性能的现场可编程逻辑门阵列(FPGA)技术供应商,该公司不仅可以提供FPGA芯片解决方案,还能提供嵌入式FPGA(eFPGA)半导体知识产权(IP)。

包括与云计算和企业数据中心匹配的Speedster7t系列FPGA产品,以及通过集成到专用集成电路(ASIC)或系统级芯片(SoC)之中,进入到嵌入式应用的Speedcore嵌入式FPGA IP。

通过这样的产品组合,合作伙伴都可以为其人工智能/机器学习(AI/ML)解决方案找到合适的解决方案。

值得关注的是,Achronix的产品结合了三个关键的构建模块,可以解决当前AI/ML硬件中的普遍痛点:存储带宽、计算吞吐量和片上数据传输。

据Tom Spencer介绍,Achronix在其FPGA中率先利用二维片上网络(2D NoC)来连接所有其他功能块、I/O接口和FPGA逻辑阵列,这种新的内部通信设施即二维片上网络拥有20Tbps的双向带宽,这使得Speedster7t器件在整个FPGA市场在片上可以实现最快的数据传输。

同时,通过充分考虑当前各种机器学习和神经网络模型所需的计算资源,Achronix开发了一种独特的乘法和累加模块,并将其称为机器学习处理器或MLP。

MLP使用自己的内置存储器以实现极低的延迟,可以在一个时钟周期内执行多达32次乘法运算和1次累加运算。在Speedster7t系列AC7t1500 FPGA芯片中有超过2500个MLP,实现高达61 TOPS计算能力。

但是如果没有足够的存储器来支持计算资源,无论是MLP还是2D NoC都是不完整的,Achronix的7t1500 FPGA器件可以提供多达8个GDDR6控制器,总带宽为4Tbps。

结语

在解决方案中使用刚好足够的FPGA资源提供灵活性,同时强化使用传统ASIC模型不需要灵活性的电路,用户可以获得两全其美的效果,为所有固定功能提供ASIC级别的最高效率和性能,同时保持灵活性,可以适应不断变化的需求、终端用户的独特要求和不断变化的规范。

原文标题:在加速AI算法上,FPGA具有更高性能和灵活性

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分