关于CNN的当前技术最新发展水平以及包括清华大学等在内的研究结果

描述

AI  ( 人工智能) 现在完全处于图像识别市场的主导地位,因为卷积神经网络 (CNN) 的表现不仅远远超越同类竞争机器实现方案,甚至让人类的图像识别能力也相形见绌。基本的 CNN 算法需要大量的计算和数据重复使用,这正是 FPGA 实现方案的优势。

赛灵思 CTO 办公室的杰出工程师 Ralph Wittig 在 2016 年 OpenPOWER 峰会上做了 20 分钟的演讲,讨论了 CNN 的当前技术最新发展水平以及包括清华大学等在内各个大学的一些研究结果。

这为我们带来了几个与 CNN 算法实现方案功耗相关且备受关注的结论:

继续使用片上存储器;

使用较小的乘法器;

继续使用定点算法 — 16 位定点解析可最大限度减少与 32 位定浮点计算有关的精确度退化问题,而且如果逐层使用动态量化,8 位计算也能产生良好的结果。

详细内容请观看 Ralph Wittig 在 OpenPOWER 峰会上的演讲视频:

在本视频中,Wittig 还说明了两款 CNN 相关产品的使用情况。 这两款产品此前在Xcell Daily中有报道:

与 CAPI 兼容的 Alpha Data ADM-PCIE-8K5 PCIe 加速板。(请参见:Alpha Data 面向 x86 和 IBM Power8/9 数据中心及云服务器的 ADM-PCIE-8K5 PCIe 加速板使用 Kintex UltraScale FPGA。)

Auviz Systems 的 AuvizDNN(深度神经网络)库。(请参见:深入了解 AuvizSystems 的卷积神经网络性能加速、云端的机器学习:FPGA 上的深度神经网络 以及 Auviz 图像处理及计算机视觉库与赛灵思 SDAccel 相配合,可为 FPGA 实现堪比 GPU 的性能。)

扩展阅读:

Xilinx 与 IBM 携手通过 SuperVessel 云实现 FPGA 加速

Xilinx 拓展生态系统和平台强化嵌入式视觉和工业物联网产品组合

面向数据中心与云服务器的 PCIe 加速卡来了!

FUTURE IS HERE! 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分