嵌入式视觉处理器让神经网络性能翻倍

嵌入式技术

1330人已加入

描述

DesignWareEV6xVisionProcessor集成了多达4个512位向量DSP和1个CNN引擎,为各种当前和新兴的嵌入式视觉应用提供可扩展性能。

含专用可编程CNN引擎的EV6x处理器支持所有CNN图形:MetaWareEVDevelopmentToolkit是一套支持OpenCLC、OpenVX和OpenCV的工具,可简化应用软件的开发:MetaWareEVDevelopmentToolkit中的新CNN映射工具可将处理任务自动分派给可用的硬件资源,以便加快执行速度

新思科技(Synopsys,Inc.,纳斯达克股票代码:SNPS)日前宣布:已经增强了DesignWare®EV6xVisionProcessor中的卷积神经网络(CNN)引擎,以应对高性能嵌入式视觉应用越来越高的视频分辨率和帧率要求。在实施16nmFinFET制程技术时,通常条件下,CNN引擎可提供高达每秒4.5TeraMAC的计算能力,其性能是以前的SynopsysCNN引擎的4倍。
       它还支持系数和特征映射压缩/解压缩,以降低数据带宽要求,降低功耗。视觉CPU从一个向量DSP扩展到四个向量DSP,可与CNN引擎并行运行,从而为*驾驶辅助系统(ADAS)、视频监控、增强现实和虚拟现实、同步定位与建图(SLAM)等一系列高性能嵌入式应用提供*的吞吐量。

MorphoUS,Inc.副总裁ToshiTorihara表示:“在神经网络中,嵌入式视觉应用核心的技术需求需要提供将高精度和高性能与低功耗和小面积相结合的解决方案。DesignWareEV6xVisionProcessor独特地结合了向量DSP和可编程CNN引擎,支持设计人员在其嵌入式设备中实施视觉功能,该嵌入式设备的性能效率高于基于CPU和GPU的替代方案。”

DesignWareEV6x处理器系列集成了标量、向量DSP和CNN处理单元,可进行高度准确、快速的视觉处理。EV6x支持所有卷积神经网络,包括AlexNet、VGG16、GoogLeNet、Yolo、FasterR-CNN、SqueezeNet和ResNet等受欢迎的神经网络。
       设计人员可以在EV6x的12位CNN引擎上运行原本为32位浮点硬件准备的CNN训练图形,从而在维持相同的检测精度时显著降低其设计的功耗和面积。在使用16-nmFinFET制程技术实施时(*糟的情况下),引擎提供高达每秒每瓦2,000GMAC的能效。EV6x的CNN硬件还支持为8位精度训练的神经网络,以利用内存带宽较低、图形类型功耗要求较低的优势。

为了简化应用软件开发,有一套全面的工具和软件支持EV6x处理器。*新版本DesignWareARC®MetaWareEVDevelopmentToolkit包括CNN映射工具,它能分析使用Caffe和Tensorflow等受欢迎的框架训练的神经网络,并自动生成用于可编程CNN引擎的可执行文件。为了尽可能灵活和防止过时,该工具还能在视觉CPU和CNN资源间分配计算,以支持新兴的全新神经网络算法以及客户特定的CNN层。结合基于OpenVX™、OpenCV和OpenCLC嵌入式视觉标准的软件开发工具,MetaWareEVDevelopmentToolkit允许设计人员拥有加速嵌入式软件开发所需的全套工具。

SynopsysIP营销副总裁JohnKoeter表示:“随着高性能神经网络在人工智能应用中变得更加普及,设计人员需要硬件技术和软件技术才能按时提供支持视觉的SoC。凭借经过硅验证的EV6xVisionProcessor的性能和功能增强,设计人员可以更有效地设计和部署基于机器学习的应用,使这些应用具有在市场中脱颖而出所需的性能和能效。” 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分