Maxim将AI推向边缘 MAX78000低功耗神经网络加速微控制器

控制/MCU

1877人已加入

描述

  日前,模拟芯片大厂Maxim Integrated发布了一款名为MAX78000的革命性芯片。按照他们的说法,这颗低功耗神经网络加速微控制器能将人工智能(AI)推向边缘端,更重要的是,因为其低功耗特性,那就意味着即使在将其应用在电池供电的物联网(IoT)设备里,芯片性能并未受到影响。

  

  如上图所示,新芯片MAX78000包括两个超低功耗内核——Arm Cortex-M4内核和RISC-V内核——一个基于FPU的微控制器和一个卷积神经网络加速器。按照他们的说法,之所以他们采用了一个RISC-V内核,是因为在将消息传入加速器之前,RISC-V是一个很好的低功耗选择。根据MAXIM的设计,客户可以在使用的时候,选择两个集成微控制器内核中的一个。

  按照他们的介绍,该芯片具有一些令人印象深刻的规格,特别是在功耗和延迟方面。

  

  Maxim Integrated指出,得益于这个芯片的优越设计,在执行AI推理时,芯片的功耗大幅降低,同时还能在以电池供电的设备中,执行以前被认为是不可能任务的复杂新AI的用例。他们强调,这些功耗改进在延迟或成本上也没有丝毫妥协。

  从他们提供的数据可以看到,在与运行在低功耗微控制器上的软件解决方案相比,MAX78000执行推理的速度快100倍,而其成本仅为FPGA或GPU解决方案的一小部分。该公司继续表示,运行MNIST时,MAX78000的能耗降低1100倍;在MNIST时,延迟提高了400倍;与低功耗的Cortex M4F相比,关键字发现期间的能耗低600倍;与96 MHz Cortex M4F相比,关键字发现的效率提高了200倍。

  能获得以上的AI性能表示,其独特的加速器设计是关键。

  此SoC中最独特的功能是神经网络加速器,它是专用硬件,旨在最大程度地减少卷积神经网络(CNN)的能耗和等待时间。

  根据他们的说法,这个加速器所采用的体系结构是完全专有和新颖的。它的设计目标是最大程度地减少数据移动,这能极大降低SoC的能量损耗,尤其是在处理CNN链中的复杂数学配置时。

  Maxim指出,他们的CNN引擎具有442KB的权重存储,可以支持1位,2位,4位和8位权重(最多支持350万个权重的网络)。因为CNN权重存储器基于SRAM,所以可以实时进行AI网络更新。CNN引擎还具有512KB的数据存储器,同时CNN的体系架构是高灵活性,从而允许网络中像PyTorch和TensorFlow常规工具集来训练,然后使用Maxim提供的工具将其转换,让其在MAX78000上运行。

  Maxim方面表示,这个SoC的另一个特征是微控制器的介入最少。一般而言,此架构中的MCU用于配置网络,加载数据并启动它。MCU完成其最初的工作后,它基本上就置身事外。因为在他们看来,MAX78000的核心是专用硬件,旨在最大程度地减少卷积神经网络(CNN)的能耗和等待时间。为此该硬件在运行时几乎不受任何微控制器内核的干扰,从而极大地简化了操作。

  事实证明,这对于提高能源效率也极为重要。

  该设备还可以在执行之前加载数据,从而消除了在推理过程中访问内存的需求,从而降低了能耗并改善了延迟。Maxim方面强调:“不需要外部存储器,这实际上是我们节省能源的方法之一,因为所有存储器都在芯片上。”

  根据Maxim Integrated的说法,该设备可能为系统提供了在边缘执行实时决策的能力(比基于云的计算更快),并且无需担心安全性。

  

  通过将AI带到边缘设备,该设备可以启用新的应用,例如毫秒之内的面部ID或数据处理助听器。这样,MAX78000可能是“切断嵌入式设备电源线”的重要一步。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分