Maxim将AI推向边缘 MAX78000低功耗神经网络加速微控制器

电子工程师 2020-10-10 1373

控制/MCU

1888人已加入

描述

　　日前，模拟芯片大厂Maxim Integrated发布了一款名为MAX78000的革命性芯片。按照他们的说法，这颗低功耗神经网络加速微控制器能将人工智能（AI）推向边缘端，更重要的是，因为其低功耗特性，那就意味着即使在将其应用在电池供电的物联网（IoT）设备里，芯片性能并未受到影响。

　　如上图所示，新芯片MAX78000包括两个超低功耗内核——Arm Cortex-M4内核和RISC-V内核——一个基于FPU的微控制器和一个卷积神经网络加速器。按照他们的说法，之所以他们采用了一个RISC-V内核，是因为在将消息传入加速器之前，RISC-V是一个很好的低功耗选择。根据MAXIM的设计，客户可以在使用的时候，选择两个集成微控制器内核中的一个。

　　按照他们的介绍，该芯片具有一些令人印象深刻的规格，特别是在功耗和延迟方面。

　　Maxim Integrated指出，得益于这个芯片的优越设计，在执行AI推理时，芯片的功耗大幅降低，同时还能在以电池供电的设备中，执行以前被认为是不可能任务的复杂新AI的用例。他们强调，这些功耗改进在延迟或成本上也没有丝毫妥协。

　　从他们提供的数据可以看到，在与运行在低功耗微控制器上的软件解决方案相比，MAX78000执行推理的速度快100倍，而其成本仅为FPGA或GPU解决方案的一小部分。该公司继续表示，运行MNIST时，MAX78000的能耗降低1100倍；在MNIST时，延迟提高了400倍；与低功耗的Cortex M4F相比，关键字发现期间的能耗低600倍；与96 MHz Cortex M4F相比，关键字发现的效率提高了200倍。

　　能获得以上的AI性能表示，其独特的加速器设计是关键。

　　此SoC中最独特的功能是神经网络加速器，它是专用硬件，旨在最大程度地减少卷积神经网络（CNN）的能耗和等待时间。

　　根据他们的说法，这个加速器所采用的体系结构是完全专有和新颖的。它的设计目标是最大程度地减少数据移动，这能极大降低SoC的能量损耗，尤其是在处理CNN链中的复杂数学配置时。

　　Maxim指出，他们的CNN引擎具有442KB的权重存储，可以支持1位，2位，4位和8位权重（最多支持350万个权重的网络）。因为CNN权重存储器基于SRAM，所以可以实时进行AI网络更新。CNN引擎还具有512KB的数据存储器，同时CNN的体系架构是高灵活性，从而允许网络中像PyTorch和TensorFlow常规工具集来训练，然后使用Maxim提供的工具将其转换，让其在MAX78000上运行。

　　Maxim方面表示，这个SoC的另一个特征是微控制器的介入最少。一般而言，此架构中的MCU用于配置网络，加载数据并启动它。MCU完成其最初的工作后，它基本上就置身事外。因为在他们看来，MAX78000的核心是专用硬件，旨在最大程度地减少卷积神经网络（CNN）的能耗和等待时间。为此该硬件在运行时几乎不受任何微控制器内核的干扰，从而极大地简化了操作。

　　事实证明，这对于提高能源效率也极为重要。

　　该设备还可以在执行之前加载数据，从而消除了在推理过程中访问内存的需求，从而降低了能耗并改善了延迟。Maxim方面强调：“不需要外部存储器，这实际上是我们节省能源的方法之一，因为所有存储器都在芯片上。”

　　根据Maxim Integrated的说法，该设备可能为系统提供了在边缘执行实时决策的能力（比基于云的计算更快），并且无需担心安全性。

　　通过将AI带到边缘设备，该设备可以启用新的应用，例如毫秒之内的面部ID或数据处理助听器。这样，MAX78000可能是“切断嵌入式设备电源线”的重要一步。

打开APP阅读更多精彩内容