边缘计算和人工智能

今日头条

1112人已加入

描述

Greenwaves 展示了其最新的人工智能芯片 GAP9。就像上一代一样,它的目标是在网络边缘的系统中进行 AI 推理。

边缘计算将越来越成为数字化转型现象不可或缺的一部分。使用这些技术的主要好处是减少处理延迟,允许实时响应,以及节省带宽,将已处理的信息发送到数据中心,因此,将更小的信息发送到数据中心。

与 GreenWaves Technologies 目前出货的产品 GAP8 相比,最新的 GAP9 将能耗降低了 5 倍,同时在神经网络上的推理能力提高了 10 倍。GAP9 建立在与 GAP8 相同的 GAP 架构布局之上。GreenWaves 的 GAP8 是业界首款超低功耗处理器,旨在以极低的成本和功耗传输高边缘处理能力。它在物联网 (IoT) 应用中启用电池供电的人工智能 (AI)。

GreenWaves Technologies 营销副总裁 Martin Croome 表示:“目前,人们对将 AI 处理转移到 ADAS、安全摄像头、机器人和手机等应用程序的边缘产生了很大的兴趣。” “我们专注于我们认为将成为下一波边缘设备的产品,我们称之为边缘设备。这些设备的功率受到极大限制——例如,带有非常小的可充电电池的可穿戴设备需要数周或数月的电池寿命,或者无法使用电源或安装成本高昂的传感器。如果您必须安装电缆来为传感器供电,这样做的成本通常是传感器本身成本的许多倍。然后一些传感器可能离主电源很远。他们可能在一个领域的中间或类似的地方,几乎不可能给他们权力。

GAP8 是基于开源 RISC-V 和 PULP(并行超低功耗处理平台)平台的物联网应用处理器。它为下一代连接设备开辟了新的可能性。GAP8 支持以具有成本效益的方式开发智能设备,这些设备可以捕获、分析、分类和作用于图像、声音、雷达、红外或振动等丰富数据源的融合。GAP8 的工作功率从活动模式下的几十毫瓦到睡眠模式下的几微瓦不等,因此设备可以使用电池使用数年。GAP8 经过优化,可以执行广泛的图像和音频算法,包括具有极高能效的卷积神经网络推理。

“在 GAP8 中,我们的第一款产品现已投入生产,我们使用 RISC-V 指令集架构的可扩展性来提高能源效率,”Croome 说。“GAP8 在一个集群中有八个 RISC-V 内核,然后是一个额外的第九个 RISC-V 内核,我们将其用作控制器,有点像芯片的 MCU。信号处理和机器学习算法是集群中并行化的良好目标。如果您在八个核心上并行计算,您希望尽可能接近完成工作的八倍。这个因素被称为加速。我们专注于通过在硬件中实现所有任务分叉和同步原语以及许多其他优化来获得非常好的加速。然后,我们使用我们实现的加速不是做更多的工作,而是在较低的时钟速度下做同样数量的工作。反过来,这使我们能够降低芯片内部的电压,从而为我们带来二次功率优势。该芯片集成了动态频率和电压控制,因此我们可以通过不断调整时钟速度和电压来适应我们正在执行的任务来节省能源。”

分层架构通过组合一系列高度自主的智能 I/O 外设来连接外部设备,从而实现非常低的功耗操作。一个由八个内核组成的集群,其架构经过优化以执行向量和并行算法,并结合了专门的卷积神经网络加速器 (HWCE)。所有内核和外围设备都可以根据需要切换功率、电压和频率。集成了具有超快重新配置时间的 DC/DC 稳压器和时钟发生器,以优化电源管理。集群和 HWCE 内核共享对内存区域和指令缓存的访问。多个 DMA 允许在内存区域之间进行快速、低功耗、独立的传输。包含一个内存保护器以允许应用程序在 GAP8 上安全运行。

新的 GAP9增加了 AES128/256 加密的安全功能,并基于能够处理 8、IEEE 16、BFloat16 和 IEEE 32 中浮点数的创新跨精度浮点单元,全面支持所有内核的浮点运算。支持矢量化的位精度。GAP9 可处理复杂的神经网络,例如 MobileNet V1,在 12 毫秒内轻松处理 160 × 160 图像,通道缩放为 0.25,功耗为 806 μW/fps。与 GAP8 相比,GAP9 的有效内存带宽增加了 20 倍,通过同时分析来自多个不同传感器(如图像、声音和雷达)的数据流,显着提高了检测精度(图 1)。

 

GreenWaves Technologies 首席执行官 Loic Lietar 表示:“GAP9 将复杂的机器学习和信号处理功能的组合嵌入到消费、医疗和工业产品应用中,实现了新的功能水平。” “GAP 系列为产品设计人员提供了强大、灵活的解决方案,可将下一代智能设备推向市场。

“我们不会大量使用某种非常深奥的架构方法来加速卷积神经网络 (CNN),因为我们相信这个市场发展如此之快。每个月都有一千篇关于神经网络空间的新论文。我们希望确保我们能够加速今年和明年出现的所有新事物,而不是专注于去年的最佳创意。所以我们有一个卷积硬件加速器,它在某些情况下有助于降低能耗,但一般来说,架构是可编程的。”

人脸识别吸引了大量与安全应用相关的媒体报道,它是使用基于 SqueezeNet 的 CNN 实现的。CNN 是广泛用于计算机视觉的神经网络家族,更一般地说,用于处理具有空间关系的数据。CNN 遵循一定层次的架构,通常是非周期性的。

可以使用被动红外 (PIR) 技术激活人脸检测,以在没有人脸时进一步降低功耗。一旦检测到,该算法会在 128 × 128 像素的图像中发出适当调整大小的检测图像的坐标。该图像是人脸识别 CNN 的输入。CNN 的输出是检测到的人脸的 512 个参数(16 位大小)的签名。

为了加快上市时间,GreenWaves Technologies 设计了 GAPuino 板来促进 GAP8 的实施。GAPuino 可用作标准 Arduino Uno 板的替代品,并可连接到大多数 Arduino Uno 兼容的 3.3-V 或 5-V 屏蔽。通过添加 Arduino 通信屏蔽(蓝牙、WiFi、LoRa 等),可以在电池供电的设备上使用 AI 快速构建完整的物联网应用原型(图 2)。

 

有多种配件可供选择,例如带有 B&W 低功耗 QVGA 摄像头的模块和一个传感器板,该板增加了一组铰接式传感器,包括用于音频应用的四个数字麦克风。对于 GAP8 处理器,还有一个完整的 SDK,其中包括一个 RISC-V GCC/GDB 链工具,带有用于附加处理器指令的扩展,用于 MCU 端的工具,具有两个操作系统(PULP OS 和 RISC-V 上的 Mbed OS 端口/GAP8)。 

      审核编辑:彭静
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分