全球研究人员齐聚“NeuRRAM”神经形态芯片

海阔天空的专栏 2022-08-25 2731

描述

这些团队开发了第一个内存计算芯片，以比其他平台更低的能量和更高的精度来处理一系列 AI 应用程序。

边缘 AI 计算的圣杯是同时提供高效率、高性能和多功能性的芯片。获得所有这三个一直以来对设计人员构成了重大挑战，因此，许多人已经开始完全考虑新的计算架构。

其中一种新架构是内存计算，旨在消除数据移动瓶颈，以实现比传统数字处理单元更高的效率和更好的性能。本周，一组国际研究人员发表了一篇论文，描述了一种基于电阻随机存取存储器(RRAM) 的新型内存计算芯片。

RRAM

NeuRRAM 神经形态芯片。图片由UCSD提供

在本文中，我们将讨论用于内存计算 (CIM) 的 RRAM、这些解决方案的历史缺陷以及该小组的新“NeuRRAM”神经形态芯片。

用于内存计算的电阻式 RAM

在过去的 30 年中，设计人员一直在研究内存计算的想法，最近，基于电阻 RAM 的内存计算。

RRAM CIM 消除了冯诺依曼瓶颈，这是单独的内存和计算的结果，而是将它们合并在一起。在此架构中，电阻式 RAM 元件用于存储器存储，其中二进制数字基于每个单元中 RRAM 材料的电阻状态存储。在这里，施加电压可能会导致 RRAM 成为高电阻材料，代表数字 1，反之亦然。读取存储器中的位是通过向 RRAM 单元施加电压并读取产生的电流来实现的，该电流将根据 RRAM 的状态而变化。

RRAM

使用 RRAM CIM 单元的乘法示例。图片由 SemiWiki提供

RRAM 是一种非常节能、小型且非易失性的存储器。这种架构也非常适合人工智能计算的环境，因为机器学习计算严重依赖于可以用 RRAM 轻松实现的乘法和累加函数。由于感测电流能够读取 RRAM 结果，因此可以通过对一个或一系列结中的电流求和来轻松地将 RRAM 值相加和相乘。

RRAM CIM的缺点

尽管 RRAM CIM 有诸多好处，但这项技术的研发仍然充满了障碍。

一方面，早期的研究大多集中在 RRAM 芯片上执行 AI 计算，但仍然依赖片外资源来执行其他基本功能，例如模数转换和神经元激活。这不仅限制了系统性能，而且还影响了基准测试。从历史上看，结果是基于设备特性的软件仿真，这几乎总是乐观的。

除此之外，RRAM CIM 设备中的能源效率、多功能性和准确性之间存在固有的权衡。根据加州大学圣地亚哥分校 (UCSD)、斯坦福大学、清华大学和圣母大学的一组研究人员的说法，以前的研究从未尝试同时针对所有三个标准进行优化。

NeuRRAM 达到效率、准确性、灵活性

本周，来自加州大学圣地亚哥分校、斯坦福大学、清华大学和圣母大学的研究人员在 Nature 上发表了一份报告，描述了他们称之为NeuRRAM的 RRAM CIM 芯片。

据说 NeuRRAM 神经形态芯片由于采用了输出传感方法，实现了效率、准确性和灵活性的结合。与读取输出电流的传统技术相比，NeuRRAM 使用神经元电路来感应电压并在芯片上执行高效的模数转换。

RRAM

CIM 内核和 NeuRRAM 架构的框图。图片由Nature 和 Wan 等人提供

该架构包括与 RRAM 位单元共存的 CMOS 神经元电路。NeuRRAM 是一种神经形态的 AI 芯片，由 48 个神经突触核心、256 个 CMOS 神经元和 65,536 个 RRAM 单元组成，它们执行并行处理，可以支持数据和模型并行性。这允许将不同的模型层映射到不同的内核以实现最大的多功能性。

国际研究人员团队声称，该芯片可以实现比传统数字处理器低 2.3 倍的能量延迟积 (EDP)，同时还提供高达 13 倍的计算密度。据说 NeuRRAM 的手写数字识别准确率达到 99%，图像分类准确率达到 85.7%，语音识别准确率达到 84.7%。

总而言之，该研究表明，该芯片与传统数字芯片的精度相匹配，但能量消耗显着减少，密度更高。设计该芯片时考虑到边缘计算的研究人员声称，NeuRRAM 的低功耗和高性能可能会启用目前无法使用现有技术的新型设备。

审核编辑黄昊宇

打开APP阅读更多精彩内容