指向更快更节能的下一代人工智能,类脑芯片推动强智能应用落地

电子说

1.2w人已加入

描述

电子发烧友网报道(文/李宁远)我们正处于人工智能的大爆发之中,在过去十年中,人工智能已经从理论和小型测试发展到企业级用例。尤其是近几年人工智能时代中的智能化已经取得了长足的进步,但这仍然和我们电影中看到的那种智能化程度相去甚远。目前的人工智能基于大量的数据训练给出更为准确的回答,但不是智能地思考。

类脑技术正是为了解决人工智能思考的难题,模拟人类大脑处理信息的机制使得计算芯片及相应的硬件系统能够像人类一样思考,成为真正意义上的人工智能。

不久前,IBM基于此前TrueNorth类脑芯片的基础上推出了NorthPole,新的原型设备表现出比目前市场上任何其他芯片更高的能效、更高的空间效率和更低的延迟,并且比TrueNorth 快了近4000倍,能够帮助终端设备实现神经网络模仿类似大脑的行为逻辑。

类脑芯片

NorthPole,IBM官网

类脑芯片,更高性能下一代人工智能

类脑技术最早起源于八十年代的美国,当时一位生物学家和一位化学家通过半导体晶体管模仿神经元的形态,进而理解生物大脑的工作机制,这是类脑技术的起源。类脑芯片是实现类脑技术的基础硬件,是基于神经网络的新的数据存储和计算技术,通过模拟大脑的工作机理,突破传统计算处理大型问题时遇到的冯诺依曼瓶颈,可以在显著提高信息处理速度的同时大幅降低功耗,并且具有自我学习和自适应的能力。

自半导体产业诞生以来,计算芯片主要遵循相同的基本结构,其中处理单元和存储待处理信息的存储器是离散存储的。虽然这种结构带来了简单的设计,几十年来能够很好地扩展,但它造成了所谓的冯诺依曼瓶颈,需要时间和精力在内存、处理和芯片内的任何其他设备之间不断来回洗牌数据。

冯诺依曼架构的优势在于处理串行逻辑和数学问题,但内存和处理器之间的数据传输受总线能力的限制。遇到大型处理事件就会出现冯诺依曼瓶颈,需要的处理器要有极高的时钟频率并且能耗巨大。我们也看到现在用于运行人工智能系统的硬件的确是越来越强大,但其成本、能耗也是在飙升。

IBM研究院表示,“NorthPole开辟了一条与冯诺依曼架构完全不同的道路”。这颗芯片的速度和效率的大提升来自它所有的内存都在芯片上,每个核心都可以同样轻松地访问芯片上的存储器。这是一个完整的芯片网络,不再有冯诺依曼瓶颈。该架构模糊了计算和内存之间的界限,根据IBM研究院的说法,“在单个内核的层面上,NorthPole表现为近计算的内存,而从芯片外部的输入输出层面,它表现为活动内存”。

根据已经发布的芯片信息,NorthPole采用12纳米节点工艺制造,在800平方毫米内包含220亿个晶体管。NorthPole一共有256个内核,每个内核单周期内可以执行8bit精度的2048次操作。

基于12纳米节点工艺的类脑芯片,性能究竟如何?根据《科学》杂志上公布的测试结果,NorthPole在每焦耳功率所需的帧数上比常见的12纳米GPU和14纳米CPU的能源效率高出了25倍。每十亿个晶体管每秒处理帧数上,NorthPole在延迟和计算所需的空间方面也更出色。在流行的ResNet-50图像识别和YOLOv4目标检测模型的测试中,NorthPole表现出的性能均优于目前市面上所有主流架构,包括英伟达4纳米工艺GPU。

NorthPole的优势得益于模糊了计算和内存之间的界限,但这也是限制,任何板载内存的处理都能轻松地实现加速处理,而对其他来源的数据,处理性能则会受限。所以目前来说具有代表性的类脑芯片NorthPole展现出的性能也并不是万能的,不过它呈现出的效果也指明了一条更快更节能的人工智能道路。

国内类脑芯片进展,推动强智能应用落地

作为更快更节能的下一代人工智能技术,类脑芯片在国内同样备受重视,近年来一直有不少科研机构和企业在这条赛道上持续突破。上月,中国科学技术大学院士团队就制备出了基于二氧化钒相变薄膜的类脑神经元器件,并利用金刚石中氮-空位(NV)色心作为固态自旋量子传感器,探测了神经元突触在外部刺激下的动态连接,展示了类脑神经系统中多通道信号传递和处理过程。

北京灵汐科技作为一家类脑计算技术公司,基于领启KA200正在大力推进类脑应用的落地,灵汐科技去年曾宣布开始类脑感知端芯片、下一代类脑计算芯片的研发,今年类脑感知芯片工程样片Lyncam也已经成功点亮。

SynSense时识科技去年加速推动代表产品迭代,今年也开始大力推动类脑芯片在消费电子、智能穿戴、工业检测等应用领域全面落地。同时,SynSense时识科技延续在类脑视觉技术方面的积累,仍然在继续深挖高速动态视觉处理技术。今年,SynSense时识科技也推出了基于神经元时序编码的全新ANN-SNN转换方法,克服了类脑芯片上因传统频率编码造成突触操作数过多而导致的较高能耗问题,能够大大降低类脑芯片上有效突触操作和存储访问,从而显著降低了类脑芯片的实时推理功耗及延迟。

从目前类脑芯片在应用表现出的性能来看,其高算力低功耗是很突出的,类脑计算会更趋近于强智能应用,它更适用于多模态信息的处理,基于多模态的传感信息来做端侧的推理,对环境进行感应和交互。

独立供电,由电池驱动,并且会携带大量的传感器,需要做复杂的多模态传感信息的处理与环境和人进行交互的应用是目前类脑芯片最契合的应用场景。如SynSense时识科技的“感算一体”类脑芯片Speck今年与智能玩具、智能家居等合作伙伴的量产交付计划正在驶入快车道,微瓦级超低功耗类脑芯片Xylo则在消费电子、智能穿戴、工业检测等应用领域赋能众多智能传感器市场,在无人机、自动驾驶、机器人领域,类脑芯片高速动态视觉处理也在拓展类脑在高速视觉任务/跟踪、定位、避障等方面的应用空间。

当然,在传统的数据中心大算力应用上,国内厂商的类脑芯片也在进行相关应用的落地。灵汐科技基于领启KA200开发的模组、计算加速卡、计算服务器以比传统GPU更高的计算能效比和较强的模型兼容能力正在大力推进AI+IDC的产业融合。

前段时间马斯克旗下的脑机接口公司Neuralink带火了一波人体植入式设备的热潮,人体植入式设备应用需要一个既有算力能耗又极低的处理器,未来这也是类脑芯片很有优势的应用领域。

小结

目前类脑技术的发展非常快,相关产品的也在不断实现出现,不过距离其全面落地还存在一些挑战,成本上还是偏高,同时虽然类脑技术展现出了低功耗和高效处理能力但在成像质量、稳定性等方面存在一些问题。前沿技术的落地总是伴随着这些困扰,成熟应用落地尚需时日,但可喜的是类脑芯片已经为下一代人工智能指明了一条更快更节能的技术道路。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
评论(0)
发评论
jf_44411776 2023-11-22
0 回复 举报
你好 收起回复

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分