近日,清华大学发布的一颗忆阻器存算一体芯片,火了。该芯片的火爆源于一个月前,清华大学发的一篇论文:
2023年9月14日,清华大学吴华强及高滨共同通讯在Science在线发表题为“Edge learning using a fully integrated neuro-inspired memristor chip”的研究论文,论文显示,团队基于存算一体计算范式,研制出全系统集成、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片。
“忆阻器存算一体”这一概念瞬间引爆学界与产业界,甚至登上了微博高位热搜。据笔者获悉,清华大学所用的忆阻器件就是RRAM(ReRAM)。
此次清华大学科研成果的意义,不仅在于研发出首颗基于忆阻器(RRAM)的片上学习存算一体芯片,更在于为产业界存算一体存储介质的应用和发展给出了更多方向,以及在技术实践上的引导性意见。
本文试图探究,学界与产界为何要选择研发该路线?该路线的发展前景如何?
PART-01
忆阻器存算一体是为何物?
无论是从其官方表述,还是论文中“可重构的忆阻器存算一体架构图”,我们都能明确知道,清华大学所说忆阻器便是阻变存储器RRAM(ReRAM)。
2022年9月,清华大学集成电路学院钱鹤、吴华强教授课题组联合斯坦福大学、加州大学圣地亚哥分校(UCSD)、圣母大学等在《自然》(Nature)发表的题为A compute-in-memory chip based on resistive random-access memory研究论文。
该论文报道了一款基于忆阻器(阻变存储器)的存算一体芯片NeuRRAM。该芯片具有可重新配置的计算核心(reconfiguring CIM cores),可以兼容不同的模型结构。
(可重构的忆阻器存算一体架构 图源:清华大学) 专家表示,从定义来看,忆阻器(英文:memristor)为电阻受先前通过电荷量控制的电子器件,其特点为通常具有电流电压蝴蝶形回滞曲线。忆阻器的概念最早由蔡少棠教授提出,最早由阻变存储器,即RRAM实验验证,因此经常以RRAM作为忆阻器的代表。
当然,严格来说,根据材料和物理机制,忆阻器件可分为阻变存储器(Resistive Random-Access Memory, 简称RRAM或ReRAM),相变存储器(PCRAM),磁随机存储器(MRAM)和铁电随机存储器(FeRAM)等不同种类。此外还有光电忆阻器、有机材料忆阻器、流体忆阻器等。
也就是说,忆阻器有着诸多选项,那么为何要选择阻变存储器RRAM?
我们都知道的是,传统冯·诺依曼结构下,数据的存储和计算相互分离,即数据存储在储存器中,需要计算时再把它搬运到运算器里。然而,AI类应用(例如大模型)需要对大量数据进行矩阵运算,其核心是乘法和加法,在此情形下算力是比较吃紧的,面临着很大挑战。
如何拉近“存”“算”距离,即打破存储墙,成为AI计算的当务之急,清华大学给的解决方案便是基于忆阻器(RRAM)的存算一体。
具体来说,如果用交叉阵列的方式做忆阻器,就可获得一种与矩阵很类似的结构,这种结构既可以存数据,也可以做计算。需要存储时,忆阻器本身就是存储器;而需要运算时,也无需把数据从存储器中搬到运算器里,因为忆阻器可直接用欧姆定律来做乘法运算。
如此,数据便能“原地”计算,大大降低了由于数据“跑来跑去”所带来的消耗。
除此之外,忆阻器(RRAM)还有着其他优点:比如尺寸小、速度快、与 CMOS(互补式金氧半导体)工艺可兼容等。
于是,又能算又能存的忆阻器(RRAM)成了缓解算力焦虑的良药,引得包括清华大学在内的多方精英竞相布局。
PART-02
忆阻器(RRAM),学界与产界公认的存算一体最佳器件
尽管有着诸多好处,忆阻器(RRAM)作为存储器的发展却十分坎坷。
2000年便有企业着手研发——夏普购买了美国休斯敦大学忆阻器(RRAM)的相关专利进行相关布局,但到了去年才真正在业内迎来应用的爆发。
那么,为何忆阻器(RRAM)在去年才迎来爆发时刻?
这是因为,根据以往经验,找到合适的赛道,往往是存储器大放光彩的转折点。现如今,忆阻器(RRAM)作为存算一体AI计算的存储介质,在AI大算力场景发光发热。 例如NOR Flash,便是凭借更快的读取速度、可随机访问等特点,在功能机时代夺得一席之地;所以,当功能机时代过去后,NOR Flash一度低迷。
而当外挂一个高可靠性、快速读取的存储器又成为解决AMOLED面板的蓝色光会随时间消退的问题的最优解,NOR Flash,又随着AMOLED的需求迎来自己的第二春。 而在存算一体芯片的存储器件选择中,基于忆阻器(RRAM)设计的存算一体芯片具有非易失性、读写速度快、稳定性强、功耗低、 CMOS工艺兼容、微缩化发展天花板高等优势,相比于SRAM、Flash,忆阻器(RRAM)更适用于存算一体AI大算力赛道。
不过,据EETOP表示,忆阻器依然面临着严峻的挑战,其中一个关键挑战就是模拟计算的误差累积。
在机器之心有关清华大学可重构数字存算一体架构主题的文章中提到,模拟计算由于工艺偏差、信号噪声等因素容易产生计算误差,通常最高只能支持INT8数据格式,难以支持更高位宽计算。
这就导致当前的模拟存算一体AI芯片通常只能同时激活很小部分存储器阵列。这限制了它们单位面积下的计算能力,使得兼顾能效和精度变得更加困难。
而数字存算一体并不受信噪比影响,精度可以达32bit甚至更高,且可支持浮点计算。同时,数字存算一体对于不同制造工艺、电源电压和温度的变化呈现很强的鲁棒性。
故,相比于模拟存算,数字存算的方式可以实现更高的运算精度以及更好的可靠性。
据笔者对国内存算一体项目的了解,现阶段仅有亿铸科技基于忆阻器(RRAM)实现了数字存算一体POC芯片的回片及成功验证。据悉,公司名中“亿铸”二字便来源于忆阻器中“忆阻”二字的谐音。
而亿铸科技这颗存算一体POC芯片是首颗基于忆阻器(RRAM)的面向数据中心、云计算、自动驾驶等大算力场景的存算一体芯片。该芯片的能效比表现,远超预期——能够达到同等工艺下传统架构AI算力芯片的20倍以上。
现如今,随着工艺的不断成熟,学界关于忆阻器(RRAM)存算一体的研究正愈发积极:在2022年度ISSCC会议上,台积电发表六篇关于存内计算存储器IP的论文,大力推进基于忆阻器(RRAM)的存内计算方案。
而在产业界中,亿铸科技从公司创立之初就坚定地选择忆阻器(RRAM)存算一体路线。
尽管过去业内对忆阻器(RRAM)有着“不够成熟、主要面向小算力应用场景”等误解,不过自2023年始,多家存算一体AI芯片初创公司也纷纷公开表示,未来将布局基于忆阻器(RRAM)的存算一体产品。
例如,在2023光锥智能线上对谈之中,以研发SRAM存算芯片为主的苹芯科技创始人杨越表示,以RRAM为代表的新型存储器在低功耗和存储密度方面存在天然的优势,在过去五年里工艺和良率有大幅度提升。
在2023 AI芯片峰会上,同样是以研发SRAM存算芯片为主的千芯科技董事长陈巍直言忆阻器(RRAM)存算一体的好处:以RRAM为代表的存算一体方案的存储架构缩短为两层,几乎是大模型运算的极限,因此更有助于进行大模型的运算。
现如今,基于冯诺依曼传统架构的摩尔定律走向物理极限,“算力焦虑”无法再通过提升先进制程缓解。以忆阻器(RRAM)存算一体等为代表的一系列新技术,才是真正的“对症下药”。
越来越多的AI芯片厂商们,正通过硬件层面的革新,把AI技术,带进数据中心、自动驾驶等大算力场景之中。
忆阻器(RRAM)存算一体,终于迎来自己的“美丽人生”。
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !