为大家介绍促进存算一体芯片快速发展的各类原因

描述

作为后摩尔时代突破芯片性能瓶颈的主流技术方向之一,存算一体正在被更多人关注和认可。

存算一体直接将数据存储单元和计算单元融合为一体,能够大幅减少数据搬运带来的功耗损失,同时,也减少了等待数据读取时的算力浪费,极大提高了计算并行度和能效。这一架构设计直接打破“存储墙”和“功耗墙”,可以从根本上解决冯·诺伊曼的架构瓶颈。

存算一体的概念并不难理解,这一设计思路的出现甚至可以追溯到20 世纪 60 年代。但直至最近几年,存算一体才真正从概念走向产品。此前,为什么存算一体没有被业内广泛应用?

Q

存算一体为什么之前没有被广泛应用?

实际上,“存算一体”并非横空出世的新鲜事物,设计人员很早就有了存算一体的设计思路,从上世纪70年代就一直持续有相关的研究工作在发表。

CMOS

图1. 相关文献整理

但是,这方面工作一直不温不火,直到2012年后又逐渐受到学术界和工业界的重视,主要原因可以概括为几个方面:

1)处理器计算吞吐和内存带宽差距增大。早期处理器的计算吞吐和内存带宽的差距并不明显,但是随着 CMOS 工艺的快速发展、以及多核/众核处理器架构成为主流,处理器的计算吞吐能力增长的速度远超内存带宽的增长速度。因此,存储墙的问题愈发严重;

2)应用访存数据量增大、数据局部性变差。传统的处理器设计通过增加多级的片上缓存(cache)来缓解内存带宽不足的问题,但是由于深度学习、图计算、推荐系统等大数据应用的访存数据量愈来愈大、数据局部性变差,导致处理器的缓存架构难以发挥作用;

3)新兴应用包含大量、可并行的、乘累加计算。以深度学习应用为例,主流模型80%以上的计算都是可并行的乘累加(MAC)操作,面向这类“简单”的操作,使得计算单元和存储单元的深度融合(即CIM),无论以数字还是模拟方式都变得可行;

4)STT-MRAM、RRAM 等新型存储器的发展。一方面,新型存储器有潜力提升片上存储的密度,从而缓解存储墙的问题。另一方面,这类新型存储器为 MAC 计算单元和存储单元的融合提供了新的机遇;

5)领域定制计算架构的兴起。最后值得一提的是,随着摩尔定律的放缓,领域定制计算架构的优势愈发明显,而存算一体正是一种适合AI、图计算、推荐系统等领域的定制计算架构。

未来将是存算一体应用的爆发期,将会被广泛应用。但是我们也认为存算一体架构并不会全面取代现有架构的 AI 芯片(如GPU等),而是会长期共存,不同的架构有各自更加擅长的场景,多样化架构的并存,甚至异构结合、优势互补,才是更加更合理的情形。选择架构需要综合考虑应用场景、模型数量/功能/大小、存储工艺、集成方式、计算精度等多方面因素,具体分析可以参考前述几问的阐述。





审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分