深度学习是一种关键的计算方法,它正在推动技术的发展——处理海量数据并发现人类永远无法自行辨别的微妙模式。但为了获得最佳性能,深度学习算法需要得到正确的软件编译器和硬件组合的支持。特别是,允许根据需要灵活使用硬件资源进行计算的可重构处理器是关键。
在最近的一项研究中,香港的研究人员报告了一种名为 ReAAP 的新型可重构处理器,其性能优于几种常用于支持深度神经网络 (DNN) 的计算平台,深度学习是一种有用的形式,通常涉及具有许多计算密集型的大型数据集数据层。他们在 10 月 10 日发表在IEEE Transactions on Computers上的一篇论文中对其进行了描述。
在他们的研究中,研究人员将他们在 ReAAP 中提出的软件编译器与 Nvidia GPU 和 ARM CPU 上的其他三个基线软件编译器进行了比较。结果表明,它的执行速度是运行在GPU并且是运行相同软件编译器的 1.6 到 3.3 倍在中央处理器上.
此外,Zheng 指出,ReAAP 为各种不同的计算密集层实现了硬件资源的持续高利用率。
虽然 ReAAP 擅长处理具有典型数据密集型工作负载的 DNN,但它目前不太适合在数据稀疏时支持 DNN。郑说他的团队希望在未来解决这个问题。更重要的是,研究人员希望以 ReAAP 为基础,使其能够更好地处理量化数据(处理的数据以一种显着降低神经网络的内存需求和计算成本的方式)。
“在 [ReAAP 更好地处理量化数据] 的扩展完成和评估后,我们将考虑将其与其他几个人工智能计算加速解决方案一起商业化,”郑说,并指出这将使 ReAAP 在资源方面更有效率受限平台,例如各种物联网 (IoT) 设备。
而普通处理器通常允许数据使用特定的硬件路径进行处理,可重构处理器提供了一种更具适应性的选择:重新配置最有效的硬件资源以根据需要处理数据。
“可重构处理器结合了软件灵活性和硬件并行性的优势,”参与该研究的香港科技大学电子与计算机工程系博士后研究员郑建伟解释道。
这些优势促使他的团队创建了 ReAAP,这是一个集成的软硬件系统。它的软件编译器负责评估和优化各种深度学习工作负载。一旦确定了并行处理数据的最佳解决方案,它就会发送指令重新配置硬件协处理器,从而分配适当的硬件资源来进行并行计算。“作为端到端系统,ReAAP 可以部署以加速各种深度学习应用程序,只需在 [the] 软件中为每个应用程序定制一个 Python 脚本,”Zheng 解释说。
审核编辑 :李倩
全部0条评论
快来发表一下你的评论吧 !