电子说
近期,鄢贵海团队研究成果在计算机体系结构领域国际顶级期刊《IEEE Transactions on Computers》中发表。该研究主要围绕KPU敏捷计算架构展开,KPU具有超强异构核集成和调度能力,在降低了规模限制的硬件成本和设计周期的同时,又可通过软件编程实现不同功能的计算,具有较高的可扩展性和灵活性。中科驭数DPU芯片基于自研KPU架构设计。以下是部分研究内容:
————————
领域特定架构技术显著提升了计算性能。然而,随着数据量呈指数增长以及应用类型的丰富,面向某一特定计算操作的加速器难以处理复杂的工作负载和应用需求,现有的加速器设计也难以满足大规模数据计算需求。主要挑战在于建立一个灵活的框架,能够充分利用这些粗粒度的特定计算加速单元执行复杂计算,同时避免硬件集成、编程、系统编译和运行等引入的额外开销。
核处理单元(Kernel Processing Unit, KPU)架构基于“软件定义加速器”方法实现,是一种为加速特定领域核心功能计算而设计的协处理器架构,能够有效解决“专用”的困境。KPU以功能核作为基本单元,直接对应用中计算密集型应用进行抽象核和高层综合,实现以数据为中心的架构“定制”。KPU具有超强异构核集成和调度能力,一颗 KPU根据需求可以集成数十至数百个功能核。在运行机制上,KPU采用“数据驱动并行计算”的方式,运行过程中通过数据流来激活不同的功能核进行相应计算。通过高层次综合,既实现了领域内硬件的统一,降低了规模限制的硬件成本和设计周期,又能通过软件编程实现不同功能的计算;特定需求只需要增删功能核的种类和数量即可。在整体计算效率提升百倍的前提下,仍然具有非常高的可扩展性和灵活性。

基于KPU架构的思想,面向数据库的KPU-SQL架构的核心是设计统一的接口以整合所有数据查询操作。在硬件架构方面,KPU-SQL集成了多个独立设计的查询操作计算单元,通过对这些特定功能计算核的充分优化,最大程度上提升数据查询性能。在数据管理方面,KPU-SQL集成一种高效数据管理系统(DMS)充分优化数据流,利用流式计算方法最大化片上内存带宽的利用率。面向数据库查询这一典型的应用场景,设计KPU指令集架构KISA,从查询关键操作的层次抽象关键算子,实现KPU-SQL的并行编程。在上层软件的支持方面,KPU-SQL提供了一个完整的软件编程工具并充分优化数据库查询操作执行。设计了一种自适应卸载机制,充分协同CPU和加速器的计算能力,优化执行中的计算和数据传输开销。在数据查询标准测试集TPC的典型实验中,KPU-SQL比通用CPU和GPU取得24.5倍和8.75倍性能提升。

审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !