DPU为高性能计算系统提供空前的创新空间

描述

为了满足更先进的科研需求,全球各地的学术机构都在致力于重新设计代码和算法。英国的面向 E 级计算算法和基础设施优化的 ExCALIBUR (the Exascale Computing ALgorithms and Infrastructures Benefiting UK Research) 项目就是这样一个致力于为英国最重要的研究领域提供新一代高性能模拟软件的科研项目。这些领域涉及到计算高度密集型的应用,例如模拟整个宇宙的演变、了解地震波和引力波、评估海啸以及对物质的基本结构进行建模等。

新型计算方案的出现,包括智能且可编程的互连解决方案如 DPU(数据处理器)等,为研究人员在新的高性能计算系统上提供了空前的创新空间。NVIDIA BlueField DPU 集强大的网络计算引擎、高速网络和丰富的可编程性于一体,为最苛刻的应用提供了软件定义、硬件加速的解决方案。

拥有分布在剑桥大学、莱斯特大学、杜伦大学和爱丁堡大学这四所大学的计算资源的 DiRAC(Distributed Research utilising Advanced Computing)正在参与ExCALIBUR 项目,正在以全新的方式利用 BlueField DPU 丰富的可编程能力助力科学突破。

例如杜伦大学的计算宇宙学院和计算机科学系,他们正在对地震波和引力波的传播进行大规模模拟,该模拟使用动态笛卡尔网格和 ExaHyPE 代码将大部分的计算转化为多任务操作。

在过去几年中,他们付出了大量的精力来标记和识别那些需要与其它网格发生变化的节点或任务同步的关键任务。由于存在大量的低优先级任务,保证整个系统的负载平衡的工作量将会很大。即使达到最佳负载平衡后,一旦域内任何参数发生变化,系统立刻就会随之变得不平衡,要想再次达到最佳负载平衡会非常困难并且会耗费大量的时间或成本。

为了提升系统的应变能力,研究人员必须将轻量任务和闲置任务转移到其它资源上,但是,编排就会变得十分困难,同时通过调节 MPI 运行时来确保在正确的时间用正确的步长来进行计算,也会抢占计算资源。

凭借 BlueField DPU 计算核,杜伦大学可以使用 DPU 作为 MPI 处理引擎来节省计算资源,例如观察和引导任务,以及及时缓存/接受任务等。这项工作延伸了 ExaHyPE 组织内部的研究合作,尤其是 TUM 的 Michael Bader 小组,对于以 CPU 核心的计算任务提出来一个全新的观点,即开始由智能网络承担起数据处理工作。

伦敦大学学院的研究生 James Legg 正在使用 BlueField DPU 通过使用基于任务的调度机制来加速计算代码。James 的研究方向就是使用 BlueField DPU,尤其是其 Arm 处理器子系统来作为任务调度器,由主机处理器来运行计算任务或内核。这颠覆了传统的加速卡运行在内核,由主机来管理所有任务的认知。以前,当调度器和内核都在主机上运行时,它们会强夺处理器资源,使得调度器的设计必须简单。在 BlueField DPU 上,调度器可以轻松拥有几个专用线程,实现了调度处理和与主机运行内核的并行化,并可以执行更复杂的调度操作。另外一项研究是如何在主机处理器完全不参与的情况下,利用 BlueField DPU 上的调度器在任意主机 RAM 之间移动计算数据。

CSD3 (Cambridge Service for Data Driven Discovery)是英国国家研究云,同时也是世界上性能最强大的科研云原生超级计算机之一。CSD3 通过 BlueField DPU 来卸载主机上的安全策略和存储框架等基础设施管理操作,同时提供了应用的加速与隔离,以此实现了 I/O 性能的最大化。这既实现了安全性又得到了裸金属性能,使研究人员能够以全新的方式进行研究。

以上只是研究人员如何利用 DPU 性能和可编程性来探索创新的一部分。为了进一步简化编程,加速创新,NVIDIA 推出了 DOCA SDK,使基础设施开发人员能够使用行业标准的 API,在 BlueField DPU 上快速创建网络、存储、安全、管理以及 AI 和高性能计算(HPC)应用和服务。凭借 DOCA,开发人员可以通过创建高性能、软件定义和云原生的 DPU 加速服务,对未来的超级计算基础设施进行编程。现在,开发人员即可通过注册提前体验。

责任编辑:haq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分