利用英伟达ARM HPC开发套件开发下一代HPC应用程序

描述

  NVIDIA 宣布可使用 NVIDIA Arm HPC Developer Kit 和 NVIDIA HPC SDK 进行预订购。从那时起, NVIDIA 及其合作伙伴一直在努力将设备交到开发人员手中,以提高全球可用性,并增强软件堆栈。

  全球可用性

  英伟达 ARM HPC 开发套件基于千兆位 G242-P32 2U 服务器。它包括 ARM CPU 、两个 A100 GPU 、两个 NVIDIA BlueField – 2 数据处理器( DPU )和英伟达 HPC-SDK 套件工具。

  这提供了对单节点和多节点配置的支持。可通过 GIGABYTE 订购全球交付的装置。

  已运行 HPC 代码的用户

  第一个处理器已经被应用于包括洛斯阿拉莫斯国家实验室( LANL )、莱斯特大学、橡树岭国家实验室( ORNL )和***高性能计算中心( NCHC )的网站。他们成功地部署了多节点配置,并向用户开放系统以运行 HPC 代码。

  洛斯阿拉莫斯国家实验室

  “洛斯阿拉莫斯国家实验室有一系列与国家安全任务空间相关的要求。在此背景下,我们评估、部署并将许多先进技术集成到我们的生态系统中。这些技术的一贯目标是改进我们对任务要求的响应。

  “作为我们 2023 HPE / NVIDIA 系统的一部分,该系统将利用 NVIDIA 的 Grace 基于 Arm 的 CPU ,洛斯阿拉莫斯一直在与 Arm 生态系统软件和硬件合作。考虑到这一点,我们已经部署了早期开发测试系统,我们看到了良好的成功 MIG 评级和开发新代码。其中一个我们正在积极进行硬件和软件代码设计的代码是一个名为 Phoebus 的天体物理学代码。”—— LANL 首席架构师史蒂夫·普尔( Steve Poole )。

  莱斯特大学

  “莱斯特大学,得益于 ExcBurr 硬件和启用软件程序和 STFC 狄拉克 HPC 设施的贡献,最近完成了 4X NVIDIA ARM HPC 开发者套件的部署,所有英国开发者都有兴趣在 Nvidia 安培架构上测试、移植和优化战略英国应用程序。真计算 Altra CPU 和 NVIDIA A100 GPU 。

  “由于 ExCALIBUR 等举措,英国在计算领域仍然处于领先地位。这一基于 Arm 的加速系统的加入为评估加速器在快速增长和多样化的 Arm HPC 生态系统中的作用提供了新的机会。我们欢迎 NVIDIA 在推动生态系统进入下一个 ac 时代方面的密切合作关系加速计算。”——马克·威尔金森,理论天体物理学教授, DiRAC HPC 设施主任。

  橡树岭国家实验室

  “在 ORNL ,我们期待着与 NVIDIA 合作,探索在 NVIDIA ARM HPC 开发者工具包上部署广泛的应用程序,因为性能可移植性在 HPC 中继续突出。” Ross Miller , ORNL 国家计算科学中心的系统集成程序员。

  软件栈增强

  NVIDIA 在增强 HPCSDK 和支持 Arm 上的全套 ML 工具方面继续取得快速进展。与 HPCSDK 不同, NVIDIA 宣布支持两种最流行的 深度学习框架 : PyTorch 和 TensorFlow 。

  此外, RAPIDS 软件库套件和 NVIDIA Triton Inference Server 将于年底在 Arm 上提供。

  英伟达 ARM HPC 开发工具包是第一个步骤,使 AR-HPC 生态系统 GPU 加速。 NVIDIA 致力于全面支持 Arm 的 HPC 和 AI 应用。

  关于作者

  Neeraj Srivastava 是 NVIDIA 的高级产品营销经理,专注于 NVIDIA 的数据中心 CPU 产品。在加入 NVIDIA 之前,他曾在 IBM 、 Dell 和 Flex 担任营销和技术职务。 Neeraj 从洛杉矶加利福尼亚大学获得学士学位。

  Jay Gould 是 NVIDIA 的高级产品营销经理,专注于 GPU 加速应用程序的 HPC 软件和平台。在 NVIDIA 之前,他曾在 Cray 、 Xilinx 和顶级 csp 从事高性能计算工作。杰伊在哈维·穆德学院获得学士学位。

  审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分