NVIDIA 宣布可使用 NVIDIA Arm HPC Developer Kit 和 NVIDIA HPC SDK 进行预订购。从那时起, NVIDIA 及其合作伙伴一直在努力将设备交到开发人员手中,以提高全球可用性,并增强软件堆栈。
全球可用性
英伟达 ARM HPC 开发套件基于千兆位 G242-P32 2U 服务器。它包括 ARM CPU 、两个 A100 GPU 、两个 NVIDIA BlueField – 2 数据处理器( DPU )和英伟达 HPC-SDK 套件工具。
这提供了对单节点和多节点配置的支持。可通过 GIGABYTE 订购全球交付的装置。
已运行 HPC 代码的用户
第一个处理器已经被应用于包括洛斯阿拉莫斯国家实验室( LANL )、莱斯特大学、橡树岭国家实验室( ORNL )和***高性能计算中心( NCHC )的网站。他们成功地部署了多节点配置,并向用户开放系统以运行 HPC 代码。
洛斯阿拉莫斯国家实验室
“洛斯阿拉莫斯国家实验室有一系列与国家安全任务空间相关的要求。在此背景下,我们评估、部署并将许多先进技术集成到我们的生态系统中。这些技术的一贯目标是改进我们对任务要求的响应。
“作为我们 2023 HPE / NVIDIA 系统的一部分,该系统将利用 NVIDIA 的 Grace 基于 Arm 的 CPU ,洛斯阿拉莫斯一直在与 Arm 生态系统软件和硬件合作。考虑到这一点,我们已经部署了早期开发测试系统,我们看到了良好的成功 MIG 评级和开发新代码。其中一个我们正在积极进行硬件和软件代码设计的代码是一个名为 Phoebus 的天体物理学代码。”—— LANL 首席架构师史蒂夫·普尔( Steve Poole )。
莱斯特大学
“莱斯特大学,得益于 ExcBurr 硬件和启用软件程序和 STFC 狄拉克 HPC 设施的贡献,最近完成了 4X NVIDIA ARM HPC 开发者套件的部署,所有英国开发者都有兴趣在 Nvidia 安培架构上测试、移植和优化战略英国应用程序。真计算 Altra CPU 和 NVIDIA A100 GPU 。
“由于 ExCALIBUR 等举措,英国在计算领域仍然处于领先地位。这一基于 Arm 的加速系统的加入为评估加速器在快速增长和多样化的 Arm HPC 生态系统中的作用提供了新的机会。我们欢迎 NVIDIA 在推动生态系统进入下一个 ac 时代方面的密切合作关系加速计算。”——马克·威尔金森,理论天体物理学教授, DiRAC HPC 设施主任。
橡树岭国家实验室
“在 ORNL ,我们期待着与 NVIDIA 合作,探索在 NVIDIA ARM HPC 开发者工具包上部署广泛的应用程序,因为性能可移植性在 HPC 中继续突出。” Ross Miller , ORNL 国家计算科学中心的系统集成程序员。
软件栈增强
NVIDIA 在增强 HPCSDK 和支持 Arm 上的全套 ML 工具方面继续取得快速进展。与 HPCSDK 不同, NVIDIA 宣布支持两种最流行的 深度学习框架 : PyTorch 和 TensorFlow 。
此外, RAPIDS 软件库套件和 NVIDIA Triton Inference Server 将于年底在 Arm 上提供。
英伟达 ARM HPC 开发工具包是第一个步骤,使 AR-HPC 生态系统 GPU 加速。 NVIDIA 致力于全面支持 Arm 的 HPC 和 AI 应用。
关于作者
Neeraj Srivastava 是 NVIDIA 的高级产品营销经理,专注于 NVIDIA 的数据中心 CPU 产品。在加入 NVIDIA 之前,他曾在 IBM 、 Dell 和 Flex 担任营销和技术职务。 Neeraj 从洛杉矶加利福尼亚大学获得学士学位。
Jay Gould 是 NVIDIA 的高级产品营销经理,专注于 GPU 加速应用程序的 HPC 软件和平台。在 NVIDIA 之前,他曾在 Cray 、 Xilinx 和顶级 csp 从事高性能计算工作。杰伊在哈维·穆德学院获得学士学位。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !