NVIDIA发布cuPyNumeric加速计算库

描述

该加速计算库帮助科研人员无缝地扩展到强大的计算集群,并且无需修改 Python 代码,推进科学发现。

无论研究纳米级电子行为,还是数百万光年之外的星系碰撞,众多科学家都面临着一个共同的挑战,那就是必须梳理数 PB 的数据,才能从中获得能够推动相关领域发展的洞察。

借助 NVIDIA cuPyNumeric 加速计算库,科研人员现在可以将他们的数据处理 Python 代码毫不费力地运行在基于 CPU 的笔记本电脑、GPU 加速工作站、云服务器或大型超级计算机上。处理数据的速度越快,科学家们就能越快地针对有前景的数据点、值得研究的趋势以及实验调整做出决策。

想要跃进到加速计算,科研人员并不需要计算机科学方面的专业知识。他们只需使用熟悉的 NumPy 界面编写代码,或将 cuPyNumeric 应用于现有代码,并遵循最佳实践即可享受到卓越的性能和可扩展性。

一旦使用了 cuPyNumeric,他们就可以在一个或数千个 GPU 上运行代码,并且无需修改任何代码。

最新版 cuPyNumeric 现已在 Conda 和 GitHub 上发布,它支持 NVIDIA GH200 Grace Hopper 超级芯片、运行时自动进行资源配置以及改进的内存扩展。它还支持 HDF5,这种在科学界非常流行的文件格式有助于高效地管理大型的复杂数据。

SLAC 国家加速器实验室、洛斯阿拉莫斯国家实验室、澳大利亚国立大学、马萨诸塞大学波士顿分校、斯坦福大学湍流研究中心和印度国家支付公司等机构的科研人员均集成了 cuPyNumeric,这显著地改善了他们的数据分析工作流程。

少即是多:无需修改代码

即可享受到无限的 GPU 可扩展性

Python 是数据科学、机器学习和数值计算领域最常用的编程语言,被天文学、药物发现、材料科学和核物理等科学领域的数百万科研人员所使用。GitHub 上数以万计的软件包都依赖于 NumPy 数学和矩阵库,该库在上个月的下载量超过 3 亿次。所有这些应用都能受益于 cuPyNumeric 加速计算。

许多科学家都在构建使用 NumPy 的程序,并在一个仅采用 CPU 的节点上运行,这限制了其算法的吞吐量,无法处理电子显微镜、粒子对撞机和射电望远镜等仪器收集的日益庞大的数据集。

通过提供一个可扩展到数千个 GPU 的 NumPy 替代品,cuPyNumeric 帮助科研人员跟上数据集日益增长的规模和复杂性。从单个 GPU 扩展到整个超级计算机时,cuPyNumeric 不需要更改代码。这使得科研人员可以轻松地在任何规模的加速计算系统上运行分析。

解决大数据问题,加速科学发现

美国能源部下属的 SLAC 国家加速器实验室(由斯坦福大学运营)的科研人员发现,cuPyNumeric 可帮助他们更快地使用直线加速器相干光源进行 X 射线实验。

一个专注于半导体材料科学发现的 SLAC 团队发现,cuPyNumeric 将数据分析应用程序的速度提高了 6 倍,将运行时间从几分钟缩短到几秒钟。凭借这样的提速,该团队能够在这个高度专业化的设施内同时进行重要的分析和实验。

通过更高效地进行实验,该团队预计将能更快地发现新的材料特性、分享成果并发表论文。

以下机构也正在使用 cuPyNumeric:

澳大利亚国立大学的科研人员利用 cuPyNumeric 来扩展勒文伯格-马夸尔特优化算法,以便在澳大利亚国家计算基础设施中的多 GPU 系统上运行。虽然该算法可用于多种应用,但科研人员的最初目标是构建大规模的气候和天气模型。

洛斯阿拉莫斯国家实验室的科研人员正在运用 cuPyNumeric 来加速数据科学、计算科学和机器学习算法。cuPyNumeri 将为他们提供更多工具,以便有效地利用最近推出的 Venado 超级计算机,该超级计算机配备了 2,500 多颗 NVIDIA GH200 Grace Hopper 超级芯片。

斯坦福大学湍流研究中心的科研人员正在开发基于 Python 的计算流体动力学求解器,该求解器可使用 cuPyNumeric 在大型加速计算集群上大规模地运行。这些求解器可以将大型流体模拟集合与 PyTorch 等流行的机器学习库无缝集成,从而支持包括在线训练和强化学习在内的复杂应用。

马萨诸塞大学波士顿分校的一个研究团队正在加速线性代数计算,以分析显微镜视频并确定活性材料耗散的能量。该团队使用 cuPyNumeric 来分解一个包含 1600 万行和 4000 列的矩阵。

印度国家支付公司提供的实时数字支付系统每天大约被 2.5 亿印度人所用,并在走向全球。印度国家支付公司使用复杂的矩阵计算来跟踪付款人和收款人之间的交易路径。使用当前的方法,在 CPU 系统上处理一周的交易数据大约需要 5 个小时。一项试验表明,通过在多节点 NVIDIA DGX 系统上应用 cuPyNumeric 来加速计算,可以将矩阵乘法的速度提高 50 倍,从而使印度国家支付公司能够在不到一个小时的时间内处理更长时间内的交易,并近乎实时地检测到可疑的洗钱行为。

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分