NVIDIA为Terra云平台提供快速分析海量医疗数据所需的AI和加速工具

NVIDIA英伟达 2022-09-22 3608

描述

合作将加速基因组分析工作流；将共同开发用于发现和开发靶向治疗的大型语言模型

NVIDIA 于今日宣布与麻省理工学院和哈佛大学旗下的博德研究所（The Broad Institute）合作，为 Terra 云平台提供快速分析海量医疗数据所需的 AI 和加速工具。这将惠及该平台的 25000 多名用户，这些用户包括来自学术界、初创企业和大型制药公司的生物医学研究人员。

此次合作旨在将 NVIDIA 在 AI 领域的专长和医疗计算平台与博德研究所的全球知名研究人员、科学家和开放平台建立连接，重点关注三大关键领域：

在 Terra 平台上提供 NVIDIA Clara Parabricks：Parabricks 是一款用于测序数据二级分析的 GPU 加速软件套件，现可用于六个新的 Terra 工作流。用户现在可以使用 Clara Parabricks，在一个多小时内完成全基因组的分析，而在基于 CPU 的环境中这项工作需要 24 个小时才能完成，并且，使用 Parabricks 计算成本降低一半以上。

构建大型语言模型（LLM）：为深入探究人类生物学，研究人员将使用今日发布的用于生物学 LLM 模型的 AI 应用框架——NVIDIA BioNeMo，来开发 DNA 和 RNA （生命的“基础构件”）的基础模型。

为基因组分析工具包（GATK）带来更加强大的深度学习：NVIDIA 正致力于为 10 多万名研究人员所使用的行业标准工具——博德研究所的 GATK 工具包打造新的深度学习模型，帮助研究人员识别与疾病相关的基因变异。这将助力新药研发人员研究新的疗法。

NVIDIA 医疗业务副总裁 Kimberly Powell 表示：“整个医疗生态系统都需要更先进的计算工具，以便我们在理解疾病、发展诊断学和提供治疗方案的方面取得突破。通过扩大与博德研究所的合作，我们可以发挥大型语言模型的力量，最终提供联合解决方案，让研究人员的深入洞察能够真正地造福患者。”

博德研究所希望通过提供一个开放的云平台，将研究人员相互联系起来，并将研究人员与其实现科学突破所需的数据集和工具连接起来，从而实现新一代生物医学合作研究。

博德研究所首席数据官 Anthony Philippakis 表示：“生命科学领域正处于一场数据革命之中，研究人员迫切需要一种将机器学习引入生物医学的新方法。我们希望通过此次合作，进一步践行‘数据共享与合作流程’的使命，进而扩展基因组学研究。”

用于疾病研究的大型语言模型

NVIDIA 的 BioNeMo 框架包含蛋白质和化学领域的预训练 LLM 模型，可简化训练、推理和扩展。BioNeMo 是 NVIDIA NeMo Megatron 框架针对化学、蛋白质和 DNA/RNA 序列领域的扩展。

通过 BioNeMo，开发者能够有效地训练和部署具有数十亿参数的生物学 LLM 模型。

双方团队将基于此次合作，共同创建新的模型，将其添加至 BioNeMo 集合中，并在 Terra 平台上提供。

用于特定领域 AI 的 NVIDIA 软件

NVIDIA Parabricks GPU 加速的工作流为研究人员提供更快的周转时间和更低的成本，以进行广泛的基因组数据分析。在博德研究所的 GATK 最佳实践——生殖细胞突变检测分析流中，Parabricks 在 GPU 上进行分析的速度提高了 24 倍，而成本减半。

博德研究所的研究人员还能够访问用于医学影像 AI 的开源深度学习框架——MONAI 以及用于加快数据准备工作的 GPU 加速数据科学工具包——NVIDIA RAPIDS。后者可用于基因组单细胞分析。　　

审核编辑：彭静

打开APP阅读更多精彩内容