NVIDIA携手Google DeepMind与EMBL发布全球最大蛋白质复合物数据集

描述

NVIDIA、Google DeepMind、欧洲分子生物学实验室下属欧洲生物信息学研究所(EMBL-EBI)以及首尔大学 Steinegger 实验室,对 AlphaFold 蛋白质结构数据库进行了大规模扩展,为可搜索数据库新增了 170 万个高置信度预测的蛋白质复合物,并提供约 3000 万个额外预测结构供批量下载。

这一新增数据集是同类中规模最大的,使该数据库成为一个能够在前所未有规模下开展蛋白质相互作用建模的综合资源平台。

Google DeepMind 的 AlphaFold-Multimer 模型为数据库提供了 AI 预测生成的蛋白质结构。同时,通过在 OpenFold 推理流程中集成了包括 NVIDIA TensorRT 和 cuEquivariance 在内的 NVIDIA 计算库,推理速度相较传统方法提升超过 100 倍。

该数据库提供这些预先计算的蛋白质结构形式作为研究假设,从而加速新药靶点发现和疾病机制研究中的实验验证过程。这大幅降低了科研门槛,尤其有助于那些缺乏先进超级计算资源的低资源环境研究人员开展相关研究。

该项目优先聚焦参考蛋白质组,即代表物种分类多样性的蛋白集合,以及世界卫生组织重点关注的病原体名单,以推动传染病研究。

对于制药行业而言,这些预测结构可作为强有力的初始假设,大幅加速后续湿实验进程,节省宝贵的时间与资源。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分