使用 AI 加速发现的过程

电子说

1.3w人已加入

描述

IBM 研究部主任达里奥吉尔表示,科学的紧迫性从未如此强烈。Gil 指的是为 Covid-19 开发疫苗的竞赛,但他说,这种紧迫性并没有消失,他引用了气候变化、未来流行病、粮食短缺和能源安全等规模问题。解决这些问题所需要的是加快发现速度。

该解决方案将结合人工智能 (AI)、量子计算、高性能计算 (HPC) 和混合云技术。

 

AI


达里奥吉尔(图片:IBM)

“使用[这些技术],我们可以从根本上改变我们进行发现的过程,”吉尔说。“我们可以加速和增强传统的科学方法。”

Gil 的例子是材料科学,它在历史上一直依赖于偶然发现(想想铁氟龙,它是在寻找新制冷剂时发现的。凡士林和石墨烯是类似的惊喜)。如果不是偶然发现的,有用的新材料通常是通过反复试验发现的,即使使用最新的基于 HPC 的复杂分子建模和模拟,这也非常昂贵并且可能需要数年时间。

这就是人工智能的用武之地。

“[AI] 真正实现了前所未有的大规模速度和自动化水平,帮助我们解决越来越复杂的问题,”Gil 说。“正是人工智能可以帮助我们迎来这个加速发现的新时代。它可以帮助我们增强科学方法,将其从线性过程转变为闭环。”

闭环 Gil 设想使用 AI 筛选现有知识库,然后使用 HPC(或未来的量子计算)通过模拟增强数据并寻找该知识库中的空白。这些信息被输入到生成 AI 模型中,该模型可以建议候选新分子来填补空白。然后,人工智能驱动的机器人可以根据数据和过去化学反应的例子生成候选分子。

Gil 说:“这个过程将随着新知识引发新问题而达到高潮,循环再次开始。” “所以这将是一个持续的发现循环,越来越自动化和越来越自主。”

Gil 将这个循环称为“加速发现”,并强调这不是在遥远的未来,而是现在肯定会发生的事情。

PAG 发现

Gil 演讲中的另一个例子是基于加速发现更可持续的光刻胶材料。光刻胶对半导体制造过程至关重要;化学放大光刻胶使用称为光酸产生剂 (PAG) 的化学物质。

使用传统工艺,发现一个新的 PAG 可能需要 10 年时间,并且至少要花费 1000 万美元。科学家们将搜索已发表的文献,并利用他们能找到的东西以及他们自己的知识来设计一种分子并针对所需的特性。然后,他们将经历合成、表征和测试的迭代循环,直到获得令人满意的化合物。即使有超级计算机可供使用,这个过程也是漫长而艰难的,尤其是因为要考虑大量的化合物。

加速发现已将该过程缩短到一年多 100 万美元。

加速发现工作流程有四个阶段。首先,一个名为 Deep Search 的人工智能会“读取”所有现有的关于 PAG 的科学文献。

“使用深度搜索通常会将该过程加快一千倍,因为 AI 可以在每个处理核心每秒摄取和处理大约 20 页,”Gil 说。“另一方面,技术文献的人类读者通常每页需要一到两分钟。”

该知识库由已知 PAG 系列的树状图表示(下图的内部灰色部分)。树状图中的空白区域代表数据丢失的地方。

 

第二步是通过 AI 驱动的模拟来丰富数据。另一个 AI 模拟已知 PAG 的实验参数,比常规模拟快 2-40 倍。

“对于某些房产,可用数据非常稀疏或嘈杂且不可靠,几乎没有用,”吉尔说。“我们必须用足够的预测属性数据来扩充这个数据集,以训练人工智能模型。在这里,我们使用 AI 丰富的模拟来为数据集中 PAG 的重要属性提供定量值。”

这些特性包括毒性(上表中的紫色数据)、生物降解性(蓝色)和 λ max,即材料吸收最强的光波长(绿色)。

这些信息被输入第三种类型的人工智能,称为生成模型。如今,生成式 AI 被用于为社交媒体档案、与人类书写的散文、计算机代码和现在的分子无法区分的长论文文本生成虚假的档案图像。这个想法是有效地填补(灰色)树状图中的空白。在 IBM 的案例中,他们希望寻找一种具有更好可持续性特性(尤其是生物降解性)的 PAG 材料。

“我们已经看到使用生成模型来识别差距并为测试创建材料概念的 10 倍加速,”Gil 说。

该过程的最后一步是在 AI 驱动的实验室中测试结果,根据 Gil 的说法,该实验室的合成速度比传统方法快一百倍。

在这个阶段有一些人为的参与;专家选择最佳候选者进行实验验证,尽管产生现实生活中化学物质的化学合成是由机器完成的。在位于苏黎世的 IBM RoboRXN 实验室,人工智能、自动化和云技术的惊人组合已经学习了合成有机化学,并且可以通过机器人远程应用它。

IBM 在 11 月使用这种加速发现过程发现了其第一个新的 PAG 材料。

“[新材料] 带来了一个未来会有更多、更多加速发现的世界的希望,”吉尔说。

未来愿景

除了解决流行病和气候变化等人类问题外,IBM 的愿景是加速发现将定义未来最具创新性的业务。以科学发现为核心业务的公司显然会受益,包括生命科学、化学品和材料公司。当今大企业的另一大部分依赖于科学发现,包括汽车制造商、科技公司、医疗保健和公用事业。还有更多是由信息和发现驱动的,也就是说,他们通过数据实验和学习获得了竞争优势。第三类是软件、金融市场、媒体和娱乐、电信公司、银行和零售)。加速科学和发现将影响所有这些业务。

 

AI


三种类型的科学驱动型企业(图片:IBM)

“我确信明天最具创新性的企业将是发现驱动型企业,”吉尔说。“他们将寻求平台、工具和技术,使他们能够加速发现过程,从而赋予他们竞争优势。但这需要对科学和研发进行大量投资。”

吉尔再次提到了在 14 个月内开发的 Covid-19 疫苗。如果发现按照传统方式进行,疫苗要到 2033 年才能上市。

“为了应对我们最大的挑战,我们需要更快地发现,”他说。“我们需要释放加速发现的力量,我们需要有目的地去做,不仅仅是数字产品和服务的数字创新,还要引导我们的数字能力来改善我们的物理世界。”


审核编辑 黄昊宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分