谷歌与耶鲁大学合作发布最新C2S-Scale 27B模型

描述

作者 / Shekoofeh Azizi,Google DeepMind 研究科学家、研究主管;Bryan Perozzi,Google Research 图挖掘资深研究科学家

我们很荣幸发布与耶鲁大学合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),这是一个新的 270 亿参数基础模型,旨在理解单个细胞的 "语言"。C2S-Scale 建立在 Gemma 开放模型系列的基础上,代表着单细胞分析领域的新前沿。

此项成果的发布标志着 AI 在科学领域取得了新的里程碑。C2S-Scale 针对癌细胞行为提出了一个新颖的假说,并且后续已经在活体细胞中的实验证实了这一预测。这一发现为开发抗癌疗法开辟了一条具有前景的新途径。

此次发布的模型建立在我们今年早些时候的研究成果上,我们当时证明了生物模型遵循明确的规模定律 (Scaling Law)。就像在自然语言领域一样,越大规模的模型在生物学任务中表现越出色。这项研究提出了一个关键问题: 更大规模的模型只是在现有任务中表现更好,还是可以使其具备全新的能力?规模化的真正意义,在于创造新想法,以及探索未知。

C2S-Scale 27B 的工作原理

癌症免疫疗法的一个主要难题在于许多肿瘤属于 "冷肿瘤",难以被人体的免疫系统识别。使这些肿瘤细胞变 "热" 的关键策略是通过被称为抗原呈递的过程,迫使肿瘤细胞发出能够激活免疫反应的信号。

我们给新的 C2S-Scale 27B 模型布置了一个任务: 找到一种充当 "条件放大器" 的药物,这种药物只在特定的 "免疫激活环境" 中增强免疫信号,在这种环境中本身已经存在低水平但不足以自行诱导抗原呈递的干扰素 (一种关键免疫信号蛋白)。要完成此任务,需要一定程度的条件推理能力,而这种推理能力似乎是模型规模扩大后呈现出的新能力;我们通过较小规模的模型无法解析出这种依赖特定环境的效应。

为了实现此目标,我们设计了一个双重情境虚拟筛选来寻找这种特定的协同效应。虚拟筛选包括两个阶段:

免疫激活环境: 我们为模型提供了具有完整肿瘤-免疫相互作用和低水平干扰素信号传导的真实患者样本。

免疫惰性环境: 我们为模型提供了缺乏免疫环境的分离细胞系数据。

随后,我们模拟了超过 4,000 种药物在这两种情境下的效果,并要求模型预测哪些药物只会在免疫激活环境中促进抗原呈递,从而使筛选结果与患者相关的环境更接近。在模型筛选出的众多候选药物中,一小部分 (10-30%) 符合条件的药物已出现在先前的文献中,而其余的候选药物则在意料之外,此前并未发现它们与本次筛选目标有任何关联。

从预测到实验验证

该模型的预测结果清晰明了。它识别出名为 silmitasertib (CX-4945) 的激酶 CK2 抑制剂拥有显著的 "环境分离" 能力。该模型预测,在免疫激活环境中应用 silmitasertib 时,抗原呈递急剧增加,但在免疫惰性环境中收效甚微。这个预测之所以如此振奋人心,是因为这是个十分新颖的观点。虽然 CK2 与许多细胞功能有关,包括作为免疫系统的调节剂,但文献中尚未提到过通过 silmitasertib 抑制 CK2 来显著增强 MHC-I 表达或促进抗原呈递。这表明,该模型产生了一个可检验的全新假说,而不仅仅是重复已知的事实。

然而,预测只有在临床应用中得到验证时才有价值。真正的检验首先需要在实验室进行,最终才能走向临床实践。

在该项目的下一阶段,我们将这一假说带到实验室,并在人类神经内分泌细胞模型中进行了测试。这种细胞类型从未出现在模型训练过程中。实验证明:

单独使用 silmitasertib 处理细胞对抗原呈递 (MHC-I) 没有影响。

单独使用低剂量干扰素处理细胞的效果有限。

而使用 silmitasertib 配合低剂量干扰素处理细胞使抗原呈递产生了显著的协同扩增。

值得注意的是,在我们的实验室测试中,silmitasertib 和低剂量干扰素的组合让抗原呈递显著增加了约 50%,这使免疫系统更容易识别肿瘤。

该模型的计算机模拟预测结果在体外实验中多次得到证实。C2S-Scale 已成功识别出一种全新干扰素条件放大器,揭示了一个使 "冷" 肿瘤变 "热" 的潜在新途径,并可能使免疫治疗产生更佳的反应。虽然这只是初步的尝试,但它为开发新的联合疗法 (即多种药物协同使用,以实现更强效果) 提供了经实验验证的强有力方向。

这一结果也为新的生物学发现方法提供了可参考的蓝图。它表明,通过遵循规模定律并构建像 C2S-Scale 27B 这样更大的模型,我们可以创建出足够强大的细胞行为预测模型,使其运行高通量虚拟筛选,发现基于特定情境下的生物学现象,并生成具备生物学基础的假说。

目前,耶鲁大学的团队正在探索本文中发现的机制,并在其他免疫环境中验证 AI 生成的其他预测。通过进一步的临床前和临床验证,这些假说有望加速新疗法的研发。

开始使用 C2S-Scale 27B

新的 C2S-Scale 27B 模型及相关资源现已可供研究人员使用。诚邀您探索这些工具,在我们研究的基础上持续创新,共同探索生命的语言。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分