电子说
细胞生物学家和细胞学研究者现在有了新的细胞模型工具可以用了。
在微软联合创始人保罗·艾伦的资助下创立的艾伦细胞科学研究所(Allen Institute for Cell Science)最近公布了一项研究成果,利用卷积神经网络(CNN)等 AI 算法学习现有的 2D 及 3D 细胞影像资料,训练出了两套能够精准展示和预测细胞各部分形状、位置及工作状态的算法模型,一个叫确定性模型(deterministic model),一个叫概率模型(probabilistic model)。
前者主要用来研究人体诱导多能干细胞(hiPSC)各部分的形状和组织机理;后者则可以用来分析那些尚未深入研究过的人体细胞。
由于训练方式基本相同,这两个模型工具被合称为 Allen Integrated Cell,并用同一套工具来渲染和展示 3D 细胞模型。
从训练过程来说,艾伦细胞科学研究所的研究人员在输入数据之前,将 hiPSC 的细胞集样本增加到了 24 个,目标定为 21 个关键结构和子结构。这其中包括 Paxillin、Sec61 beta、TOM20 等蛋白质。
细胞中的 14 种可染色蛋白质,会通过荧光标记法逐一染上不同颜色,然后放在显微镜下观察细胞各个组成部分的形状、分布和工作模式,并形成数据库。
接下来,研究人员将这些 3D 图像数据输入到两个不同的深度学习模型中进行训练和推理。
其中,确定性模型在学习了荧光标记法中的颜色信息和活动规律数据后,不需要进行标记也能精准输出 3D 的细胞活动模式,并根据类型为细胞各部分区分频道。
负责细胞活动建模工作的医学博士 Molly Maleckar 表示,荧光标记法对细胞来说是有毒性的,而且大规模采用成本很高。
这意味着,研究者可以利用 AI 来模拟细胞的真实结构和工作模式,从而降低实验成本。
而概率模型在完成训练和推理过程后,能够输出一个 3D 的细胞工作模型,动态显示不同条件下细胞各组成部分的分布和动态。理论上,这个模型可以用于研究那些组织机理尚不清晰的细胞,也有助于拓展人体细胞的形态学边界。
Allen Integrated Cell 输出的 3D 细胞模型
针对这两个模型的实用价值,艾伦细胞科学研究所也公布了不同蛋白质的模型预测置信度。
Allen Integrated Cell 置信度
从图上看,细胞核、核被膜等蛋白质的可信度比较高。换句话说,AI 模拟出的细胞活动与观测数据误差很小。
这不仅有助于科学家研究正常的人体细胞,还能在观察和分析衰老或病变细胞(比如癌细胞)时提供数据参考。Greg Johnson 表示:如果能更好地理解健康细胞的内部工作原理,就可以知晓它在出现哪些问题的时候,才会变成癌细胞。我们可以追溯癌细胞的过往,观察它所发生的变化,然后尽早地发现它们。
另外,经济发展水平不高的国家和地区,只要具备相关人才也能通过这套 AI 模型系统缩小与发达地区的医学水平差距。
目前,Allen Integrated Cell 作为在线工具,其核心代码文件已经发布在 Github 上。
不过,这需要一个同时精通细胞生物学、神经与脑科学、计算机科学的团队合作挖掘 AI 的潜在价值。
--
关于艾伦细胞科学研究所
艾伦细胞科学研究所是 2014 年在微软联合创始人及慈善家保罗·艾伦(Paul G. Allen)的帮助下启动,隶属于艾伦研究所(Allen Institute)旗下一个独立的非营利医学研究机构。它致力于理解并给细胞这一基本生命单位构建模型。通过将技术,方法,模型和数据整合到一个共同的标准化框架中,艾伦细胞科学研究所正在创建动态的视觉模型,来说明遗传信息如何转化为细胞行为,以及每个细胞内的分子和细胞器如何相互作用系统。这些预测模型将使细胞科学界更好地了解细胞在健康和疾病中的作用。艾伦细胞科学研究所的数据,工具和模型可在线公开获取。
全部0条评论
快来发表一下你的评论吧 !