一种基于基因表达谱变化直接预测药效的计算模型

电子说

1.3w人已加入

描述

鉴于许多疾病机理不明确或者发病机制涉及多条信号通路,基于靶点的药物开发策略存在一定的局限性。因此,开发一种不依赖于靶点,可以直接预测药效的计算模型似乎是一种解决方案,以往的研究人员已经进行了尝试,但是建立的模型往往针对一种疾病有效,缺乏普适性。

由于大部分疾病都会表现出基因表达谱的变化,研究人员利用化合物诱导的基因表达谱变化作为中间指标进行药效预测,开发出了一种基于基因表达谱变化直接预测药效的计算模型,这种模型适用于多种疾病研究和相关药物研发。

6 月 17 日,北京大学谢正伟团队在 Nature Biotechnology 在线发表了这项研究。在这项研究中,他们详细介绍了这种基于基因指纹和深度学习的药效预测系统(DLEPS,中文名灵素系统),并证明了 DLEPS 是一种药物发现和重定位的有效工具。在论文中,他们针对 3 种代谢性疾病开发了重定位和全新化合物分子。

有审稿人称,灵素系统是一个高度原创的解决方案,也是第一个被报道用神经网络连接化合物结构和基因表达谱的研究。

“这项工作初步完成了我的期望和设想”,谢正伟告诉生辉。

借此,生辉独家专访了该研究的共同通讯作者谢正伟博士。

今年是谢正伟独立开展科研活动的第五个年头。他现在是北京大学医学部的副研究员以及独立实验室负责人,长期从事基于多学科交叉和人工智能的创新药物算法开发,以及细胞衰老机制的研究。此前,他从事纯计算的研究工作,开发过微流芯片,并与诺奖得主 Elizabeth H.Blackburn 共同合作在 Cell 发表过论文。

2018 年,他创立了亿药科技,利用 AI 和深度学习加速药物研发。据谢正伟透露,亿药科技拥有一支多学科交叉创始团队,具有从头开发算法的能力,同时也有分子细胞生物学、结构生物学研究能力。目前团队规模 20 人左右,专业涵盖药理学、人工智能、药物化学、药理验证等。

利用 “基因指纹” 预测分子性能

多种疾病特别是年龄、代谢相关疾病的发生和发展都是由于系统失衡造成的基因表达紊乱,通过检测 “基因指纹” 即基因表达谱可以观察和研究疾病变化。

一方面,基因表达谱的检测可以应用于疾病生物标记物的筛选;另一方面,基因表达谱的检测也可以为基因功能研究提供线索,揭示疾病发生发展的分子机制。

在论文中,科研人员开发的灵素系统正是利用基因表达变化谱为中间指标建立了预测药效的计算模型,与传统连接图方法相比,这种模型适用于没有实验数据或者未发现的药物分子。而连接图方法虽然采用基因表达谱变化为指标,但是这种方法往往只适用于已有实验数据的分子,对于新分子束手无策。

在该研究中,他们首先构建了神经网络,使用 SMILES 化学编码输入,将小分子在高维空间进行编码,高维空间的坐标向量进一步预测 1000 个标记基因,然后对超过 1 万个基因进行预测;紧接着,他们用疾病相关基因指纹来反映特定疾病的 “内在痕迹”,并且使用基因集合富集分析 (GSEA) 来评估化合物对疾病的潜在疗效。

SMILES 即简化分子线性输入规范,这是一种用 ASCII 字符串明确描述分子结构的规范。GSEA:是一种分析基因表达信息的方法。

谢正伟团队将这种方法和模型称为基于深度学习的药效预测系统 —— 灵素系统。在预测基因表达变化部分,系统可以准确预测新分子对转录组造成的影响,训练集和测试集中预测的和真实的基因表达谱变化的平均相关性为 0.90 和 0.74,分布峰值分别在为 0.93 和 0.90。

这些指标说明系统成功地从已有数据中学习到深层次的分子结构 - 基因表达谱变化之间的关联,达到了外推到虚拟分子的效果。

“灵素系统在测试集上的优异表现,使我们相信灵素系统对于新结构分子,也可以取得准确的预测结果”,谢正伟说。

接下来,研究人员深入探索了测试集的一部分分子,这些分子在训练集中没有非常相似的分子。

“我们发现,灵素系统可以精确预测新结构小分子诱导的基因表达谱变化(平均相关性 0.6)。同时,系统还可以准确区分结构非常相似的小分子(只差一个基团)诱导的基因表达谱差异”,谢正伟补充道。

研究人员还分析出了哪些基团倾向于保持表达谱不变或者更倾向于改变,这些分析对于后续的药物设计至关重要。

谢正伟告诉生辉,与传统基于靶点的方法或者单基因标记筛选方法相比,灵素系统具有三大优势:

一是,灵素系统同时考虑多个基因指标,精度更高。灵素系统更加灵活,仅基于基因指纹就可预测候选分子,可以在复杂疾病上得到更好药效的化合物,更快的找到工具分子。

二是,灵素系统不需要预先合成实体分子库,大大的降低了成本和工作量,效率更高。

三是,找到小分子以后可以进一步发现疾病的新靶点,从而实现在药效预测和靶点上开发双管齐下、同步进行。

具有通用性,可预测多种疾病药物分子

“第一次看到这么好的拟合效果,我惊讶得半天说不出话来。不过,系统是否真正有用还得在实践中验证。由于动物实验周期长,验证的病种多,我们光验证就花了两年的时间”,谢正伟说。

在实验验证方面,谢正伟遇到了北京大学基础医学部郑瑞茂研究员,郑瑞茂当时正在测试雷公藤素,这是一个和连接图方法有渊源的分子。

两人一拍即合, 一番交流之后,郑瑞茂很快理解了灵素系统的潜在价值,并在促进脂肪褐变和减肥领域进行了尝试。

他们利用灵素系统预测了四个化合物,其中三个化合物可降低小鼠的脂肪含量,并且诱导数十个褐变基因表达上调,使白色脂肪组织变成棕色脂肪组织,减轻了小鼠的体重,达到了减肥目的。

“这大大增强了我们的信心,然后我们继续尝试扩展到其他的领域”,谢正伟说。

据谢正伟透露,针对高尿酸血症,灵素系统成功预测了天然产物紫苏烯,其可降低血清尿酸,效果上优于四种阳性药物,还具有抗炎和抗纤维化的优势。

针对非酒精性脂肪性肝炎(NASH),他们发现三种可缓解 NASH 进展的 MEK-ERK 信号通路抑制剂,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一种在全球范围内十分普遍的慢性肝病,NASH 患者 10 年内肝硬化发生率高达 25%,市场需求巨大。吉利德、武田等制药大厂纷纷重金布局该领域,然而目前全球尚无一款药物获批上市。

“针对 NASH 适应症,我们发现至少需要调节七个通路才能取得良好的治疗效果,而这正是灵素系统所擅长的”,谢正伟说。

SaaS 服务基础上做自研

2016 年,谢正伟在北京大学医学院建立独立实验室,立志研发抗衰老药物。

“当时我们已经建立了一套高通量筛选系统,但是筛选效率低,无法满足针对多种疾病筛选药物分子的需求。我希望通过 AI 和深度学习预测化合物性能,寻找一些可以抗衰老的化合物,于是开发了这套灵素系统”,谢正伟说。

2018 年,谢正伟正式落地亿药科技,将自己的科研成果转化为 “药”。同年,亿药科技完成了种子轮融资。

据谢正伟介绍,论文中只提到了 3 种代谢性疾病,实际上,他们还在探索肌腱愈合、骨质疏松、长寿等领域的潜力,现在已经找到了长寿的化合物。借助于研发优势,亿药科技还开发了一条替代 GLP-1 的 “爆款” 管线。GLP-1 是 2 型糖尿病药物的主要作用靶点,GLP-1 类药物是糖尿病和减肥领域最闪耀的药物之一。

基于一系列的研究成果,亿药科技已经搭建了多条创新管线和 “老药新用” 管线,并且申请了十几个相关的专利。

药物发现处于整个生物医药产业链最前端,也是产生核心专利阶段。据了解,论文中涉及的小分子 - 神经网络 - 基因表达变化 - 药效的算法框架已经申请国内外专利。

“对我们来说,这个专利的优先权具有非常重大的意义和保护作用。因为它的出发点是一个原始创新的框架,所以保护范围非常大,能够帮助亿药科技建立专利壁垒和保持竞争优势”,谢正伟说。

谢正伟告诉生辉,一家 AI 制药公司的核心竞争力,主要体现在商业发展上,可以简单归结为两个指标。第一个指标是做技术服务的能力,是否能拿到大公司的订单;另一个指标是自研管线,是否有成为创新型研发中心以及未来成为药企的潜力。

基于灵素系统以及搭建的人工智能平台、药物化学平台、药理验证平台,亿药科技最近拿到中国科学院以及一家头部药企的订单合同。

“我们的商业模式可以简单归结为 3 种,一是提供 SaaS 平台付费计算服务,二是提供化合物筛选等技术服务,三是自有管线的研发”,谢正伟说。

目前,亿药科技正在进行 Pre-A 轮融资,本轮融资将会用于自有管线研发、平台建设、队伍扩充和管线的 IND 推进。

“做药一直是我们的初衷,我希望亿药科技成为一家 AI + 大数据驱动的科研型制药公司。未来,我们会在提供 SaaS 服务和技术服务的基础上,注重推动自研管线,并将这些管线推向临床、推向市场,最终使患者受益”,谢正伟这样描述亿药科技未来的发展规划。

编辑:jq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分