机器学习+表面增强拉曼光谱技术,用于早期肺癌筛查

描述

近期,黄祖芳研究员和王静研究员研究团队通过将机器学习和直接表面增强拉曼光谱(SERS)检测技术相结合,开发了一种可检测早期肺癌与良性肺部疾病患者的全局DNA甲基化信息的方法。相比于常规的DNA甲基化表征方法,如高效液相色谱法和发光甲基化测定法,这种方法具有快速、灵敏和简单的优点,并且无需亚硫酸盐处理和扩增。这一技术有望应用于早期肺癌的准确检测和诊断,为肺癌的早期治疗提供帮助。目前,低剂量计算机断层扫描(LDCT)仍存在区分早期肺癌与良性肺部疾病的挑战,而这项研究提供了一种潜在的解决方案。

该工作以“Machine learning-assisted global DNA methylationfingerprint analysis for differentiating early-stage lung cancer from benignlung diseases”为题发表于国际权威期刊Biosensors and Bioelectronics上,福建师范大学博士研究生陆德婵和福建省肿瘤医院陈燕坪主任医师为共同第一作者,福建师范大学黄祖芳研究员、卢玉栋教授和王静研究员为共同通讯作者。

该研究开发了一种新的基于直接SERS纳米技术的DNA甲基化模式检测技术,如图1所示。首先从福尔马林固定石蜡包埋(FFPE)的组织样本中提取gDNA,然后将其与金纳米粒子(AuNPs)混合进行SERS检测。由于甲基对AuNPs的亲和力高于银和铜纳米粒子,因此选用AuNPs作为gDNA信号放大的SERS基底。该研究发现,5-甲基胞嘧啶的分布(即DNA甲基化模式)在早期肺癌和肺部良性疾病患者之间存在差异性,这些差异可以通过gDNA的SERS光谱反映出来。因此,该研究团队利用直接SERS技术检测了106例(包括65例早期肺癌和41例良性肺部疾病患者)FFPE的gDNA的SERS特征。通过偏最小二乘法判别分析(PLS-DA)模型结合gDNA的SERS光谱特征,成功区分早期肺癌和肺部良性疾病患者。这种技术的发展有望成为一种新型的肺癌筛查方法,并为其他癌症的早期诊断提供新思路。

拉曼光谱

图1 基于非标记SERS结合机器学习区分早期肺癌和肺部良性疾病患者的示意图

如图2所示,研究团队通过检测5-甲基胞嘧啶和胞嘧啶,以及包含5-甲基胞嘧啶的合成DNA序列(mCGATAmCGmCAT,ss mC)和其未甲基化的对应序列(CGATACGCGCAT,ss)的SERS光谱,探讨了甲基化相关的特征峰。随后,研究人员分析了这些甲基化相关特征峰(如1006/cm)与甲基化水平的关系,以此确定了与甲基化相关的光谱标记。

拉曼光谱

图2 (A)5-甲基胞嘧啶(5mC)和胞嘧啶(C)的SERS光谱以及5mC-C的差谱;(B)ss mC(mCGATAmCGmCGCAT,20 ng/μL)和ss(CGATACGCAT,20 ng/μL)的SERS光谱,以及ss mC-ss的差谱;(C)PLS-DA模型区分ss mC和ss的VIP分数;(D)不同胞嘧啶碱基比例的ss mC+ss的SERS光谱,RmC=[mC]/([C]+[mC]);(E)摩尔比RmC与1001/cm处的峰强度(I1001)之间的线性关系。

如图3所示,研究团队利用直接SERS技术分别检测了来源于肺癌细胞系和肺上皮细胞系的DNA的SERS光谱,并比较了对应的5-甲基胞嘧啶特征峰1006/cm的拉曼强度差异。通过与商业化试剂盒(LINE-1)的交叉验证,进一步证明直接SERS技术可以对从细胞系中提取的gDNA的全局甲基化水平提供准确可靠的测量结果。

拉曼光谱

图3(A)不同细胞系提取的gDNA的平均SERS光谱以及(B)差谱;(C)特征峰1006/cm对应的拉曼强度;(D)LINE-1试剂盒检测细胞系的全局甲基化水平

如图4所示,研究团队利用直接SERS技术检测了早期肺癌(n = 65)和肺部良性疾病(n = 41)患者的FFPE组织标本中提取的gDNA的SERS光谱。基于单个谱峰(I1006)强度计算ROC曲线下的面积(AUC)值为0.7,表明DNA甲基化可作为潜在的区分早期肺癌和肺部良性疾病患者的生物标志物。研究团队还利用PLS-DA模型对全谱光谱进行分析,发现直接SERS检测与机器学习相结合,可以识别DNA甲基化模式的分子特征,从而提高早期肺癌和肺部良性疾病患者的诊断性能,表明这种方法具有广阔的应用前景。

拉曼光谱

图4 (A)每个样本的gDNA光谱强度映射图;(B)早期肺癌和肺部良性疾病患者的gDNA的平均SERS光谱以及差谱;(C)基于1006/cm的峰值强度的全局甲基化水平的比较;(D)基于1006/cm处的SERS信号强度的ROC曲线用于区分早期肺癌和肺部良性疾病患者;(E)根据PLS-DA模型计算的每个样本的预测分数;(F)基于预测分数的ROC曲线,用于鉴别早期肺癌和肺部良性疾病患者;(G)PLS-DA模型中得到的用于鉴别早期肺癌和肺部良性疾病的VIP分数。  

综上所述,在这项工作中,研究团队提出了一种结合机器学习的直接SERS方法,用于分析DNA甲基化模式,探究早期肺癌和肺部良性疾病患者在分子水平上的差异。未来,便携式光学仪器的发展将进一步促进床旁的DNA分析,用于早期疾病的检测。

论文链接: https://doi.org/10.1016/j.bios.2023.115235  

       审核编辑 :李倩

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分