MIT研究员最新AI模型可提前5年预测乳腺癌风险!

电子说

1.3w人已加入

描述

乳腺癌是美国第二大、中国第一大女性恶性肿瘤相关的致死因素。2019年的最新数据显示,美国有近27万名女性被诊断为乳腺癌,4万多人因此死亡。在中国,仅2015年就有约28万乳腺癌新发病例,位居女性恶性肿瘤发病的首位。在现代医学的众多研究领域中,如何尽早发现和治疗乳腺癌,早已成为一个十分重要的核心课题。

近日,来自麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和马萨诸塞州综合医院的研究人员合作,共同打造出了一种深度学习模型。通过分析约9万张乳腺X光照片与6万多名患者的真实数据,该模型可以找出人眼不易察觉的精细信息和规律,作为预测女性是否可能在未来五年内罹患乳腺癌的依据。相比于传统检测模型,该模型将预测准确率从18%提高到31%,在不同族裔女性罹患乳腺癌风险的预测普适性上取得突破。

新的深度学习模型可以在癌症发病(右图)前4年,识别出乳腺癌风险(左图)

个性化检查方案,抓住最佳治疗时机

乳腺X光检查技术是目前临床医学广泛使用的检测乳腺癌风险的手段,但业界对检查频次和合适的检查年龄一直存在争议。美国癌症协会认为女性应从45岁开始进行年度检查,有些机构则建议50岁以上的女性每两年接受一次检查。不过由于个人体质各异,其罹患乳腺癌的风险也不同,以年龄作为标准划分筛查频率过于泛化,很容易无法及时发现早期乳腺癌而错失最佳治疗时机。另外,由于X光的辐射性和乳腺的敏感性,很多人甚至认为乳腺癌X光筛查对女性有一定危害。

针对这一情况,MIT的研究人员认为如果能够提前预测出女性罹患乳腺癌的风险系数,可以帮助个体制定更完善的个性化筛查方案,如建议高危人群在 30 多岁时进行年度检查,低危人群则每三年检查一次。该论文的作者之一Regina Barzilay博士是乳腺癌幸存者,她希望通过该模型帮助更多女性将乳腺癌风险扼杀在摇篮中,抑制其发病率增长趋势。

Regina Barzilay博士

设计检测模型,获取精准信息

自1989年第一个乳腺癌风险预测模型诞生以来,很多风险因素被囊括在内:年龄、家族遗传、荷尔蒙和生殖激素、乳腺密度等。但是由于大多数因素与乳腺癌的关联度较低,导致这些传统模型对个体的预测并不准确。

与传统的检测模型不同,MIT的研究团队开发出了一种全新的深度学习模型——基于逻辑回归模型+图片识别深度学习模型的混合模型,使用乳腺X光照片与真实已知结果对模型进行训练、验证和测试。

“1960年以来,放射科医生已经注意到女性乳腺X光片上可以看到各具特性且不断变化的乳房组织,代表着遗传、激素、怀孕、哺乳、饮食、体重变化对乳腺产生的影响。现在我们可以利用深度学习在风险评估中更准确地利用这些详细信息,从而提出个性化的预测结果和预防方案。”Regina Barzilay表示。

首先,每一个风险因素都会经过独热编码(one-hot encoding)——一种在机器学习中常见的变量转换机制,将变量的状态用 0 和 1 组成的二进制向量表示,再将所有编码整合组成风险因素向量,作为逻辑回归模型(risk-factor-based logistic regression model: RF-LR)的输入值。

在此基础上,研究人员又开发了一套以深度卷积神经网络(CNN)为核心的图片识别模型(image-only DL),使用开源的预训练模型 ResNet-18 。他们没有根据图片分辨率变化调整模型,直接以1664 x 2048 像素的乳腺X 光照片作为输入值进行训练。

MIT

风险因素的训练、验证及测试

最后,他们整合了逻辑回归和图像识别两个模型,制作了一个混合模型(Hybrid DLModel)。结合风险因素和图像信息,该模型开始学习预测女性在五年内是否会出现乳腺癌风险。

MIT

几种模型预测准确率的比较

以乳腺密度为例,与目前临床上使用乳腺密度作为评估乳腺癌风险标准的Tyrer-Cuzick模型相比,该模型识别风险的准确率有所提高。研究人员发现,高乳腺密度且模型评估乳腺癌风险高的患者癌症发病率,是乳腺密度和乳腺癌风险都较低的患者的3.9倍。这一趋势在不同女性群体中都体现了出来。

对不同族裔的女性预测准确率相同

值得注意的是,该论文提出的深度学习模型提高了对不同族裔女性的预测适用性,而包括Tyrer-Cuzick模型在内的很多现有模型大多依照白人女性数据建立,对非白人族裔的预测效果较差。该论文的突破对于预防乳腺癌的种族平等尤为重要,数据显示黑人女性罹患乳腺癌的机率比白人女性高40%,这可能由于不同族裔女性在检测和获得医疗保健方面的差异。

MIT

模型对不同族裔女性未来5年罹患乳腺癌的风险预测

研究人员成该深度学习模型在未来可以为乳腺X光检查奠定基础,从而预测患者是否可能存在其他健康风险,如心血管疾病、胰腺癌等。他们希望这个模型能帮助更多人早发现、早预防、早治疗,将癌症风险扼杀于摇篮之中。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分