电子说
医学图像配准是一种常见的技术,将不同时期病人的磁共振( MRI )或CT等医学影像的结果进行匹配,来更详细地比较和分析解大脑解剖结构方面的差异。如果病人有脑瘤,医生可以将几个月前的脑部扫描结果重叠到最近的扫描图像上,以分析肿瘤微小的病程发展。
然而,这一过程通常需要两个小时或更长时间,因为传统系统会在待比对的图像中一丝不苟的对齐一百万个像素点中的每一个。为了解决这一问题,MIT的研究人员描述了一种机器学习算法,通过使用新的学习技术,将脑部扫描和其他三维图像的配准速度提高1000倍以上。
该算法在配准成千上万对图像的过程中,通过“学习”来工作。在此过程中,获取有关如何对齐图像的信息,并估计一些最佳对齐参数。训练后,运用这些参数一次性将一幅图像的所有像素映射到另一幅图像上。该算法使利用普通计算机进行配准的时间减少到一两分钟,或者使利用卓越性能的GPU进行配准的时间减少到不到一秒钟。
“当可以对齐其中一对或另一对MRI扫描图像时,配准MRI图像的任务就不应该困难了 。” 这两篇论文的共同作者,麻省理工学院计算机科学与人工智能实验室( CSAIL )和工程与计算机科学系( EECS )研究生 Guha Balakrishnan说:“在进行对齐配准时,是可以学到一些信息并继承下来的。如果能从以前的图像配准中学到一些东西,就能以同样的精度更快地完成新的任务。"
这些论文在刚刚过去的计算机视觉和模式识别会议(Conference on Computer Vision and Pattern Recognition,CVPR )以及9月举行的医学图像计算和计算机辅助干预会议(Medical Image Computing and Computer Assisted Interventions Conference, MICCAI )上发表,共同作者有: 马萨诸塞州总医院和CSAIL的博士后Adrian Dalca,CSAIL研究生Amy Zhao,在CSAIL做过博士后,现任康奈尔大学教授的Mert R. Sabuncu以及麻省理工学院电气工程教授John Guttag。
留住知识
MRI扫描结果基本上是数百个堆叠的二维图像,形成庞大的三维图像,称为“体积”(volume),它包含了一百万个或更多的三维像素,称为“体素”(voxel)。因此,将第一个3D图像的所有体素与第二个图像的所有体素对齐非常耗时。此外,扫描结果可以来自不同的机器,并且具有不同的空间方向,这意味着匹配体素的计算更加复杂。“你有两个不同大脑的不同图像,把它们叠放在一起,然后你开始转动其中一个,直到两个可以匹配上。数学上,这个优化过程需要很长时间,”CVPR论文的资深作者、MICCAI论文的主要作者Dalca说。
当分析来自大量人群的扫描时,这个过程变得特别缓慢。例如,神经科学家分析数百名患有特定疾病或症状的患者的大脑结构的变化时,可能需要数百小时。“那是因为这些算法有一个主要缺陷:它们从不会从已有的经验中学习。在每次配准之后,它们清楚了与体素位置有关的所有数据。:“从本质上说,给一对新的图像,算法要从零开始。”Balakrishnan说,“经过100次配准后,算法应该从校准中学到了一些东西。我们的研究就是基于这样的想法开始的。”
研究人员的算法被称为“VoxelMorph”,基于卷积神经网络( CNN ),CNN是一种常用于图像处理的机器学习方法。这些网络由许多节点组成,这些节点跨几个计算层来处理图像和其他信息。
在CVPR论文中,研究人员在7000张公开的MRI脑部扫描图像上训练了他们的算法,然后在另外250张扫描图像上进行了测试。训练中,大脑扫描图像被成对输入算法中。使用CNN和称为空间转换器的修改计算层,来捕获一张MRI扫描图与另一张MRI扫描图的相似体素。在此过程中,该算法学习关于体素组的信息,例如两次扫描共有的解剖形状,用于计算可应用于任何图像配准的优化参数。当输入两次新扫描时,一个简单的数学“函数”使用这些优化参数快速计算两次扫描中每个体素的精确对齐。
简而言之,算法的CNN组件在训练期间获得所有必要的信息,使得在每次新配准时,可以使用一个易于计算的函数评估来执行整个配准。
研究人员发现,他们的算法可以在两分钟内用传统的中央处理器精确地配准所有的250次大脑扫描测试图像(在训练之后进行的图像配准测试),并在不到一秒钟内用图形处理单元完成配准。
重要的是,该算法是“无监督的”算法,意味着不需要图像数据之外的附加信息。一些配准算法虽然嵌入了CNN模型,但是需要一个“基准线”,这意味着要首先运行另一种传统算法来计算精确配准。而这种算法在没有这些数据的情况下仍保持了准确性。
MICCAI论文开发了一种改进的VoxelMorph算法,Balakrishnan说,“我们对每个配准都非常有自信”。这个算法保证了配准的“平滑性”,这意味着它不会在合成图像中产生褶皱、孔洞或通常的变形。本文提出了一个数学模型,该模型用一种称为骰子分数的的指标来验证算法的准确性,骰子分数是评价重叠图像准确性的一种标准度量。在17个脑区中,改进的VoxelMorph算法的精确度与常用的最先进的配准算法相同,同时在方法和用时方面有了很大的提升。
大脑扫描图像配准以外的应用
研究人员说,除了分析脑部扫描图像之外,快速算法还有更广泛的潜在应用。例如,麻省理工学院的同事目前正在肺部图像上运行该算法。
该算法还为手术过程中的图像配准奠定了基础。在一些手术进行之前或实施中会使用不同质量和速度的扫描仪器进行图像采集。但这些图像直到手术后才会进行配准。例如,在切除脑肿瘤时,外科医生有时会在手术前后扫描病人的大脑,对比是否切除了所有肿瘤。如果还有没有切除干净的部分,就重回手术室再进行切除。
Dalca说,有了新的算法,外科医生几乎可以实时地配准扫描图像,从而更清楚地了解手术进展。“但目前在手术过程中无法真正重叠影像,因为这个过程需要两个小时,而且手术仍在进行中。”他说“如果这个过程只要一秒钟,那它就可以在实际中应用了。”
“现在有非常多的工作使用的的深度学习框架缺乏创造力或想象力。而这项工作不需要依赖大量的研究,它非常巧妙地将非线性映射当做一个学习任务。学习需要几个小时,但是使用网络的时候只需要几秒钟。“ 哈佛医学院放射学教授、麻萨诸塞州总医院神经科学家Bruce Fischl说,“这种方法将大量繁杂的工作(图像配准)变成了只要进行一次的学习过程,并将耗时数小时的工作在数秒内完成,这为医学影像和临床实践开辟了新的可能!譬如,当患者还躺在扫描仪器里时,算法就可以运行算法完成计算,当时就能够决定需要获取什么类型的数据以及应该聚焦到大脑的哪个部位,而无需要求患者在几天或几周之后再返回进行检查。”Fischl补充说,他的实验室开发了用于神经影像分析的开源软件工具,希望能很快使用这种算法。他说:“我们最大的缺点是分析数据库所花的时间太长,而且到目前为止,分析中计算密集程度较高的部分是非线性映射,所以这些工具对我来说非常有意义。”
全部0条评论
快来发表一下你的评论吧 !