来源:AI公园
作者:Nico Klingler
编译:ronghuaiyang
导读
在许多计算机视觉应用中(例如机器人运动和医学成像),需要将多个图像的相关信息整合到单一图像中。这种图像融合可以提供更高的可靠性、准确性和数据质量。
多视图融合可以提高图像分辨率,并恢复场景的三维表示。多模态融合则是将来自不同传感器的图像结合起来,也称为多传感器融合。其主要应用包括医学影像、监控和安全等领域。
图像融合的层级工程师根据融合实现的阶段将图像融合 (IF) 分为三个层级。
像素级 IF。这是一种低级别的图像融合方法,操作简单。它包含了两个输入图像的特征,并生成一个平均的、单一的结果图像。
特征级 IF。它从多个来源提取图像特征(如大小、颜色),并在特征提取后生成增强的图像。
块(区域)级 IF。这是一种高级技术。它利用多阶段表示法,并根据区域计算测量值。
图像融合的层次图像融合的类型
单传感器图像融合捕捉真实世界的一系列图像。算法将一组图像组合起来,生成一个新的具有最佳信息含量的图像。例如,在不同的光照条件下,人类操作员可能无法检测到物体,但在融合后的图像中却能突出显示这些物体。
这种方法的缺点是所使用的成像传感器在某些传感区域存在局限性。在传感器能力限制系统功能(如动态范围、分辨率等)的情况下。例如,某些传感器适合光照环境(如白天),但不适合夜间和雾天条件。
多传感器图像融合方法将来自多个传感器的图像合并形成复合图像。例如,红外相机和单独的数码相机各自产生它们自己的图像,通过合并,最终生成融合图像。这种方法克服了单传感器的问题。
多传感器图像融合
这种方法从多个图像中生成合并的信息。数码相机适合于白天条件;红外相机在弱光环境下表现良好。因此,这种方法在军事领域以及对象检测、机器人和医疗成像中都有应用。
在这种方法中,图像具有多个或不同的视图。这种方法利用了来自不同条件下的图像,如可见光、红外、多光谱和遥感图像。常见的图像融合方法包括对象级融合、加权像素融合和变换域融合。
这种方法处理来自 3D 视角的图像及其焦距。它将原始图像分成若干区域,使得每个区域在图像的一个通道中都是清晰的。
研究人员以多种方式实现图像融合,这里我们介绍最常见的几种方法。
Zhang 等人 (2021) 创建了一个基于卷积神经网络 (CNN-based fusion) 的框架,通过精心设计的损失函数来提取特征和重建图像,他们利用卷积神经网络作为整个融合框架的一部分来进行活动级别监控和特征整合。
在他们的 CNN 融合案例中,他们将损失函数与分类 CNN 结合起来进行医学图像融合。此外,他们将融合层嵌入到训练过程中。因此,CNN 减少了手动设计的融合规则(最大值、最小值或平均值)带来的约束。
CNN实现的图像融合
此外,研究人员还介绍了其他方法:
Ma 等人 (2023) 使用多尺度变换进行了 融合过程:
他们分别分解图像,以获得不同的频率层次,即高频和低频子带。
团队设计了最优融合计算方法作为融合策略。他们利用了高频和低频子带的不同特性。
为了生成融合图像,他们反转了最终的融合系数。
使用多尺度变换的图像融合
研究人员在多个尺度和多个方向上应用了小波变换和几何变换,而无需进行子采样。
他们的基于多尺度变换的融合方法根据不同子带的特性引入了融合策略。因此,融合图像富含详细信息且冗余较低。
与传统的多尺度变换相比,稀疏表示有两个主要区别。多尺度融合方法使用预设的基础函数,这忽略了源图像的一些重要特征。稀疏表示则是在一个完整的特征集上进行学习,可以更好地表达和提取图像。
此外,基于多尺度变换的融合方法将图像分解为多层,但对噪声和配准的要求相当严格。稀疏表示使用滑动窗口技术将图像分割为多个重叠段,从而提高了鲁棒性。
使用稀疏表示模型的图像融合图像融合的应用
图像融合的主要应用场景有四个:
机器人的运动利用了红外和可见光图像的融合。机器人使用红外图像来区分目标和背景,因为它们之间的热辐射差异。因此,光照和天气条件不会影响融合。然而,红外图像并不提供纹理细节。
对于他们的计算机视觉任务,机器人使用可见光图像。由于受到数据收集环境的影响,可见光图像可能无法显示重要的目标。红外和可见光融合方法克服了单个图像的这一缺点,从而提取信息。
融合图像通常比红外图像更清晰。此外,机器人会进行可见光和红外图像的融合,比如用于自动驾驶和面部识别。
如今,医学影像产生了多种类型的医学图像,以帮助医生诊断疾病或伤害。每种类型的图像都有其特定的强度。因此,图像融合在医学影像模式领域具有很高的临床应用价值。
医学影像研究人员将来自不同医学图像的冗余信息和相关信息结合起来,创建融合医学图像。这样他们为医学检查提供了高质量的信息启发式图像诊断。
医学影像中的图像融合
该图展示了通过结合计算机断层扫描 (CT) 和磁共振成像 (MRI) 进行医学诊断的图像融合示例。数据来自一个结合了断层扫描和磁共振成像的大脑图像数据集(MedPix 数据集)。
医生使用 CT 来分析具有高空间域分辨率的骨骼结构,并使用 MRI 来检测软组织,如心脏、眼睛和大脑。通过图像融合技术将 MRI 和 CT 结合起来,以提高准确性和医学适用性。
由于工业生产条件的限制,工件缺陷难以避免。典型的缺陷包括工件内部的碎屑、孔隙和裂纹。
这些缺陷在工件使用过程中会增加,影响其性能。因此,它们会导致工件失效,缩短其使用寿命,并威胁到机器的安全。
工业中的图像融合做缺陷检测
当前的缺陷检测算法一般分为两大类:
缺陷区域分割,其中所有潜在的缺陷区域从单一图像中被分割出来。
图像融合技术也被广泛应用于农业遥感领域。通过使用农业遥感技术,农民可以选择适合植物生长的环境并对植物疾病进行检测。
现有的融合技术,包括测距和光学检测设备、合成雷达以及中分辨率成像光谱仪等,都在图像融合中有所应用。
农业遥感图像的融合
研究人员利用基于区域的融合方案来结合全色、多光谱和合成孔径雷达图像。此外,一些农民还会结合光谱信息、雷达距离数据和光学检测。图像融合的优点和缺点
图像融合的好处包括:
图像融合存在一定的局限性,例如:
为了获得良好的图像可视化效果,通常需要多传感器或多视图融合。
总结
图像融合是一项重要的技术,用于集成和评估来自多个来源(传感器)的数据。它在计算机视觉、医学影像和遥感等领域有着广泛的应用。带有复杂非线性失真的图像融合有助于提高最复杂的计算机视觉方法的鲁棒性。
全部0条评论
快来发表一下你的评论吧 !