异构信号驱动下小样本跨域轴承故障诊断的GMAML算法

冬至子 2023-12-06 2269

电子说

1.4w人已加入

描述

Part.1/文章摘要

论文提出了一种通用的模型不可知元学习（GMAML）方法，用于在异质信号驱动的不同工况下，进行轴承的少样本故障诊断。该方法采用多核高效通道注意力特征编码器，用于从不同的故障数据中提取共享的诊断知识。

同时，引入灵活的权重引导因子，调整训练策略并优化不同诊断任务的内循环权重，从而提高整体的泛化性能。通过在加速度和声学信号方面的应用，验证了该方法在多种少样本跨领域场景下的有效性和广泛适用性。

Part.2/主要工作与贡献

该论文提出了一种新的方法，即通用模型不可知元学习（GMAML），用于解决轴承故障诊断中的少样本跨领域问题。与现有的跨领域元学习故障诊断研究不同，后者仅限于同质信号，而本论文提出的方法是首个探索涉及异质信号场景的研究，从而进一步扩展了元学习故障诊断的适用性。换句话说，过去的研究在跨领域元学习故障诊断中主要关注同质信号的情况，即相同类型的信号数据。

然而，本论文所提出的方法是第一次尝试探索在涉及不同类型信号的情况下进行跨领域故障诊断。这样的尝试具有创新性，因为它将故障诊断的应用范围扩展到了更广泛的信号类型，从而使得元学习在实际应用中更具有实用性这表明论文从方法层面上具有创新性，试图解决目前研究中存在的挑战。

Part.3/ ** 研究**方法****

论文引入了一种名为多核高效通道注意力特征编码器(multi-kernel efficient channel attention)简称MK-ECA的技术，用于从不同信号中提取共享的故障诊断知识。Efficient Channel Attention (ECA) 模块是一种嵌入在神经网络中的模块。它主要包含了一个全局平均池化（GAP）层，一个一维卷积（1-D Convolution）层和 Sigmoid 激活函数，其结构如图1所示。

该模块的设计旨在提高神经网络中的特征提取能力，特别是在多通道数据中。它通过全局平均池化层在输入特征上获取各通道的全局信息，然后通过 Sigmoid 激活函数学习每个通道的权重。这使得网络能够选择性地关注输入数据中的重要部分，并抑制不太相关的部分。这种机制有助于模型更好地捕捉关键的故障信息。

此外，ECA 模块结合了特征图的深度和空间信息，从而能够获得全局的通道信息。与全连接层相比，ECA 模块使用了一维卷积核，这有效地降低了计算和复杂性，同时通过 Sigmoid 激活函数学习通道权重。卷积核的大小是通过与通道数相关的函数自适应地确定的，这有助于适应不同维度的通道数据。

总之，ECA 模块通过全局信息汇聚和通道权重学习，使得神经网络能够更聚焦地提取重要特征，从而增强了特征的表达能力，尤其在多通道数据中，这对于故障诊断等任务尤为有益。论文在特征提取和表示学习方面做出了探索，以便更好地捕捉不同工况下的共性信息。

编码器

图1 MK-ECA的结构

论文还设计了一种灵活的内循环权重引导因子（weight guidance factor）简称WGF，用于在不同的诊断任务之间调整训练策略和内循环权重。权重引导因子是一个设计的因子，用于调整不同诊断元任务的训练策略，以增强诊断模型的泛化性能。它通过两个关键步骤来实现这一目标：

（1）内循环权重更新：在每个训练批次中，通过使用初始的网络参数，在内循环中更新模型的权重。这个更新过程考虑了内循环学习率和WGF，以使模型能够更加专注地学习每个特定任务的关键特征。

（2）外循环网络训练：使用在内循环中更新的权重，在外循环中在查询集合上进行网络训练。通过外循环的梯度下降法更新，模型的参数在不同任务之间得到平衡，从而实现更好的泛化性能。

WGF的核心思想在于，它允许模型根据不同的诊断任务灵活地调整参数，以适应任务之间的差异。通过在内外循环中的交替训练，模型逐渐学会如何更好地平衡和适应不同任务的特点，从而提高了在各种诊断场景中的性能。这个方法使模型在小样本跨领域故障诊断问题中变得更加通用和适应。

模型的结构以MAML模型为基线，其结构如图2所示。

编码器

图2 GMAML的结构

WGF的核心是调整内循环的学习率和内循环权重更新，以便根据具体任务特点来优化模型。通过在内循环中采用较小的学习率和WGF，模型可以更加关注特定任务的细节和关键信息。在外循环中，通过在 Query集合上训练模型参数，模型可以应用于更广泛的场景，从而提高泛化性能。

综上所述，内循环权重引导因子（WGF）是一种用于调整训练策略以提高模型泛化性能的方法。通过在内外循环中动态地调整学习率和权重更新，WGF 使模型能够在不同的诊断元任务中灵活应对，从而更好地适应各种诊断情况。

Part.4/实验验证

验证在不同场景下的应用：论文通过应用于加速度和声学信号数据，展示了该方法在多种异构跨领域情境下小样本故障诊断的有效性。这表明论文不仅停留在理论层面，还在实际数据上进行了验证。

编码器

图3 不同方法的准确率

Part.5/阅读心得

综上所述，该论文主要关注轴承故障诊断领域中的少样本跨领域问题，通过引入通用模型不可知元学习方法和多核高效通道注意力特征编码器，以及灵活的权重引导因子，来提升故障诊断模型在不同工况下的泛化能力。同时，通过实际数据的验证，证明了该方法的有效性和适用性。

打开APP阅读更多精彩内容