深度迁移学习结合监督式动态传感器评分技术，用于工业燃气轮机中可解释的故障诊断

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Process Safety and Environmental Protection》：Deep transfer learning with supervised dynamic sensor scoring for interpretable fault diagnosis in industrial gas turbines

【字体：大中小】 时间：2026年05月02日 来源：Process Safety and Environmental Protection 7.8

编辑推荐：

　　阿里·巴盖里·内贾德 | 马赫迪·阿里亚里-肖雷赫德利 | 阿博尔法兹尔·哈桑扎德电气工程系，K.N. 图西技术大学，德黑兰 16315，伊朗 **摘要** 非计划性的设备故障会给工业运营带来高昂的成本，因此早期故障检测（FD）对于维持旋转机械的效率至关重要。虽然

　　阿里·巴盖里·内贾德 | 马赫迪·阿里亚里-肖雷赫德利 | 阿博尔法兹尔·哈桑扎德
电气工程系，K.N. 图西技术大学，德黑兰 16315，伊朗

**摘要**
非计划性的设备故障会给工业运营带来高昂的成本，因此早期故障检测（FD）对于维持旋转机械的效率至关重要。虽然专家对振动信号的分析仍然是监测燃气轮机等设备的一种有效方法，但人工智能（AI）——特别是深度学习（DL）的迅速发展——使得智能故障检测系统的应用成为可能，这些系统可以补充或替代传统技术。目前，一台工业用MGT-40燃气轮机（40兆瓦容量，位于卡拉杰发电厂）采用传统方法和机器学习（ML）相结合的方式进行监控。然而，仍存在明显的性能差距，这表明通过先进的DL架构可以显著提升监测效果。在工业环境中部署基于DL的故障检测模型面临的主要挑战是缺乏大规模、标注良好的运行数据集。为了解决这一关键数据问题，本研究重点利用迁移学习（TL）技术。该方法将预训练的模型（如CWRU和MaFaulDa）适配到目标燃气轮机的特定运行特性和动态环境中。研究提出了一种新的结构，即监督式动态传感器评分（SDSS），这是一种类似注意力机制的方法，它对振动传感器进行评分而非直接处理原始特征。结果表明，SDSS架构不仅在故障检测性能上显著优于基线模型，还具备重要的可解释性。这种内在的可解释性源于模型的设计，能够更深入地理解振动数据，从而有效优先处理传感器读数，并在关键的工业环境中更稳健地监测运行异常。这项研究代表了向部署高效、稳健且可解释的基于DL的故障检测系统迈出的重要一步。

**引言**
旋转机械是众多行业不可或缺的资产，从资源开采到大规模发电（如燃气轮机）都离不开它们。这些复杂的系统由众多相互连接的部件组成，在不断变化的运行条件（温度、压力、负载和速度）下运行，因此容易发生机械故障（Chen等人，2020；Liu等人，2023）。确保这些关键资产的长期可靠性和运行完整性至关重要，这就需要开发出稳健的机器健康监测系统（Zhang等人，2023）。早期故障检测（FD）能够在故障升级为昂贵的非计划性故障之前识别出异常情况，这不仅具有优势，而且是现代工业可持续性的基本要求（Jalayer等人，2021；de Castro-Cros等人，2021）。

传统上，振动信号的故障检测依赖于在时频域提取特征，随后由领域专家进行分析和诊断。尽管这些专家驱动的方法仍然有效且被广泛使用，但现代工业系统的复杂性和规模不断增加，暴露出其显著局限性。例如，一个典型的发电设施可能配备多台大型燃气轮机（例如六台，每台配备大约十二个高采样率的振动传感器），会产生大量异构数据。仅靠人类专家同时高效地监控和分析这些数据变得越来越不可行。这些挑战促使人们研究利用人工智能（AI）的智能故障检测系统。这类系统不仅数据分析速度显著加快，还能识别出微妙且难以察觉的故障迹象。工业系统的快速发展极大地改变了故障检测在现代健康监测中的应用。最近的研究文献（Zhu等人，2023）进一步强调了这一研究领域的重要性。故障检测的核心是数据分析，其诊断方法的有效性从根本上取决于数据的质量和数量。ML算法的最新进展以及计算硬件的并行改进，使得大规模数据的分析更加高效，故障检测能力也得到了提升。

然而，随着数据量的呈指数级增长，传统ML方法在处理大规模高维数据时表现出局限性。深度学习（DL）技术的出现为处理复杂数据集提供了可扩展的解决方案，同时保持了稳健的故障检测性能（Zhang等人，2020；Neupane和Seok，2020）。支持向量机（SVM）是一种特别适用于高维数据分类的监督学习算法，它通过识别最优支持向量来最大化不同故障类别之间的分离（Da等人，2023）。Vos等人（2022）的研究展示了将一类SVM与长短期记忆（LSTM）网络结合用于机械系统中的异常检测，利用健康信号训练和专门针对齿轮和轴承故障的诊断架构。决策树（DT）在需要模型可解释性时具有优势，因为它具有直观的图形表示能力（Saufi等人，2019）。当与集成学习技术和卷积神经网络（CNN）结合使用时，DT不仅可以提高故障检测的准确性，还能在不同运行条件下改善特征提取能力（Xu等人，2019）。Albdery和Szabó（2024）将ResNet架构成功应用于不同条件下的滚子轴承故障检测，结合散点图滤波器组（Scattergram Filter Bank 1）进行信号到图像的转换，达到了90%至99%的高准确率。

传统ML算法需要耗时的预处理阶段，尤其是特征提取和特征选择（Li等人，2022）。这些过程不仅需要大量计算资源，还可能产生次优的特征表示。随着行业向大数据转型，模型驱动和传统数据驱动的方法有效性逐渐下降。模型驱动方法需要深入的系统理解，使其适用性降低；而传统数据驱动系统则难以处理高维数据，需要复杂的手动特征提取。如果模型未能识别真正的问题，就会产生假阴性（FN），即将实际故障错误地分类为“正常”，从而允许小缺陷迅速恶化为灾难性故障。对于燃气轮机故障（如转子不平衡、轴不对中、轴颈轴承故障或叶片缺陷），这可能导致仪器严重损坏，造成不必要的费用。这种升级会导致意外停机、昂贵的维修、产品浪费，并带来重大的安全隐患。条件监测系统的成本效益研究一致表明，其经济价值取决于早期准确的故障检测；相反，每一次漏检都会显著增加长期财务损失（Petkov等人，2020）。

深度学习方法通过在故障分类过程中自动学习分层特征表示来克服这些局限性。这种范式转变使得能够更全面地探索复杂的故障模式，同时大幅减少处理时间。常见的早期DL架构（如CNN、RNN、DBN和AE）仍面临网络设计复杂、对标注数据需求高以及处理不规则数据的难度等问题。然而，现代方法采用先进的架构（如图嵌入方法和基于Transformer的架构）来克服这些问题（Saeed等人，2025）。Huang等人（2020）的研究人员引入了基于深度神经网络的特征选择方法NeuralFS，其架构结合了全连接网络和决策网络之间的成对连接结构（图1）。NeuralFS的关键创新在于全连接网络的输出与其输入特征进行逐元素乘法运算，从而为每个输入特征生成动态评分，使网络能够自主评估每个特征的重要性和冗余性。因此，NeuralFS作为一种监督降维技术，其特征评分在学习过程中不断调整。

迁移学习已成为故障检测中的强大技术，尤其是在应对标注数据有限的问题时。虽然传统故障检测模型通常需要大量平衡的训练数据才能达到满意的准确性，但由于时间和资源限制，工业应用往往无法满足这一要求（Roman和Uddin，2023）。除了标签稀缺外，领域差异也是迁移学习可以解决的另一个挑战。通过将源领域学到的知识转移到目标领域，可以解决训练/基准（源）领域和运行/工业（目标）领域之间的数据分布差异（Albdery和Szabó，2024；Asutkar和Tallur，2023a）。Irani等人（2024）的研究提出了一种基于Koopman算子的无监督数据驱动故障检测策略，该策略将迁移学习与燃气轮机结合使用。首先，针对目标领域对DNN模型进行微调，以应对领域差异和数据稀缺问题；然后，他们将迁移学习策略与几何残差生成和决策分析相结合，以防止误报。

迁移学习范式通过使用CWRU或MaFaulDa等成熟的标注数据集来开发源故障检测模型，提供了实用的解决方案。这些预训练模型能够有效提取与振动相关的特征，并通过有限的标注数据进行针对性微调，从而将其能力转移到新领域。实证研究表明，这种方法在故障诊断应用中具有巨大潜力（Asutkar和Tallur，2023b）。选择CWRU等数据集的原因在于它们的振动特性，这些特性使卷积层能够有效提取与机械振动相关的特征。这种方法特别适用于处理具有相似光谱特性和时间结构的振动数据。

工业故障检测中最持久的挑战之一是运行条件的变化，这会导致数据分布发生显著变化，从而影响模型的故障检测能力。为了解决这个问题，迁移学习提供了一种无监督的异常检测方法。由于旋转机械系统中的振动数据具有共振、谐波或调制等共同物理特性，深度模型可以学习这些相关的动态特征。与依赖固定分类边界的方法不同，基于迁移学习的聚类方法可以利用这些通用特征表示来区分正常数据和异常数据。这种能力使得即使在数据分布严重变化的情况下，也能在未标注的工业数据中进行无监督异常检测，从而弥合了受控训练环境和实际应用之间的差距。

处理位于不同位置的多个传感器以及影响它们的不同类型的故障时，需要明智地选择使用哪个传感器以获取尽可能多的信息。这要求模型根据输入数据的故障类别调整每个数据源（本例中为不同位置的传感器）对输出的影响程度，从而实现更好的故障检测效果。本研究的目的是设计和解决这一挑战，通过采用Huang等人（2020）提出的成对连接结构来实现（图2显示了修改后的结构）。SDSS模块为所有传感器生成评分，结构中的跳过连接将每个输入传感器的评分结合起来，新的输入数据被送入故障检测网络以确定故障类别。本研究还旨在通过迁移学习验证该方法在工业故障检测中的适用性。实验将模拟工业数据的两个关键特性：数据分布的变化和数据域的转换。

对于高度复杂、非平稳的环境（例如具有变速和启停循环的燃气轮机），Lv等人（2025）开发了一种多通道变速注意力框架（MC-VSAttn），该框架使用动态时变响应模块来明确建模时变信号特性，并采用联合注意力机制来提高关键故障特征的选择性。结果证明，在复杂的变速条件下，诊断的稳健性和准确性得到了显著提升。

本文的创新不在于故障检测模型架构或所使用的迁移学习方法；而是在于问题的提出和为克服挑战而提出的结构。SDSS不是一个简单的故障检测模型，而是一个适用于任何能够分类和检测故障的架构的平台。SDSS将采用简单的模型架构和迁移学习方法，并将其性能与无SDSS模型进行比较。此外，这项研究兼具学术性和实用性，所有实验和结果都必须同时满足学术和工业领域的需求。除了提出SDSS结构作为其创新之外，还将使用一种简单的网络架构来满足行业对泛化能力的需求。本研究解决了故障诊断中的三个关键行业要求。首先，我们考虑了模型可解释性的需求，提出了一种新型架构，该架构不仅性能优于传统的故障诊断（FD）模型，还能提供关于不同故障类别下传感器行为的可解释性见解。其次，我们通过展示如何在基准数据集（CWRU和MaFaulDa）上预训练的模型通过最小程度的微调就能有效适应新场景，从而解决了小样本学习的挑战，即使在标记数据严重有限的情况下也能实现更好的故障诊断性能。最后，我们研究了所提出模型的无监督故障检测能力，证明了该模型在没有标记训练数据的情况下能够识别异常的机器行为。

在人工智能出现之前，机械系统中的早期故障检测——可观察到的症状或物理损坏——被认为是无法实现的。然而，现代机器学习方法通过数据驱动的分析使这一能力成为可能。当前的故障诊断系统利用从设备收集的传感器数据，使算法能够自主学习用于故障识别的判别模式。这种范式的转变突显了数据作为关键因素的基本作用。

为了评估深度学习模型的泛化能力，我们将可用数据分为训练集和测试集。训练数据集用于通过迭代学习过程优化模型参数。随后，使用测试数据集来评估模型在未见数据上的表现，从而衡量其泛化到新实例的能力。我们数据集采用的训练/测试比例为8/2。

在讨论如何对这个数据集进行信号分割之前（故障分类），一个基本的、简单的用于振动信号故障检测的DNN模型通常包括两个主要组成部分：CNN和MLP。CNN从输入信号中提取相关特征，而MLP则处理这些特征以做出分类决策。如公式1所示，特征（Z）是使用具有CNN架构的特征提取器（FE）从输入振动信号（X）中提取的。提取的特征随后被传递给MLP神经网络（CLS），如公式2所示，其任务是将Z映射到...

正如标题所示，本研究侧重于利用从CWRU数据集中学到的故障诊断知识，并将其转移到其他领域（数据集）进行故障检测。如第4.3节所述，在源领域上训练良好的模型是成功将知识转移到目标领域的先决条件。在本节中，我们将展示源模型的结果，并继续讨论将迁移学习应用于目标领域的结果。

工业维护更重视故障预防而不是事后更换，特别是对于停机成本较高的高价值设备。现代人工智能和深度学习彻底改变了状态监测（CM）和故障诊断系统，使得能够对关键机械设备的传感器数据进行更复杂的分析。

本研究提出的SDSS是一种向XAI迈进的范式，其结构比基础模型提供了更好的结果。所使用的跳跃连接用于评分...

CRediT作者贡献声明：
Abolfazl Hasanzadeh：数据整理。
Aliyari Shoorehdeli Mahdi：监督。
Ali Bagheri Nejad：写作——审阅与编辑，撰写——原始草稿，可视化，软件，项目管理，方法论，概念化。

利益冲突声明：
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系：Abolfazl Hasanzadeh报告称，设备、药品或供应品由Mapna Electric & Control Engineering & Manufacturing提供。如果还有其他作者，他们声明没有已知的可能会影响本文所报告工作的财务利益或个人关系。

联系信箱：

粤ICP备09063491号

热点排行