在信息稀疏的情况下,用于设备状态描述的即插即用图可靠性增强方法

《RELIABILITY ENGINEERING & SYSTEM SAFETY》:Plug-and-play graph reliability enhancement method for equipment state description under sparse information

【字体: 时间:2026年03月14日 来源:RELIABILITY ENGINEERING & SYSTEM SAFETY 11

编辑推荐:

  针对极小标签场景下设备状态描述与故障诊断中输入图信息不足及噪声干扰问题,提出知识对比优化(GKCO)模块与双视图拓扑Transformer(DVTT)框架。GKCO通过对比正负图对的结构差异优化输入图质量,DVTT融合拓扑关系与序列特征增强故障特征提取。实验表明在叶轮泵和BJ-RAO数据集上,GKCO-DVTT较基线方法提升故障识别准确率最高达24.5%,并验证了输入图优化与特征提取协同的重要性。

  
张鑫|刘杰|黄瑞毅|郝建成|乔子健|卢阳龙
中国香港特别行政区香港科技大学机械与航空航天工程系

摘要

近年来,基于图结构数据的设备状态描述和故障模式识别取得了显著进展。然而,由于已知的故障样本极其有限,输入图的可靠性和故障诊断性能受到了严重削弱。尽管现有研究关注先进的特征提取器或小样本学习框架,但它们忽略了输入图中固有的信息缺失这一关键瓶颈。为了解决这个问题,本文提出了一种即插即用的图知识对比优化(GKCO)模块和高精度故障识别框架,能够在极端标签稀缺的情况下共同提升图质量和特征学习能力。所设计的GKCO通过一种新颖的图对比变分自编码器实现,该编码器通过对比学习分析正负图对之间的知识差异和结构变化,从而实现基于拓扑的特征嵌入,以优化和重构图。此外,为了更好地利用稀缺的故障信息,还开发了一种双视图拓扑变换器(DVTT),该变换器可以从拓扑关系和序列依赖性中学习故障特征。在轴流泵和BJTU-RAO数据集上的实验表明,GKCO的准确率提高了24.5%以上(最高),并且一致性地改善了多种GNN分类器的性能,证明了其即插即用的通用性。这项工作还揭示了在少样本故障诊断中,优化输入图与分类器设计同样重要。

引言

设备的可靠性是现代工业的核心挑战之一,特别是随着系统变得越来越复杂和智能化,对健康状态的准确感知和故障模式的识别提出了更高的要求[1,2]。传统的故障模式识别方法依赖于专家知识和手动设计的特征提取技术,虽然在特定场景下取得了成功,但在处理现代工业系统中的大规模数据和复杂性方面却面临困难[3]。
深度学习的兴起[[4], [5], [6]]为故障诊断提供了自动化和高效的解决方案,特别是在处理大规模数据和复杂任务方面显示出显著的优势。它们可以自动提取深层故障特征,减少了对手动特征工程的依赖,并展现出强大的非线性拟合能力。然而,实际工业场景经常遇到故障标签稀缺和类别不平衡等问题[7,8],这使得依赖大量高质量故障样本的深度学习模型难以获得充分的训练。为了解决这个问题,研究人员提出了基于迁移学习[9]和数据增强[10,11]的少样本故障诊断方法。这些方法通过从相关领域转移知识或从现有数据生成新样本来在一定程度上缓解了少样本问题。然而,迁移学习通常需要目标任务和源任务之间的高度相关性,当目标设备的操作条件或故障模式与源领域有很大不同时,其性能可能会显著下降。数据增强的有效性受到原始样本质量和数量的限制,在极端故障样本稀缺的情况下,生成具有物理意义和多样性的新样本非常具有挑战性,这限制了其在不同场景和任务中的泛化能力。此外,普遍存在的噪声干扰加剧了少样本特征学习的难度。因此,现实世界场景中的少样本故障诊断仍然面临严峻的挑战。
图神经网络(GNNs)[[12], [13], [14]]利用其在图数据上的强大特征学习能力,为少样本故障诊断带来了新的机会。与传统的基于深度学习的故障诊断框架不同,基于GNN的方法通常包括两个组成部分:图构建和图特征学习。图构建将原始的一维信号转换为图表示,从而在非欧几里得空间中引入额外的故障知识,并揭示更深入的故障特征。图特征学习使用图卷积网络(GCN)[[15], [16], [17]]和图注意力网络(GAT)[18]等GNN作为特征提取器,从输入图中聚合节点信息并识别模式。为了提高少样本分类性能,研究人员主要关注两种策略。第一种是设计具有强大特征提取能力的图网络,例如KAFD [19]。然而,即使是最复杂的特征提取器,当输入图本身缺乏有用的故障信息时,也难以从根本上提高诊断性能。第二种策略旨在构建更可靠的输入图。例如,一些研究[20,21]使用小波变换的时间频谱或快速傅里叶变换(FFT)的频谱进行节点构建,然后通过K最近邻(KNN)规则建立边。然而,这些方法仅仅将故障信息转换为手动定义的格式,而没有充分探索图中的隐藏故障模式。
作为一种可行的解决方案,无监督图表示学习(GRL)[22,23]被提出用于提取有意义的高级表示。通过分析图的内在结构和连通性,它使模型能够捕捉复杂的模式和关系,从而为下游任务提供更全面的表示。在GRL技术中,图对比学习(GCL)[24]可以通过正负样本比较来优化图嵌入,这在从有限标记数据中提取鲁棒特征方面显示出潜力。尽管GCL在计算机视觉或社交网络分析[25,26]中取得了显著成功,但其在故障诊断中的应用仍然有限。例如,杨等人[27]使用预定义的正负K最近邻图(KNNGs)预训练GCN模型,然后进行半监督训练以进行节点级故障识别。李等人[28]使用对比损失作为正则化项来优化图神经网络的训练过程。虽然这些研究证明了GCL作为参数优化的预训练或微调策略的有效性,但它们主要关注模型调整,而不是直接提升输入图的知识或质量。
此外,探索更可靠和敏感的特征提取器仍然是一个有价值的策略,尤其是在处理稀疏故障特征时。例如,由变换器[29,30]表示的特征提取器,凭借其全局注意力机制和位置编码策略,可以有效地捕捉长序列依赖性。然而,它们无法处理非欧几里得数据,也无法明确建模或学习复杂的空间拓扑关系。另一方面,图特征提取器可以在拓扑结构中提取故障知识,但在分析节点特征内的特征相关性方面能力有限,这限制了在信息有限的情况下提取高精度故障特征的能力。通过创新地整合它们在处理序列和拓扑数据方面的优势,可能会出现新的故障分类解决方案。
总之,故障标签稀缺和普遍存在的噪声干扰共同导致了输入图质量的不可靠。原因有两个方面:一方面,故障样本稀缺意味着输入图中固有的故障知识不足,使得来自正常样本的无关信息主导了图结构和节点特征分布;另一方面,噪声可能会掩盖节点中的关键故障特征,并引入错误的边连接,从而进一步降低输入图的可靠性。在这种条件下,后续的特征提取器难以从这些不可靠的输入中捕捉到敏感和稀疏的故障特征。
因此,为了在这种场景中最大化诊断准确性,必须同时改进两个方面:1)提高输入图的质量,确保它们包含更丰富的判别特征;2)设计更好的图特征提取器,以捕获全面和准确的故障模式识别信息。受此启发,本文提出了一种图知识对比优化和双视图拓扑变换器(GKCO-DVTT)框架,该框架由两个核心组件组成。第一个组件称为GKCO,是一种新颖的图质量优化方法,它以无监督的方式分析正负图对之间的结构和知识差异,并通过更新节点特征和图拓扑来优化输入图。第二个组件DVTT旨在在故障标签和噪声干扰有限的情况下增强分类器的特征提取能力。其设计的双编码机制使基于变换器的分类器能够同时处理拓扑信息和序列特征,从而提高特征提取过程的稳定性和特征表示的鲁棒性。这两个组件的集成确保了在输入图构建和图特征提取阶段的性能提升。具体来说,本研究的主要贡献如下:1)
即插即用的图知识优化技术:为了解决图不可靠性的瓶颈,所提出的GKCO执行节点特征优化和图拓扑重构,作为一个独立于下游分类器的通用模块。通过对比构建的正负图对,GKCO增强了判别特征,同时抑制了噪声,从而为后续分析提供了更可靠的图表示。
  • 2)
    多目标协作损失函数设计:为了在GKCO过程中平衡图知识优化和重构一致性之间的冲突,设计了一个复合损失函数
    Lc
  • 3)
    一种新颖的双视图拓扑变换器:为了解决从信息稀疏图中提取关键特征的难度,所设计的DVTT模型结合了传统变换器和图特征提取技术,从拓扑关系和序列依赖性中共同挖掘稀疏的故障特征。
  • 4)
    广泛的实验验证:两个案例研究涉及自有的轴流泵和一个公共数据集,验证了所提出的GKCO-DVTT方法的有效性和适用性。与几种最先进(SOTA)方法的比较进一步证明了其优越性。
  • 本文的其余部分组织如下。第2节介绍理论基础。第3节介绍所提出的GKCO-DVTT。第4节是对轴流泵的案例研究,第5节是对BJ-RAO数据集的案例研究,提供了两个案例的实验结果和讨论。最后,第6节得出结论和未来的工作方向。

    部分片段

    问题描述和框架概述

    基于GNN的故障诊断范式通常遵循一个标准流程,如图1所示:首先从设备收集原始信号,然后将其构建为图结构数据,接着使用GNN分类器进行图特征学习和分类。然而,在实际故障样本极其稀缺的情况下,这一流程的两个核心阶段都存在关键瓶颈。在图构建阶段,有限的故障样本加上普遍存在的噪声

    所提出的故障诊断方法

    所提出的GKCO-DVTT框架旨在系统地解决第2.1节中确定的两个瓶颈:不可靠的输入图和有限的特征提取能力。它分为两个阶段操作:一个GKCO模块,用于提高输入图的可靠性和信息量;另一个DVTT模块,通过融合的拓扑-序列视角从优化后的图中提取判别特征。整个工作流程如图2所示,实现细节如下

    轴流泵案例研究

    本文中介绍的所有算法都是使用Python 3.12实现的,利用了PyTorch 2.8.0和Torch-Geometric 2.6.1库。实验在一个配备Intel? Core? i5-14600KF处理器、16 GB RAM和NVIDIA GeForce RTX 5060Ti GPU(支持CUDA 12.9)的系统上进行。

    数据描述和样本集构建

    为了进一步验证所提出的GKCO-DVTT的泛化能力,还在BJTU-RAO数据集[35]上进行了额外的验证。使用的数据来自地铁列车转向架传动系统故障模拟测试,如图10所示。选择了在电机运行(60 Hz)下获得的七通道信号,负载为?10kN,涵盖了五种健康状态:正常、短路、转子断裂、轴承故障和转子弯曲。根据参考文献[28]

    结论

    本研究通过开发一种高精度的GKCO-DVTT框架,解决了少样本场景中图知识不足的挑战,该框架集成了图知识优化和增强的模型特征提取能力,从而为基于图的故障诊断研究提供了新的解决方案。通过在两个案例研究中的广泛比较实验,所提出的方法不仅在极端条件下展示了优越的特征学习能力和噪声鲁棒性

    CRediT作者贡献声明

    张鑫:撰写——原始草稿、验证、方法论、调查、形式分析、概念化。刘杰:撰写——审阅与编辑、资源管理、数据整理。黄瑞毅:验证、软件开发。郝建成:可视化、验证。乔子健:可视化、资源管理。卢阳龙:撰写——审阅与编辑、监督、资源管理、项目管理和资金获取。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号