《Engineering Applications of Artificial Intelligence》:Spectrum-envelope attention-driven adaptive time-frequency enhancement network and its application in trustworthy cross-machine fault diagnosis
编辑推荐:
跨域故障诊断性能下降主要源于机械结构差异和工况变化引入的领域相关噪声,掩盖了领域不变故障特征。现有领域泛化方法多忽视旋转机械物理特性,导致复杂跨机场景效果受限。本文提出机制约束的跨域故障诊断框架SE-ATFEN,通过改进的带通滤波器组波变换提取多尺度时频特征,结合谱-包络注意力模块(SEAM)利用故障相关组件与领域噪声在包络谱上的稀疏差异,自适应增强故障特征并抑制噪声。实验表明该方法在跨机诊断任务中显著优于现有方法,并通过SEAM输入输出分析、注意力分布可视化及CAM解释验证了其可解释性和可靠性。消融实验证实各模块有效性。
Xin Kang|Zhengyang Cheng|Yi Gong|Junsheng Cheng|Yu Yang
湖南大学车辆车身先进设计与制造国家重点实验室,中国长沙,410082
摘要
跨域故障诊断的性能下降主要是由于机械结构和运行条件的变化引起的领域相关噪声,这些噪声掩盖了领域不变的故障特征。现有的领域泛化方法通常忽略了旋转机械的基于机制的先验知识,导致在大范围领域变化时出现过拟合和可解释性差的问题。为了解决这个问题,我们提出了一个基于机制约束的跨域故障诊断框架,该框架利用了故障相关组件与领域相关噪声在子带包络谱中的稀疏性差异。具体来说,使用改进的小波变换提取多尺度子带包络信息,然后通过谱包络注意力模块(SEAM)在稀疏性指导下自适应地增强故障相关子带并抑制领域相关噪声。实验结果表明,在具有挑战性的跨机器诊断任务中,该框架的性能明显优于现有方法。通过对SEAM输入、输出和注意力分布的全面分析,以及对增强后的时频表示和诊断结果的CAM可视化,进一步验证了所提出模型的可解释性和可靠性。消融实验进一步验证了每个组件在提高跨域泛化能力方面的有效性。
引言
旋转机械在现代工业系统中起着至关重要的作用,其健康状况直接影响生产效率和运行安全性。随着工业系统向智能和无人操作方向发展,数据驱动的故障诊断已成为设备健康监测不可或缺的一部分(Mueller等人,2023年;Wang等人,2026年)。然而,现实世界的工业环境的特点是训练数据和测试数据之间存在明显的跨域分布差异,这主要是由于结构变化、运行条件变化和环境干扰造成的。这种领域差异严重挑战了模型的泛化能力(Zhao等人,2024年;Zhou等人,2022年;Xiao等人,2025年),而深度学习的黑箱性质进一步阻碍了其在工业中的可信应用(Decker等人,2023年;Li等人,2024年)。
传统的故障诊断方法依赖于手工制作的特征和浅层分类器,尽管具有物理可解释性,但适应性有限(Randall和Antoni,2023年;Borghesani等人,2023年;He等人,2025年)。尽管深度学习方法通过端到端表示学习最近展示了优越的性能,但它们通常假设数据分布是相同的,因此在跨域场景中容易过拟合(Ding等人,2022年;Zhao等人,2020年)。为了解决这个问题,引入了领域泛化技术,通过分布对齐、对抗学习和特征规范化等策略来提取领域不变的特征(Chen等人,2023年;Karniadakis等人,2021年)。
在这项工作中,现有的领域泛化方法大致分为三类:减少学习偏差、减少归纳偏差和减少观测偏差(Karniadakis等人,2021年)。减少学习偏差的方法侧重于在特征空间中强制领域对齐,确保学习到的表示在跨类别之间具有区分性,并且在跨领域的类别内部保持紧凑。代表性的方法包括中心损失(Yang等人,2020年;Wang等人,2023a)、MMD(Wang等人,2023b)、Deep CORAL(Zhao和Shen,2022年)、对比损失(Ragab等人,2022年;Shi等人,2023a)以及基于三元组损失的方法(Han等人,2021年)。具体来说,CNCN(Yang等人,2020年)引入了中心损失来聚类不同领域中同一类别的特征,从而增强了学习表示的领域不变性。参考文献(Shi等人,2023a)(特征辅助的对比泛化网络)结合对比学习和特征辅助的多分支模块来抑制领域相关信息并提取跨域不变的故障特征。此外,参考文献(Han等人,2021年)在多个源领域应用三元组损失来强制类内紧凑性和类间可分离性,同时结合对抗训练进行领域级规范化以减轻过拟合。减少归纳偏差是通过明确约束和设计模型架构来实现的。典型的例子包括领域对抗训练(Shi等人,2023b;Fan等人,2024年)、因果学习(Jia等人,2024年)和变分自编码器(Li等人,2025年;Zhao等人,2025年)。参考文献(Jia等人,2024年)使用由因果聚合、重建和冗余减少损失引导的编码器-解码器架构来建模故障诊断中的因果机制,其中因果特征被视为领域不变的表示。在(Shi等人,2023b)中,作者进一步结合对抗学习和定制的特征归一化及自适应加权来提取跨域不变特征。减少观测偏差旨在通过特征增强和数据增强技术(如MixStyle(Kaiyang Zhou等人,2021年)和生成对抗网络(Shao等人,2023年;Wang等人,2024年)来丰富训练样本并抑制噪声,从而提高泛化性能。MixStyle(Kaiyang Zhou等人,2021年)受到低级卷积特征观察的启发,通过去除风格信息和重新组合特征统计来增强样本多样性,从而间接扩展训练分布并提高泛化性能。
尽管现有的领域泛化方法在一定程度上提高了跨域性能,但大多数方法都是从计算机视觉任务中改编而来的,忽略了机械振动信号的物理特性,因此在复杂的跨机器场景中的效果有限。同时,对可信诊断的日益增长的需求促进了可解释和受物理启发的神经网络的发展,这些网络结合了物理约束或先验知识来提取具有明确物理意义的特征(Wang等人,2026年)。代表性的例子包括WaveletKernelNet(Li等人,2022a)和SincNet(Mirco Ravanelli,2019年),它们将物理可解释的滤波器结构引入深度网络。然而,它们的滤波器参数在训练后保持固定,这在不同的采样率或运行条件下可能导致过拟合。基于小波散射的模型(如NTScatNet(Liu等人,2022年)提取了具有物理意义的特征,但由于其不可学习的性质而区分能力有限。其他研究利用小波包能量稀疏性和动态加权策略来提高可解释性和跨域一致性,在单源和开放集泛化场景中取得了有希望的结果(Lu等人,2025年,2026年)。此外,将物理约束的替代模型嵌入残差项中已被证明可以提高预测的合理性(Cheng等人,2025年)。
尽管取得了这些进展,领域泛化方法和受物理启发的神经网络仍然存在一些局限性:(1)大多数领域泛化方法侧重于减少学习偏差或归纳偏差,通常需要多个源领域,这与实际诊断中故障样本的稀缺性相矛盾;(2)关于信号结构和故障机制的丰富领域知识往往被忽视,限制了泛化和可解释性;(3)现有的受物理启发的模型通常是为特定组件或故障类型设计的,导致泛化能力有限;(4)泛化和可解释性通常被独立研究,忽略了它们在故障诊断任务中的潜在协同作用。为了解决这些问题,本工作的动机在于观察到故障相关组件在跨领域中相对不变,而领域相关噪声主导了性能下降。值得注意的是,这两个组件在子带包络谱中表现出不同的稀疏模式。利用这一物理洞察,我们将包络谱的稀疏性嵌入到模型设计中,并提出了一个基于机制约束的跨域故障诊断框架,通过自适应的时频增强和基于注意力的噪声抑制来共同提高泛化和可解释性。本文的主要贡献总结如下:
(1)提出了一个基于机制约束的跨域故障诊断网络SE-ATFEN,其中嵌入了具有低频高分辨率滤波器银行的小波变换,以实现物理意义上的时频表示。
(2)引入了谱包络注意力模块(SEAM),以利用故障相关信息和领域相关噪声之间的稀疏性差异,实现自适应的子带级噪声抑制和领域不变故障特征的增强。
(3)通过联合分析谱包络注意力、增强的时频表示和基于CAM的决策证据,建立了一个可解释的诊断框架,提高了泛化性能和诊断的可信度。
第2节讨论了所提出方法的背景和动机,以及复杂滤波器银行的构建。第3节详细介绍了所提出方法的模型结构,以及训练过程中涉及的损失函数和初始化信息。第4节主要包含了模型可解释性和泛化的验证。第5节总结了所提出方法的优点和局限性,并概述了未来的研究方向。
部分片段
SE-ATFEN的背景和问题
本节围绕三个关键主题展开:第2.1节讨论了时频表示(TFR)在跨域故障诊断中的优势以及由此产生的过拟合问题;第2.2节提出了解决过拟合问题的方法和理由;第2.3节介绍了一种适合嵌入网络架构的滤波器银行构建方法。
架构概述
在这项工作中,我们提出了SE-ATFEN,这是一种结合了可解释性和显著泛化性能的网络架构。该模型的可解释性在于它仅依赖于故障相关的时频语义特征进行诊断,这一点通过基于CAM的解释其推理过程得到了证明,从而增强了诊断结果的可信度。泛化能力来自于引入了一个可学习的、自适应的时频变换——谱包络
数据集
轴承和齿轮是旋转机械中最容易发生故障的组件。为了更好地匹配实际工业场景,本文使用轴承和齿轮故障作为示例来验证所提出模型的泛化(跨机器)和可解释性。现有的公共数据集要么专注于轴承,要么专注于齿轮,缺乏设备级别的故障数据。因此,本研究采用了一种联合方法,使用两个单一故障类型的数据集作为源领域
结论和未来工作
本文提出了一种基于谱包络注意力驱动的自适应时频增强网络(SE-ATFEN),用于旋转机械的跨域故障诊断,旨在平衡泛化和可解释性。网络中嵌入了一个改进的小波变换模块,以引入物理意义上的多尺度时频表示(TFR)。这一设计的动机在于故障相关组件和领域相关噪声在包络谱分布上的差异
CRediT作者贡献声明
Xin Kang:撰写——原始草稿、可视化、验证、软件、方法论、调查、概念化。Zhengyang Cheng:撰写——原始草稿、可视化、方法论、调查、数据管理。Yi Gong:撰写——原始草稿、可视化、软件、数据管理。Junsheng Cheng:撰写——审阅与编辑、监督、项目管理、概念化。Yu Yang:撰写——审阅与编辑、方法论、概念化。
利益冲突声明
作者声明他们没有已知的竞争财务利益或个人关系可能会影响本文报告的工作。
致谢
本研究得到了国家自然科学基金(52275103)的支持。