作为工业系统的核心组成部分,旋转机械的故障诊断技术已经从传统的信号处理发展到深度学习[[1], [2], [3], [4], [5]]。早期研究主要依赖于振动信号分析技术,如快速傅里叶变换(FFT)和小波分析[[6], [7], [8]]。尽管这些方法计算效率高,但在处理非平稳信号时存在明显局限性。随着机器学习的发展,支持向量机(SVM)[9]和随机森林等算法被引入到故障分类任务中,但这些浅层模型难以捕捉复杂的故障特征模式。近年来,卷积神经网络(CNNs)[[10], [11], [12], [13]]和长短期记忆网络(LSTMs)[14]等深度学习方法在故障诊断领域取得了显著进展。特别是深度残差网络[[15], [16], [17], [18]]通过跳跃连接有效缓解了梯度消失问题,在轴承故障诊断中的准确率超过了95%。然而,这些方法在处理动态特征衰减问题时仍面临挑战,无法有效模拟机械故障演变过程中的时间序列动态特性。
旋转机械的故障信号通常具有显著的非平稳性和动态衰减特性,这对特征提取方法提出了特殊要求。传统的静态卷积核在捕捉时变特征方面存在固有缺陷,难以有效检测早期微弱故障。为了解决这个问题,研究人员提出了多种动态建模方法。Yu等人[19]将动态卷积引入故障诊断领域,通过自适应调整卷积核的权重来增强特征提取;Gao等人[20]提出了一个时变注意力机制,专注于捕捉信号中的关键时间段。更创新的是,受到生物神经系统启发的液体状态机(LSM)概念被引入故障诊断[21],通过微分方程模拟神经状态的连续演化,表现出出色的动态特征建模能力[22]。然而,LSM的连续动态特性与工业故障的离散冲击特征之间存在不匹配,难以实现对瞬态冲击和渐进衰减特征的协同建模。
此外,传统的融合方法(如特征级拼接)存在模态干扰问题,而深度学习方法最初通过跨模态注意力机制实现动态模态间的交互。值得注意的是,图神经网络[[23], [24], [25]]通过构建模态拓扑关系将融合效果提升到了一个新的水平。然而,现有方法在处理异构模态的时空尺度差异方面仍不尽如人意。提高多模态融合效率需要更先进的网络架构[26],动态特征建模的突破为多模态融合奠定了基础,脉冲神经网络(SNN)由于其独特的脉冲编码特性,在瞬态冲击特征处理方面显示出显著优势[[27], [28], [29]]。特别是漏式积分-放电(LIF)神经元模型,其生物学上合理的动态特性为故障诊断提供了新的思路[30]。这些模型在处理时间信息方面表现出色,并具有高能量效率,适合捕捉瞬态故障特征。然而,我们需要在自适应阈值机制、膜电位衰减策略和可微分脉冲响应函数方面进行全面改进,以便模型能够在强噪声环境下稳定适应。
为了解决这些挑战,本研究提出了一种基于液体脉冲神经网络(LINN)的新型多模态异构特征融合模型。首先,为了解决机械信号的非平稳性问题,设计了一种改进的液体神经网络(ILNN),通过分块动态编码策略实现高保真状态建模。该设计通过模拟设备状态的演化,有效解决了传统方法在动态特征衰减方面的不足。其次,为了增强瞬态冲击故障的提取能力,引入了改进的SNN,通过自适应膜电位衰减和交替梯度传播机制来提高模型对机械故障中瞬态冲击特征的敏感性。最后,为了实现多模态信息的有效融合和决策过程的解释性,本研究提出了一种基于注意力机制的多模态融合框架,该框架通过引导模型关注关键特征来自动调整不同模态信息的权重,从而确保诊断结果的高准确性和解释性。
模型解释性已成为工业应用的关键要求,同时提高了诊断性能。传统的事后解释方法(如LIME[31])计算效率低下,而新兴的注意力可视化和因果推理框架朝着内置解释性迈出了重要一步[[32], [33], [34]]。在本研究中,我们构建了一个基于时间-频率域注意力(TFDA)分析的可解释框架,不仅实现了解释性可视化,还通过动态权重可视化、梯度激活分析和定量敏感性评估三个创新维度建立了完整的解释性评估系统。因此,本研究的技术贡献可以总结为:
- (1)
提出了一种液体编码机制,引入差分动态反馈结构,有效增强了机械状态演化特征的时空表示。
- (2)
构建了一种替代梯度传播的MC-LIF脉冲神经网络,以增强在复杂背景下的冲击类故障提取的鲁棒性。
- (3)
设计了一种基于TFDA的可解释多模态融合注意力机制,以量化模态贡献,同时提高分类准确性和诊断决策的透明度。