基于多模态信息异构融合的液态脉冲神经网络模型，用于可解释的旋转机械故障诊断

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Mechanical Systems and Signal Processing》：A liquid-impulse neural network model based on heterogeneous fusion of multimodal information for interpretable rotating machinery fault diagnosis

【字体：大中小】 时间：2026年01月29日 来源：Mechanical Systems and Signal Processing 8.9

编辑推荐：

　　针对旋转机械故障诊断中动态特征衰减、多模态融合效率低和可解释性不足的问题，提出基于液体脉冲神经网络的LINN模型。通过液体状态编码层实现非稳态信号动态建模，多通道LIF神经元增强瞬态冲击特征提取，结合时间-频率域注意力机制实现自适应多模态融合与决策可解释性量化。实验表明，LINN在噪声和变负载条件下准确率达98.7%，参数量仅4.1M，跨条件泛化准确率88.64%，且通过注意力可视化验证了关键特征响应机制。

Keshun You|Yingkui Gu|Haidong Shao|Yajun Wang

华南理工大学电气工程学院，中国衡阳市石湘区衡义路228号，421101

摘要

针对旋转机械故障诊断中动态特征衰减、多模态融合效率低以及诊断解释性不足的问题，本文提出了一种可解释的多模态异构融合液体脉冲神经网络（LINN）模型。首先，构建了一个基于微分方程的液体状态编码层，通过分块反馈机制来模拟非平稳信号中的时间序列动态演化特征。此外，引入了多通道漏式积分-放电（MC-LIF）脉冲神经元，通过结合交替的梯度和膜电位衰减策略来增强瞬态冲击特征的提取。最后，设计了一种基于注意力引导的多模态融合机制，以实现时间-频率特征的自适应整合和贡献解释性的量化。在高噪声和变负载条件测试中，LINN的准确率超过了98.7%，仅使用了4.1个M参数，并且在跨条件泛化测试中的准确率为88.64%。消融实验证明了液体层和脉冲机制在增强动态建模和抗噪能力方面的关键作用，基于时间-频率域注意力（TFDA）的解释性分析进一步揭示了模型对关键时间-频率模态贡献的敏感响应。该方法为复杂工作条件下的智能诊断提供了一种具有高准确率、强泛化能力和解释性的有效解决方案。

引言

作为工业系统的核心组成部分，旋转机械的故障诊断技术已经从传统的信号处理发展到深度学习[[1], [2], [3], [4], [5]]。早期研究主要依赖于振动信号分析技术，如快速傅里叶变换（FFT）和小波分析[[6], [7], [8]]。尽管这些方法计算效率高，但在处理非平稳信号时存在明显局限性。随着机器学习的发展，支持向量机（SVM）[9]和随机森林等算法被引入到故障分类任务中，但这些浅层模型难以捕捉复杂的故障特征模式。近年来，卷积神经网络（CNNs）[[10], [11], [12], [13]]和长短期记忆网络（LSTMs）[14]等深度学习方法在故障诊断领域取得了显著进展。特别是深度残差网络[[15], [16], [17], [18]]通过跳跃连接有效缓解了梯度消失问题，在轴承故障诊断中的准确率超过了95%。然而，这些方法在处理动态特征衰减问题时仍面临挑战，无法有效模拟机械故障演变过程中的时间序列动态特性。

旋转机械的故障信号通常具有显著的非平稳性和动态衰减特性，这对特征提取方法提出了特殊要求。传统的静态卷积核在捕捉时变特征方面存在固有缺陷，难以有效检测早期微弱故障。为了解决这个问题，研究人员提出了多种动态建模方法。Yu等人[19]将动态卷积引入故障诊断领域，通过自适应调整卷积核的权重来增强特征提取；Gao等人[20]提出了一个时变注意力机制，专注于捕捉信号中的关键时间段。更创新的是，受到生物神经系统启发的液体状态机（LSM）概念被引入故障诊断[21]，通过微分方程模拟神经状态的连续演化，表现出出色的动态特征建模能力[22]。然而，LSM的连续动态特性与工业故障的离散冲击特征之间存在不匹配，难以实现对瞬态冲击和渐进衰减特征的协同建模。

此外，传统的融合方法（如特征级拼接）存在模态干扰问题，而深度学习方法最初通过跨模态注意力机制实现动态模态间的交互。值得注意的是，图神经网络[[23], [24], [25]]通过构建模态拓扑关系将融合效果提升到了一个新的水平。然而，现有方法在处理异构模态的时空尺度差异方面仍不尽如人意。提高多模态融合效率需要更先进的网络架构[26]，动态特征建模的突破为多模态融合奠定了基础，脉冲神经网络（SNN）由于其独特的脉冲编码特性，在瞬态冲击特征处理方面显示出显著优势[[27], [28], [29]]。特别是漏式积分-放电（LIF）神经元模型，其生物学上合理的动态特性为故障诊断提供了新的思路[30]。这些模型在处理时间信息方面表现出色，并具有高能量效率，适合捕捉瞬态故障特征。然而，我们需要在自适应阈值机制、膜电位衰减策略和可微分脉冲响应函数方面进行全面改进，以便模型能够在强噪声环境下稳定适应。

为了解决这些挑战，本研究提出了一种基于液体脉冲神经网络（LINN）的新型多模态异构特征融合模型。首先，为了解决机械信号的非平稳性问题，设计了一种改进的液体神经网络（ILNN），通过分块动态编码策略实现高保真状态建模。该设计通过模拟设备状态的演化，有效解决了传统方法在动态特征衰减方面的不足。其次，为了增强瞬态冲击故障的提取能力，引入了改进的SNN，通过自适应膜电位衰减和交替梯度传播机制来提高模型对机械故障中瞬态冲击特征的敏感性。最后，为了实现多模态信息的有效融合和决策过程的解释性，本研究提出了一种基于注意力机制的多模态融合框架，该框架通过引导模型关注关键特征来自动调整不同模态信息的权重，从而确保诊断结果的高准确性和解释性。

模型解释性已成为工业应用的关键要求，同时提高了诊断性能。传统的事后解释方法（如LIME[31]）计算效率低下，而新兴的注意力可视化和因果推理框架朝着内置解释性迈出了重要一步[[32], [33], [34]]。在本研究中，我们构建了一个基于时间-频率域注意力（TFDA）分析的可解释框架，不仅实现了解释性可视化，还通过动态权重可视化、梯度激活分析和定量敏感性评估三个创新维度建立了完整的解释性评估系统。因此，本研究的技术贡献可以总结为：

(1)
提出了一种液体编码机制，引入差分动态反馈结构，有效增强了机械状态演化特征的时空表示。
(2)
构建了一种替代梯度传播的MC-LIF脉冲神经网络，以增强在复杂背景下的冲击类故障提取的鲁棒性。
(3)
设计了一种基于TFDA的可解释多模态融合注意力机制，以量化模态贡献，同时提高分类准确性和诊断决策的透明度。

本文的结构如下：第2节系统介绍了用于旋转机械故障诊断的LINN模型，详细阐述了多模态数据预处理框架、基于液体神经网络的动态特征编码、MC-LIF脉冲神经网络设计、注意力引导的融合机制和多目标损失优化。第3节进行了全面的实验验证和分析，包括模型配置比较、最先进性能基准测试、消融研究、时间-频率域注意力解释性分析和跨条件泛化测试。第4节总结了研究的关键技术贡献和实际意义。

部分摘录

提出的可解释LINN框架用于多模态和小样本故障诊断

如图1所示，提出的LINN框架通过多模态异构融合和生物启发机制构建了一个端到端的智能系统，用于旋转机械故障诊断。首先，通过频谱图（SP）和FFT时频信号的输入处理模块实现原始数据的模态特定编码，并使用张量重塑和动态归一化来解决工业数据大小的异构性问题。

此外，时间输入在

模型配置

如表1所示，所提出模型的核心模块包括液体编码层、多通道漏式积分-放电（MC-LIF）神经元和多模态注意力融合机制。液体编码层采用分块反馈步骤（T = 50）、膜衰减因子（β = 0.8）和脉冲阈值（θ = 0.6）来实现动态时间建模和噪声抑制。MC-LIF神经元使用自适应阈值策略（初始阈值θ_o = 0.5，最大

结论

本研究提出了LINN模型，该模型利用液体脉冲神经网络实现动态特征编码，并采用注意力引导机制进行异构多模态融合，显著提高了旋转机械故障诊断的准确性和解释性。该模型创新性地将液体状态编码层与MC-LIF神经元集成，有效解决了传统方法在模拟非平稳信号和提取特征方面的局限性

资助信息

本研究部分得到了国家自然科学基金（编号：22409083、52275104）、湖南省自然科学基金（编号：2023JJ40535）和湖南省教育厅科研基金（编号：22A0289）的支持。

CRediT作者贡献声明

Keshun You：撰写 – 审稿与编辑、撰写 – 原始草案、可视化、验证、资源、方法论、调查、形式分析、数据管理、概念化。Yingkui Gu：调查、资金获取、数据管理。Haidong Shao：监督、软件、项目管理。Yajun Wang：资源、项目管理、调查、资金获取。

利益冲突声明

作者声明与本研究无关的任何利益冲突。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号