Inception-SECA-BiLSTM:一种具有注意力机制的多尺度特征提取建模框架,用于工业过程故障诊断
《Process Safety and Environmental Protection》:Inception-SECA-BiLSTM: a multi-scale feature extraction modeling framework with attention enhancement for industrial process fault diagnosis
【字体:
大
中
小
】
时间:2026年05月11日
来源:Process Safety and Environmental Protection 7.8
编辑推荐:
吕超超|王立敏|高芙蓉|张日东
信息与控制研究所,杭州电子科技大学,杭州310018,中国
摘要
工业过程数据通常具有强烈的非线性、时间依赖性、严重的噪声干扰以及提取弱故障特征的难度,这些都对准确的故障诊断提出了重大挑战。为了解决这些问题,本文提出了一种基于Ince
吕超超|王立敏|高芙蓉|张日东
信息与控制研究所,杭州电子科技大学,杭州310018,中国
摘要
工业过程数据通常具有强烈的非线性、时间依赖性、严重的噪声干扰以及提取弱故障特征的难度,这些都对准确的故障诊断提出了重大挑战。为了解决这些问题,本文提出了一种基于Inception自适应高效通道注意力双向长短时记忆网络(Inception-SECA-BiLSTM)的工业过程故障诊断模型。该模型将多尺度特征提取、通道注意力增强和时间依赖性建模集成到一个统一的框架中。具体而言,Inception-SECA模块通过并行卷积捕捉多尺度故障特征,而嵌入的自适应高效通道注意力(SECA)机制则能够自适应地重新调整通道级别的特征响应,增强与故障相关的关键信息并抑制噪声。此外,双向长短时记忆网络(BiLSTM)被用来模拟双向时间依赖性,并结合单头缩放点积自注意力机制进一步增强信息特征。最后,引入了一种特征聚集策略以融合全局表示,从而提高故障识别能力。在Tennessee Eastman(TE)工艺和实际工业焦炉数据集上的实验结果表明,所提出的方法在分类准确性、抗噪声干扰能力和训练稳定性方面表现优异。这些发现表明,该模型为工业过程故障诊断提供了一种有效且可靠的解决方案。
引言
现代工业系统正迅速向大规模、连续运行和智能配置发展。工业过程表现出显著的非线性和强耦合特性。监控数据通常伴有噪声,故障特征具有多尺度且易受干扰的行为。同时,过程系统本身具有复杂的技术动态,涉及设备、管理决策、操作人员、操作条件和外部环境等多种因素的相互作用。这些因素共同构成了过程工业中事故的主要原因(Adedigba等人,2016;Xiao等人,2024;Arunthavanathan等人,2021a)。在化学工程、能源生产和先进制造等关键工业领域,未检测到的小故障可能导致设备停机、生产中断甚至安全隐患,从而造成巨大的经济损失和不良的社会影响(Pasman等人,2023)。因此,准确高效的故障诊断技术对于确保运行安全、降低维护成本和促进智能制造升级至关重要,具有重要的理论意义和实用工程价值。
在深度学习成为主流之前,工业过程故障诊断领域的方法主要依赖于经典的多变量统计分析和浅层机器学习方法(Pu和Li,2021;Deng等人,2017;Yang等人,2021a;Chen等人,2023a;Wang等人,2017;Bian等人,2022),如支持向量机(SVM)、主成分分析(PCA)、随机森林(RF)、K最近邻(KNN)和Fisher判别分析(FDA)。这些方法基于坚实的数学基础、明确的物理解释和高计算效率,为过程监控建立了可靠的理论框架,并在工业实践中取得了显著成果。由贝叶斯网络(BN)表示的概率图模型(Guo等人,2021;Amin等人,2018)因其优秀的可解释性和不确定性推理能力而受到广泛关注,并被广泛应用于过程监控。Amin等人(Amin等人,2021a)进一步结合PCA和BN开发了一种数据驱动的故障检测与诊断(FDD)方法。该方法通过相关维度(CD)自动选择主成分,并基于Kullback–Leibler散度(KLD)和copula理论实现贝叶斯网络的自适应学习。通过使用vine copula和Bayes定理来捕获高维过程数据中的非线性依赖性,该方法避免了连续变量的离散化,有效扩展了PCA-BN框架在复杂工业过程中的应用范围。Ghosh等人(Ghosh等人,2020)解决了多变量过程系统中高度相关变量之间的非线性依赖性所带来的过程安全评估挑战。他们在贝叶斯网络模型中引入copula函数来表征过程变量在故障形成中的复杂依赖性和相互作用。所提出的copula-BN耦合框架有效克服了传统贝叶斯网络在处理非线性和非高斯依赖结构时的困难,为工业过程的在线监控和风险管理提供了有效工具。此外,Don等人(Don和Khan,2019)开发了一种结合数据驱动和知识驱动范式的混合FDD方法。在他们的框架中,采用隐马尔可夫模型(HMM)进行异常检测,使用BN进行根本原因诊断。HMM使用正常运行数据进行训练以识别异常,而BN结构基于过程知识构建,其参数使用历史数据的对数似然值确定。HMM的输出作为BN定位故障根部的依据。
这些方法凭借直观的因果推理和高效的不确定性处理能力,在故障检测理论的早期发展中表现出色,并为后续研究奠定了重要的方法论基础。然而,随着现代工业的发展,大规模数据、高维变量和强耦合等新特性给故障检测、诊断和控制设计带来了巨大挑战。这些方法难以适应动态运行环境(Yu和Zhao,2019),因此其故障诊断性能受到限制。
与浅层神经网络方法不同,深度学习方法(Zhang等人,2023;Alauddin等人,2023)在处理大量数据方面具有显著优势。利用端到端的自学习能力,深度学习方法在工业过程故障诊断领域取得了突破性进展(Wu等人,2026a;Zarei等人,2023),成为解决复杂工业数据建模问题的关键技术。卷积神经网络(CNN)(Arunthavanathan等人,2021b;Chen和Zhang,2026)基于局部感受野和权重的共享特性,擅长从数据中提取空间多尺度特征,并被广泛应用于振动信号和传感器数据的故障特征提取。长短时记忆网络(LSTM)(Yu等人,2024)通过门控机制有效缓解了梯度消失问题,准确捕捉时间序列数据中的长期依赖性,并为故障演变过程的动态建模提供了有力支持。生成对抗网络(GAN)(Yang等人,2021b)通过生成器和判别器的双向对抗训练,能够高效生成高质量的故障样本并净化弱故障特征,为样本少和噪声强的场景下的故障诊断和异常检测提供了有效解决方案。残差网络(ResNet)(Sun等人,2022)通过引入残差连接和恒等映射,有效解决了深度网络中的梯度消失问题,使得构建更深层次的模型成为可能,从而学习到更丰富的抽象特征,显著增强了故障特征提取的深度和鲁棒性。注意力机制的引入(Hassanin等人,2024;Tang等人,2025;He等人,2025)使故障诊断模型能够自适应地为不同传感器通道和时间步骤的特征分配权重,增强了故障敏感信息的提取,提高了模型在复杂操作条件下的诊断准确性和鲁棒性,并实现了故障诊断过程中的可解释性。
然而,现有方法仍存在一些不足:首先,单尺度卷积核难以全面覆盖工业故障的多尺度特征分布(Song和Jiang,2022)。例如,早期小故障的弱特征和严重故障的强特征往往位于不同的尺度空间,可能导致关键故障信息的遗漏。其次,工业传感器数据通常含有大量背景噪声和冗余信息(Xiao等人,2021)。传统模型缺乏有效的特征增强和噪声抑制机制,卷积核容易受到无关信息的干扰,导致学习到的特征缺乏区分能力。第三,时间和空间特征的融合缺乏针对性优化,未能充分探索故障演变过程中时空特征之间的内在相关性,难以准确表征故障的动态演变轨迹。
相关研究为解决上述问题提供了重要参考。Zhao等人(2020)提出了深度残差收缩网络(DRSN),通过在残差块中嵌入软阈值层有效抑制噪声,验证了注意力机制和特征收缩策略在强噪声环境中的有效性。Liu等人(2023)提出了多尺度残差卷积神经网络(MRCNN),通过设计并行的多分支卷积结构和使用不同大小的卷积核提取多尺度特征,显著提高了模型提取复杂故障特征的能力。Chen等人(2025)提出了双通道注意力卷积神经网络(CNN)和极值梯度提升(XGboost)的融合模型,通过通道注意力和空间注意力的协同效应使模型能够自适应地关注故障相关特征,显著增强了特征区分能力。然而,在工业故障诊断领域,如何同时实现多尺度特征的全面提取、噪声和冗余信息的有效抑制以及时空特征の深度融合仍然是一个亟需解决的关键问题。
为了解决上述挑战,本文提出了一种基于Inception自适应高效通道注意力双向长短时记忆网络(Inception-SECA-BiLSTM)的诊断框架,该框架实现了多尺度特征的同步提取、噪声抑制和时空特征融合。
本文的主要贡献包括:
1)构建了Inception自适应高效通道注意力(Inception-SECA)融合模块,使用1×1、3×1和5×1的多尺度卷积分支并行提取不同尺度下的故障特征。结合自适应高效通道注意力(SECA)模块,它能够自适应地增强关键通道特征,实现多尺度空间信息的准确提取。
2)引入了双向长短时记忆网络(BiLSTM)(Liu等人,2025;Zeng等人,2024)和单头缩放点积自注意力(SH-SA)机制,以捕捉工业过程时间信号的深层时间依赖性,提高了模型区分复杂故障模式的能力。
3)设计了平均-最大-端点特征聚合(FA)策略,融合全局平均值、全局最大值和最后一个瞬时特征,有效整合了故障特征,提高了模型的鲁棒性和整体分类性能。
本文的其余部分结构如下:第2节详细介绍了本文提出的故障诊断模型。第3节描述了Tennessee Eastman(TE)工艺数据集和焦炉数据集的详细信息。第4节通过实验验证了所提模型的整体诊断性能。第5节对本文的研究工作进行了系统总结。
提出的方法
本文提出的Inception-SECA-BiLSTM模型采用了一种包含多尺度局部特征提取、关键特征增强和高效特征聚合与分类的设计方法。该模型深度整合了卷积、注意力机制和循环神经网络的优点,实现了工业数据特征的全面挖掘和准确建模。
TE工艺数据集
根据实际的化学反应过程,美国Eastman化工公司开发了一个开放且具有挑战性的化学模型模拟平台——Tennessee Eastman(TE)模拟平台(Amin等人,2021b)。该平台生成的数据具有强耦合和非线性特性,目前被用作评估和测试化学过程故障诊断和监控技术的基准,并被广泛用于控制和故障检测的测试。
实验与评估
为了定量分析和评估模型性能,采用了诊断准确性、精确度、召回率、F1分数(Zhang等人,2025)和Cohen’s Kappa系数作为关键评估指标。精确度关注阳性样本的预测可靠性,反映了模型的预测准确性,接近1的值表示更好的精确度。召回率衡量正确识别的真正例样心的比例,表征了检测能力。
结论
本文提出了一种名为Inception-SECA-BiLSTM的故障诊断模型。该模型通过Inception的多尺度卷积分支实现故障特征的全局提取,并结合SECA模块增强关键特征和抑制噪声,有效解决了弱故障特征丢失和冗余特征干扰的问题。BiLSTM模块用于挖掘工业过程的时间依赖性和长期上下文信息。
未引用的参考文献
(Chen和Zhang,2025;Yin和Chen,2024)
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号