基于DiPCA和ARMA-Transformer的工业过程监控孔晓然、黄汉轩、陈茂寅

《Processes》：Industrial Process Monitoring Based on DiPCA and ARMA-Transformer Xiaoran Kong, Hanxuan Huang and Maoyin Chen

【字体：大中小】 时间：2026年05月10日 来源：Processes 2.8

编辑推荐：

　　摘要本研究旨在通过开发一种改进的动态内主成分分析（DiPCA）框架来解决工业过程中初期故障检测的问题。该框架整合了Transformer注意力机制和掩码线性自回归移动平均（ARMA）结构。与原始的DiPCA相比，该方法能够在保持原始框架理论完整性的同时，有效表征复杂的动态过

　　摘要
本研究旨在通过开发一种改进的动态内主成分分析（DiPCA）框架来解决工业过程中初期故障检测的问题。该框架整合了Transformer注意力机制和掩码线性自回归移动平均（ARMA）结构。与原始的DiPCA相比，该方法能够在保持原始框架理论完整性的同时，有效表征复杂的动态过程。在这里，选择滑动窗口奇异值分解来构建动态特征矩阵。ARMA-Transformer网络能够捕捉多步预测特征。基于DiPCA的双重监控系统可用于建立动态和静态残差统计。对田纳西东曼过程（TEP）的模拟表明，所提出的方法对于初期故障的检测率（FDR）分别为77.80%和69.50%。这些比率平均比传统DiPCA、ARMA、PCA和DPCA高出40%以上。在凯斯西储大学（CWRU）轴承数据集上的验证进一步显示，在13种故障条件下，平均FDR达到94.74%。因此，它为复杂工业过程中的早期异常识别和安全监控提供了一种有效的方法。

1. 引言
故障检测在确保工业过程的安全和效率方面起着根本性的作用。现代工业系统正变得越来越复杂，因此早期和准确地检测初期故障至关重要。这些故障通常具有微弱的幅度，并且发展缓慢。如果这些故障未被检测到，它们可能会逐渐累积，导致严重的生产中断和经济损失。因此，需要可靠且实时的故障检测技术。这些技术还必须能够有效处理噪声和复杂的工艺动态。在过去几十年中，提出了许多数据驱动的过程监控方法。主成分分析（PCA）[1]、偏最小二乘法（PLS）[2]和独立成分分析（ICA）[3]代表了基础方法。然而，它们依赖于线性和静态假设。这些方法忽略了时间依赖性，无法捕捉初期故障的渐进演变。为了解决动态性问题，开发了动态PCA（DPCA）[4]和动态PLS（DPLS）[5]等扩展技术。它们虽然引入了时间延迟变量，但本质上是线性的，并且随着滞后阶数的增加，增广的维度增长迅速。这一维数灾难还因为这些方法无法处理非线性工艺行为而加剧。非线性变体，包括核PCA（KPCA）[6]和核PLS（KPLS）[7]，将数据映射到高维特征空间以捕捉非线性。然而，它们仍然难以检测到那些容易被噪声和正常变化掩盖的弱幅度的初期故障。此外，基于质量的方法（如PLS及其变体）由于依赖于质量测量的可用性和及时性，引入了额外的检测延迟，这特别不适合早期故障情况。尽管从线性静态框架到动态和非线性框架的方法有所进步，现有方法仍然无法为初期故障提供可靠的检测。

深度学习方法也被应用于过程监控。卷积神经网络（CNNs）[8]能够有效地从原始数据中提取局部特征。堆叠自编码器（SAEs）[9]及其变体（如深度集成SAE（DE-SAE）[10]在非线性降维方面表现出色。然而，它们的重建目标主要是静态的，这限制了它们模拟动态演变模式的能力。最近，Transformer架构[11]受到了关注。其自注意力机制能够捕捉长期依赖性，并克服了循环神经网络（RNNs）[12]的梯度消失问题。后续研究进一步将注意力机制与长短期记忆（LSTM）[13]结合，以增强关键时间步骤的识别能力。然而，将标准Transformer架构应用于工业过程监控并非易事：工业数据表现出强烈的自相关和高噪声水平，这与Transformer最初设计的语言数据有很大不同。鉴于这些限制，仅靠深度学习方法往往不足以检测到微弱的初期故障。

最近的研究探索了结合统计和深度学习范式的混合方法。这些方法结合了传统多变量统计过程监控（MSPM）技术的可解释性与深度神经网络的表示能力。这些努力主要涉及三个方向。第一个方向专注于集成多个检测器或特征的集成学习框架，从用于检测特定初期故障的PCA集成检测器（PCAED）[14]，发展到时域特征集成网（FENet）[15]，再到结合多个基本检测器和基于时间/频率特征驱动的集成方法（17），该方法通过贝叶斯推断将时域FENet与基于PSD的频域网络结合。第二个方向引入了对网络输出的统计测试，以提高检测可靠性。代表性工作包括结合基于ANN的分类和序列假设测试的混合框架，用于检测电力转换器中的参数变化[18]，将深度异常检测与序列概率比测试结合的系统，用于时间证据聚合[19]，以及将显著性测试与共形预测结合的方法，用于构建具有正式风险保证的故障检测预测集[20]。第三个方向将DiPCA[21]与LSTM等循环网络结合，用于动态过程监控[22]。虽然有效，但这种方法将神经网络视为在DiPCA之后应用的外部预测器。所提出的方法不同之处在于，ARMA[23]-Transformer取代了DiPCA内部的线性AR组件，保持了自回归形式、无监督学习设置以及DiPCA框架的统计可解释性。尽管有这些进展，但仔细检查会发现一个根本区别：神经网络和统计组件是外部耦合的——要么作为集成框架中的并行检测模块运行，要么作为以可靠性为导向的方法中的事后决策层运行。这种外部耦合限制了神经网络与传统MSPM框架中的统计分解和残差分析的有机集成。

在这项工作中，我们探索了一种不同的架构范式：将ARMA-Transformer直接嵌入DiPCA内部作为动态引擎，取代其原始的线性自回归组件，同时保留完整的DiPCA统计框架。与外部耦合不同，神经网络成为MSPM框架的一个组成部分。这种深度集成使网络的非线性动态建模能力能够直接增强DiPCA的核心潜在变量提取，同时保持DiPCA的既定统计机制，以确保可靠的故障检测决策。所提出方法的主要贡献如下：（1）提出了一种新的架构，将深度学习与传统的统计过程监控相结合，为工业过程安全监控提供了有效解决方案。传统的统计方法（如DiPCA）具有可解释性，并提供严格的控制限制，但它们的线性动态无法捕捉现代工业过程中的复杂非线性模式。深度学习方法（如Transformer）在非线性建模方面表现出色，但缺乏统计推断能力且难以解释。所提出的架构结合了两者的优势：ARMA-Transformer处理非线性动态预测，而DiPCA提供残差分析和故障决策的统计框架。（2）新颖之处在于将神经网络作为DiPCA内部的动态核心嵌入，而不是作为外部模块添加。原始的DiPCA依赖于线性自回归模型来捕捉时间依赖性。在这项工作中，AR-MA-Transformer在相同的位置承担了这一角色，而DiPCA的投影矩阵、残差膨胀和控制限计算保持不变。神经网络不是作为外部模块添加的；而是作为其动态引擎放置在DiPCA内部。

本文的其余部分组织如下。第2节介绍问题表述。第3节详细介绍了所提出的ARMA-Transformer DiPCA框架。第4节展示了在田纳西东曼过程（TEP）[24]和凯斯西储大学（CWRU）[25]轴承数据集上的实验结果和分析。最后，第5节和第6节总结了发现并讨论了未来的工作。

2. 问题表述
尽管在工业过程中的故障检测方面进行了大量研究，但在无监督条件下可靠地检测初期故障仍然是一个重大挑战。这些故障的特点是幅度小，容易受到工艺噪声和操作波动的影响。此外，它们的故障特征通常只在部分过程变量中显现。与产生持续较大偏差的突发故障不同，初期故障的发展缓慢，幅度与正常过程变化相当，这使得在逐样本基础上很难与正常行为区分开来。现有的方法（如DiPCA）在动态过程监控中表现出有效性。然而，DiPCA核心的线性自回归组件本质上限制了其对复杂工业环境中初期故障的微妙、非线性演变模式的敏感性。在无标记故障数据的无监督条件下，这一限制尤为明显。为了解决这一关键限制，本文提出了一种改进的DiPCA框架。与传统DiPCA相比，所提出的方法引入了两个关键创新：用于动态特征提取的滑动窗口奇异值分解，以及用于生成更具信息量的动态残差的掩码线性ARMA注意力模型。通过结合残差分析、多指标阈值和融合规则，并通过核密度估计（KDE）[26]确定控制限，该框架在TEP的故障3和9以及CWRU轴承数据集上实现了改进的检测性能和数值稳健性。应当注意的是，简单地将深度学习模型作为外部模块添加到MSPM框架中并不能解决根本限制。DiPCA的线性动态组件保持不变，定义监控框架的统计分解和残差分析也没有受到深度学习组件的直接影响。更有效的方法是用神经网络替换DiPCA的线性动态核心，作为其内部动态引擎，从而允许非线性建模能力直接参与潜在变量提取和残差生成，这对故障检测至关重要。

3. 基于DiPCA的ARMA-Transformer
在本节中，我们描述了基于DiPCA的ARMA-Transformer的开发过程。首先，通过DiPCA提取了动态潜在变量。然后，利用滑动窗口奇异值序列构建特征。此外，采用带有掩码线性ARMA组件的自回归Transformer进行多步预测。基于DiPCA的ARMA-Transformer的总体框架如图1所示。

3.1. 滑动窗口奇异值
对于工业过程的实时数据流，设置适当的窗口大小，并选择当前样本之前的样本形成滑动窗口矩阵。假设采样时刻为t，传感器数量为n。因此，滑动窗口矩阵表示为：
(1)
通过标准化，得到矩阵：
(2)
其中1表示全1的列向量，μ和σ分别是列均值和标准差向量：
(3)
(4)
其中θi是矩阵的第i行。标准化后，列的均值为0，方差为1。

对标准化的滑动窗口矩阵进行奇异值分解，得到：
(5)
其中A和B是正交矩阵，D中的对角线条目是时间索引i处的非负奇异值。通过沿时间序列滑动窗口，我们为每个t收集序列：
(6)
形成奇异值时间序列。选择这些序列中的前k个，作为DiPCA阶段的输入。在本研究中使用k=10。这些奇异值序列紧凑地表示了每个窗口内的主导能量结构。然后应用DiPCA提取具有强时间自相关的潜在变量。

3.2. DiPCA
DiPCA将动态数据建模与PCA结合，从高维过程数据中提取具有自相关结构的潜在变量。在动态潜在变量提取阶段，它迭代提取动态潜在变量，其中vi表示第i个潜在变量得分，wi是第i个投影向量。投影向量wi通过解决优化问题获得：
(7)
受约束条件约束，其中λ是滞后阶数，α是自回归系数向量，βi是第i个分量的得分，si是奇异值特征矩阵S的第i行。

通过交替更新迭代求解优化问题。固定λ后，wi通过最小二乘问题获得：
(8)
然后进行归一化。接下来，固定wi后，通过梯度上升法更新vi，并进行归一化，其中梯度由δwi给出：
(9)
此过程不断迭代，直到通过监测wi和βi的相对变化达到收敛。在收敛后，加载向量被计算为（10），残差矩阵通过移除提取的成分进行更新：（11）。在投影和重构矩阵阶段，最终的投影矩阵和加载矩阵分别为（12）（13）。潜在变量和数据重构由（14）（15）给出，其中是投影矩阵。3.3. 使用ARMA注意力机制的动态预测通过DiPCA提取的潜在变量T捕捉了过程的主导自相关动态，但DiPCA中的线性AR模型无法完全描述剩余的非线性时间模式。为了解决这个问题，潜在变量的动态预测采用了结合自回归（AR）和移动平均（MA）成分的ARMA注意力机制。对于通过方程（14）从DiPCA获得的潜在变量，自回归成分遵循经典ARMA模型的AR结构，其中过去的观测值通过固定系数进行加权：（16），其中表示时间的值向量，表示从固定参数矩阵而不是动态查询-键交互中派生的注意力权重。这种形式构成了一个具有严格下三角结构的因果线性层。根据ARMA模型的移动平均结构，预测误差被分解为通过MA系数加权的过去创新：（17），其中AR残差项被分解为（18）。在间接MA权重生成阶段，为了避免计算成本高昂的矩阵运算同时保持MA结构，采用了间接权重生成方案[27]。而不是显式计算，AR残差被用作MA成分的值输入：（19）。这建立了矩阵关系和隐式转换：（20）（21）。MA权重矩阵具有理想的时间衰减特性，其元素满足（22），其中表示特征衰减参数。这种衰减模式与标准MA过程的行为相匹配，即过去创新的影响随着时间延迟的增加而减小。在通过变换查询和键的MA组件阶段，MA组件使用应用于AR残差的专用注意力机制进行计算。首先，MA部分的查询和键通过专门的功能进行变换：（23）（24），其中和是设计用来塑造MA动态的注意力权重分布的元素级变换函数。然后通过将变换后的注意力权重应用于残差值来获得MA输出：（25）。这种形式有效地捕捉了残差序列中的短期依赖性和误差校正，对应于注意力框架内的MA特性。在最终的ARMA输出和预测阶段，通过整合自回归和MA组件生成ARMA注意力块的最终输出，随后进行线性投影：（26），其中是一个可学习的输出投影矩阵。这种组合输出作为时间的潜在变量分数的一步预测，有效地利用了历史模式（通过AR）和最近的创新序列（通过MA）来提高动态预测的准确性。3.4. 控制限计算和故障诊断一旦ARMA-Transformer预测出潜在分数，预测误差被分解为两个互补的成分：潜在空间中的动态残差和原始特征空间中的静态残差。这些残差构成了故障检测的基础。通过KDE确定监控统计量的控制限，以表征正常运行数据的经验分布。对于这三个监控统计量中的每一个，相应的控制限被确定为KDE拟合分布的-分位数。基于KDE的概率密度函数表示为（27），其中是高斯核函数，是带宽参数，是来自正常运行数据的观察监控统计量。采用三种监控统计量进行全面的故障检测：（28），其中表示动态残差向量。（29）表示PCA降维后的静态残差。（30）表示静态残差向量。当任何监控统计量超过其控制限时，过程观测被标记为故障。3.5. 算法基于DiPCA的ARMA-Transformer的操作包括两个顺序部分。首先，使用历史正常数据训练模型并计算统计控制限，如算法1中正式描述的那样。随后，将训练好的模型部署在新数据样本上进行连续的、实时的初期故障检测，具体步骤在算法2中提供。算法1。离线训练输入：—输入数据；w—滑动窗口宽度；—奇异值数量；s—滞后阶数；l—潜在变量数量输出：P,W,R—DiPCA矩阵；—训练参数；，，—控制限1：标准化滑动窗口2：对每个窗口执行SVD并获取序列{}，保留前个以形成S3：提取l个动态潜在变量T并获取P, W（方程（7）–（11））4：计算R（方程（14）和（15））5：对于每个训练周期执行6：??将T输入到transformer中7：??计算预测T和实际T之间的损失（方程（16）–（26）8：??反向传播损失并更新模型参数9：结束for10：对T进行前向传播以获得预测11：在正常数据上计算，，（方程（28）–（30）12：计算控制限，，（方程（27））15：返回P, W, R，，，，算法2。在线检测输入：—新样本；P, W, R，，，—训练参数；s—滞后阶数；，，—控制限输出：状态1：从滑动窗口中提取奇异值，执行SVD，形成S2：将投影到潜在空间T（方程（14）3：对于每个预测步骤执行4：?预测T（方程（16）–（26）5：?计算，，（方程（28）?（30）6：?如果或或则7：??将步骤标记为异常8：?否则9：??将步骤标记为正常10：?如果存在任何异常步骤则11：?结束if12：?如果存在任何异常步骤则13：?状态 = 故障14：?否则15：?状态 = 正常16：?结束if17：返回状态4.4. 仿真在本节中，使用著名的TEP基准测试和CWRU轴承数据集来验证所提出方法的优越性能。4.1. 田纳西东方公司工艺（TEP）这个化学工厂模拟器最初由东方化学公司创建，在过程系统工程中广泛用于基准测试故障检测算法，因为它表现出明显的非线性和时变行为。该仿真集成了五个单元操作：反应器、产品冷凝器、汽液分离器、循环压缩机和脱除器。记录了三十三个信号：二十二个连续测量值（XMEAS 1–22）和十一个控制器输出（XMV 1–11）。它们共同描述了工厂的基本动态和运行状态。在模拟器中预定义了二十一种故障情景。本研究主要检查了故障3和故障9。故障3是反应器冷却 water 进口温度的阶跃变化，故障9是反应器进料组成的随机变化。图2显示了TEP的系统结构。仿真数据是使用TEP的闭环版本生成的[28]，可在http://depts.Washington.edu/control/LARRY/TE/download.html（2026年4月10日访问）。训练和测试数据集都模拟了200小时，采样间隔为三分钟。对于每个测试数据集，在模拟100小时后引入了一个故障。除了故障6外，每种故障类型获得了4000个训练样本和4000个故障测试样本。应当注意的是，故障0代表正常运行条件。故障检测率（FDR）是基于每个测试数据集的最后2000个采样瞬间计算的，而误报率（FAR）是使用故障0数据集评估的。表1展示了所提出方法与其他故障检测方法在TEP数据集上的综合性能比较。比较的方法包括传统的统计方法PCA和DPCA，以及基于深度学习的方法Transformer、LSTM-VAE [29]和1DRGANomaly [30]。所提出的方法平均FDR达到了82.97%，显著优于PCA和DPCA。对于具有挑战性的初期故障3和9，Transformer的FDR分别为2.70%和3.35%，LSTM-VAE分别为9.13%和0.04%，而1DRGANomaly分别为1.90%和1.90%，而所提出的方法分别达到了77.80%和69.50%。这些结果突显了将ARMA-Transformer嵌入到DiPCA统计框架内的优势，优于传统的和独立的深度学习方法。表1. TEP不同方法的FDR（%）。表2展示了量化每个组件贡献的消融研究。对于基于SVD的方法，使用了1500的滑动窗口大小，并从每个窗口中保留了前五个奇异值。所有模型都使用固定的随机种子42进行训练，Adam优化器的学习率为0.001，训练周期为100个周期。滞后阶数为s = 2，DiPCA的潜在变量数量为l = 5。ARMA-Transformer使用了64的隐藏维度，并有四个注意力头。控制限通过KDE以99%的置信水平（α = 0.01）计算。结果显示，完整模型的平均FDR为82.97%。移除基于SVD的特征提取导致FDR下降19.30个百分点，用DiPCA的原始线性AR组件替换ARMA-Transformer使平均FDR下降17.93个百分点，移除DiPCA的潜在变量结构导致FDR下降7.51个百分点。这些结果表明，所有三个组件都对整体性能有重要贡献，SVD提供了噪声抑制和紧凑的动态表示，DiPCA提取了自相关的潜在结构，ARMA-Transformer捕捉了线性AR模型无法表征的非线性时间模式。表2. TEP数据集上不同组件组合的FDR（%）。为了详细说明，图3和图4比较了三种方法获得的检测轨迹，其中红色虚线表示控制限，绿色虚线标记了故障引入的时间点。图3. TEP中故障3的检测性能。（a）DiPCA；（b）ARMA；（c）所提出的方法。图4. TEP中故障9的检测性能。（a）DiPCA；（b）ARMA；（c）所提出的方法。4.2. CWRU轴承数据集CWRU轴承数据集是国际公认的验证轴承故障诊断算法的基准。在这项研究中，从实验平台以48 kHz的采样频率获取振动信号，该平台包括电机、扭矩传感器和相关的数据采集设备。数据集包括在内圈、外圈（位于3点、6点和12点钟位置）和滚动元件上人为引入的單点故障，通过电放电加工生成，以模拟真实的局部损坏。总共系统地分类了13种不同的故障条件，提供了评估不同故障类型和严重程度下诊断模型性能的全面基础。所提出方法在CWRU数据集上的性能在表3中进行了全面总结。为了确保公平比较，所有深度模型都配置了一致的超参数：固定的随机种子42，滑动窗口大小为1000，Adam优化器的学习率为0.001，以及100个训练周期。对于所提出的方法，保留了前5个奇异值，滞后阶数为s = 2，DiPCA的潜在变量数量为l = 5，ARMA-Transformer使用了64的隐藏维度，并有四个注意力头。控制限通过KDE以99%的置信水平（α = 0.01）计算。比较结果进一步突显了集成框架相对于单独的DiPCA和ARMA基线的优势。对于14密耳的球故障，DiPCA的FDR仅为16.35%，ARMA的FDR为66.20%，而所提出的方法将检测率显著提高到92.75%。对于14密耳的内圈故障，DiPCA的FDR仅为28.90%，ARMA的FDR为55.85%，而所提出的方法达到了74.20%。对于12点钟位置、故障大小为21密耳的外圈故障，DiPCA的FDR仅为39.65%，ARMA的FDR为86.30%，相比之下，所提出的方法达到了95.20%。在平均FDR方面，所提出的方法达到了94.74%，显著优于DiPCA（51.61%）和ARMA（90.53%）。这些结果共同证明了所提出的集成监控框架在轴承故障检测任务中的优越性和通用性。表3. CWRU轴承数据集中不同故障类型的FDR（%）。5. 讨论由于不需要物理模型，数据驱动的故障检测是动态过程中一个广泛研究的主题。本研究提出的实验结果证明了ARMA-Transformer DiPCA框架在复杂工业系统中检测初期故障的有效性。在TEP和CWRU轴承数据集上观察到的优异性能可归因于该方法中固有的若干方法创新。首先，将掩码线性ARMA注意力机制集成到Transformer架构中，解决了传统过程监控技术的一个根本性限制。传统的统计方法（包括PCA和DPCA）基于线性假设，因此无法充分捕捉工业过程的复杂时间依赖性。通过将ARMA动态纳入注意力机制，该方法能够有效建模自回归模式和MA组分，从而更精确地表征过程动态和故障特征。此外，深度学习组件与成熟的DiPCA统计框架的结合构成了一个稳健的监控系统。尽管深度学习模型在捕捉复杂非线性关系方面表现出色，但它们往往缺乏可靠过程监控所需的统计严谨性。在这里，DiPCA基础为残差分析和控制限值确定提供了统计框架，确保该方法在所有TEP故障场景下的平均误报率（FAR）保持在0.067%以下，同时提高检测灵敏度。这种低误报率以及来自统计框架的可解释控制限值有助于在实际应用中减轻操作员负担。

为了评估该方法的实际可部署性，对其计算复杂度和实时性能进行了测试。所有实验都在配备Intel Core Ultra 9 285H CPU和16 GB RAM的计算机上使用Python 3.13和PyTorch 2.8.0（仅使用CPU）进行。在22种TEP故障场景中，平均训练时间为5.3秒，平均测试时间为3.4秒。测试时间对应于处理4000个样本，平均推理延迟约为每个样本0.85毫秒。这种每样本的延迟完全在TEP基准的三分钟采样 interval 内，证实了该方法适用于工业过程的实时监控。值得注意的是，这些结果是在没有GPU加速的情况下获得的，表明该方法可以在普通的工业计算硬件上部署。较短的训练时间还表明，模型可以定期重新训练或更新而不会干扰在线操作。

不同故障类别之间的性能差异值得进一步研究。对于TEP故障3和9，该方法显示出比传统方法显著改进，表明ARMA-Transformer组件在检测由微妙、缓慢演变偏差引起的故障方面特别有效。与故障3和9相比，故障5的性能相对较低可能是由于冷凝器冷却水温度扰动的具体动态特性所致，这些扰动可能带来更大的检测挑战。对于故障5，阶跃变化仅引起单个变量的微小变化。由于滑动窗口SVD能够捕捉窗口数据中的主导能量结构，这种低幅度扰动容易被其他高能量变量稀释，导致奇异值特征携带的故障信息不足，无法为下游的DiPCA和ARMA-Transformer阶段提供有效信息。对于故障15，其检测率也较低，阀粘滞故障产生的间歇性瞬态偏差仅在阀门被命令移动时发生。固定权重AR注意力机制捕捉稳定的时间模式，MA组分通过其指数衰减结构进一步平滑短期残差波动。因此，在达到监控统计数据之前，瞬态特征可能部分减弱，导致阈值超调不连续，整体FDR较低。这些情况表明，虽然ARMA-Transformer与DiPCA的深度集成提高了对缓慢演变初期故障的敏感性，但对奇异值特征的依赖以及MA衰减结构的平滑效果可能会降低对孤立瞬态事件和单变量扰动的响应速度。

对于CWRU数据集，该方法在大多数故障条件下的持续高性能证实了其对机械系统的泛化能力。例外情况5（74.20%的FDR）表明，某些故障方向可能给基于振动的检测方法带来特定挑战。这种现象可能是由于振动传感器的方向敏感性或与内滚圈14密耳缺陷相关的不同传播模式造成的。在这种中等缺陷尺寸下，故障引起的脉冲比21密耳的大缺陷弱，而较大损伤区域的随机性增加使得故障特征不如7密耳的小缺陷有规律。滑动窗口SVD提取主导的奇异值模式，可能无法完全保留这些微弱且不规则的脉冲。固定权重AR注意力机制捕捉稳定的潜在动态，MA组分对残差进行时间平滑处理。对于具有不规则瞬态脉冲的振动信号，这种平滑处理可能在故障特征到达监控统计数据之前就将其减弱。尽管存在这些影响，74.20%的FDR仍显著高于仅使用DiPCA的28.90%和仅使用ARMA的55.85%，表明即使在次优条件下，该集成框架也能保持相当的故障敏感性。

这些发现的实际意义对工业应用具有重要意义。该方法在实现高检测灵敏度的同时保持低误报率的能力满足了过程行业的一项关键运营要求。误报和未检测到的故障可能导致不必要的生产中断和经济损失。此外，该方法在检测小规模故障方面的有效性突显了其在预测性维护应用中的潜力，有助于在故障升级为灾难性故障之前进行早期干预。

6. 结论

本研究解决了在复杂工业过程中检测初期故障的核心挑战。它提出了一种基于ARMA-Transformer的改进型DiPCA方法。该方法结合了ARMA结构来建模时间模式，并利用Transformer架构来捕捉长期依赖性。为了克服这一限制，引入了掩码线性ARMA注意力机制来替代DiPCA中的线性动态组分。在TEP上的测试表明，该方法检测典型初期故障3和9的速率远高于传统方法。此外，在CWRU轴承数据集上的测试证实该方法适用于机械系统。这项工作的主要贡献是一种将深度学习与传统统计过程监控相结合的嵌入式架构。神经网络被嵌入到DiPCA中作为其动态引擎，而不是作为外部模块添加，为工业过程安全监控提供了有效解决方案。然而，该方法在时变过程动态和实际工业条件下的有效性仍有待进一步研究，因为目前的验证主要集中在标准基准测试上。未来的工作将包括在大型化学企业的真实分钟级工业数据集上进行验证，以评估该方法在实际传感器噪声、变量耦合和时间不规则性下的性能。

热点排行