机器学习与FMEA融合：制造业故障优先级排序与过程风险分析的数据驱动框架

《Results in Engineering》：Integrating Machine Learning with FMEA for failure prioritization and process risk analysis in manufacturing

【字体：大中小】 时间：2026年01月19日 来源：Results in Engineering 7.9

编辑推荐：

　　本研究针对传统FMEA在复杂制造系统中存在的主观评分、参数等权重假设及无法捕捉非线性交互作用等局限性，提出了一种集成机器学习(ML)与FMEA的创新框架。研究人员利用灯泡成型和真空工艺的历史FMEA数据，采用XGBoost算法构建RPN预测的代理模型，并应用SHAP进行特征重要性分析，揭示了Severity(S)是过程风险的最主要贡献者。结合无监督聚类技术，成功将故障模式划分为基于风险的群组。该研究为制造业提供了透明、数据驱动且自适应的智能决策支持工具，显著提升了风险预测准确性和可解释性，对推动工业4.0背景下的质量管理具有重要意义。

在现代制造业中，可靠性和过程稳定性是维持竞争优势和运营卓越的关键。随着生产系统日益复杂，潜在故障的识别、评估和缓解需要比传统工具更智能、数据驱动的方法。其中，故障模式与影响分析(FMEA)长期以来一直是质量和可靠性管理的基石，它通过风险优先级数(RPN) = 严重度(S) × 发生度(O) × 探测度(D) 的乘积来表征每个故障模式的相对关键性，从而为识别潜在故障模式、估计其影响并确定纠正措施的优先级提供了一个结构化框架。

然而，尽管FMEA得到了广泛应用，传统的FMEA方法存在几个公认的局限性，包括评分主观性、参数间等权重假设以及无法捕捉过程变量间复杂的非线性相互作用或相互依赖关系。这些限制常常导致不一致的RPN评估和故障模式优先级的误导，特别是在参数动态交互的复杂制造系统中。因此，传统FMEA往往简化了风险结构，忽略了潜在的故障关系，产生的排名可能无法准确反映真实世界的过程行为。这种方法论上的差距凸显了对一种先进的、数据驱动的方法的需求，该方法能够模拟非线性依赖关系，减少人的主观性，并提供关于每个参数如何影响整体过程风险的可解释性见解。

为了应对这些挑战，并推动制造业风险评估向更智能、更精准的方向发展，研究人员Attasit Wiangkham和Rattawut Vongvit开展了一项创新性研究，成果发表在《Results in Engineering》上。他们的研究旨在探索将机器学习与FMEA相结合，以增强故障优先级排序和过程风险分析的潜力。

为了回答研究问题，研究人员开展了一项系统的案例研究。该研究以灯泡制造厂的成型和真空工艺阶段为背景，重点关注其对最终产品结构完整性、电气性能和寿命起决定性作用的环节。研究利用了从该工艺历史FMEA记录中提取的50个独特故障模式观察数据，涵盖了四个主要工艺阶段：扩口工艺、芯柱工艺、封口工艺以及封接排气工艺。研究遵循结构化的多阶段程序，首先进行历史传统FMEA评估作为基线，然后开发机器学习模型。核心方法是利用极端梯度提升(XGBoost)算法构建一个代理模型，以捕获FMEA参数之间的非线性关系并预测RPN值。模型性能通过决定系数(R2)和平均绝对百分比误差(MAPE)进行评估。为了增强模型的可解释性，应用了SHapley加性解释(SHAP)来识别最具影响力的参数。此外，研究还采用了三种无监督聚类技术——K均值聚类、聚合层次聚类和高斯混合模型(GMM)——将故障模式分类为不同的风险群组，并使用轮廓系数、Calinski-Harabasz指数和Davies-Bouldin指数验证聚类性能。最后，通过比较传统FMEA与ML增强框架的优先级排序，并进行敏感性分析，来评估所提出方法的改进和稳健性。

4.1. 基于机器学习的各故障RPN预测

XGBoost代理模型在全部50个观测数据上表现出卓越的预测准确性，其预测的RPN值与实际值高度吻合。模型达到了0.985的决定系数(R2)和2.84%的平均绝对百分比误差(MAPE)。这表明XGBoost能够高度精确地模拟FMEA参数与RPN之间的复杂关系，为后续的特征重要性分析和聚类提供了可靠的数字孪生基础。配对t检验进一步证实了预测值与实际值之间无显著统计学差异。

4.2. 基于SHAP的FMEA参数重要性分析

SHAP分析为理解各参数对RPN的贡献提供了深入见解。全局重要性分析表明，在三个FMEA参数中，严重度(S)具有最高的平均绝对SHAP值，其次是发生度(O)和探测度(D)。这挑战了传统RPN计算中参数等权重的隐含假设，表明故障后果的严重性在所研究的工艺中是整体风险的最主要驱动因素。局部SHAP分析进一步揭示了参数影响力的过程特异性。例如，在MP9和SEP13等故障模式中，S仍是主导因素；而在SEP3和MP7中，O的影响力更强；在SP14中，D则显示出较强的正向影响。这种差异化的洞察有助于针对不同故障模式制定更具针对性的风险缓解策略（如针对S驱动的风险改进设计稳健性，针对O驱动的风险加强预防性维护，针对D驱动的风险投资于先进检测技术）。

4.3. 聚类结果

基于聚类性能指标（聚合层次聚类法表现最佳），研究将故障模式划分为三个风险群组。聚类1（高严重性核心群组）包含41个故障模式，其特征是高严重度、中等发生度和探测度，平均RPN最高，是需要优先处理的核心风险。聚类2（高发生度群组）包含7个故障模式，严重度相对较低但发生度较高，风险缓解应侧重于降低故障频率。聚类3（低探测度异常群组）仅包含2个故障模式，其特征是探测度极低（难以检测）而发生度也低，尽管RPN值中等，但其低探测度代表了潜在的“隐藏”风险，需优先改进检测能力。这种基于数据驱动的风险分类法提供了比单纯RPN排名更稳定、更具操作性的风险优先级视图。

4.4. 传统FMEA与ML增强型FMEA的比较

对比传统RPN排名与基于SHAP值影响力的排名，发现两者在高端风险（如MP9, SEP13）上具有一致性，但在其他故障模式的相对排序上存在差异。这些差异反映了ML框架能够捕捉参数间的非线性相互作用，从而对风险优先级进行精细化调整。敏感性分析揭示了传统RPN值的固有脆弱性：RPN对S、O、D评分（尤其是多个参数同时变化）的微小变化高度敏感，这可能导致基于严格RPN阈值的优先级排序不稳定。相比之下，ML增强框架通过SHAP解释和聚类，提供了对参数相互作用更深入的理解和更稳健的风险分组机制，降低了因主观评分微小波动而导致的优先级剧烈变化。

4.5. 理论意义

本研究通过引入代理模型作为解释性接口，架起了传统FMEA与现代可解释机器学习之间的桥梁。它从理论上挑战了FMEA参数线性独立和等权重的传统假设，确立了数据驱动的风险建模新基础。SHAP的融入为机器学习决策支持提供了数学基础的可解释性。无监督聚类则提出了从确定性优先级排序到自适应风险分类范式的转变，丰富了可靠性工程的理论话语体系。

4.6. 实践意义

该框架为制造业提供了实用的解决方案。它通过ML预测降低了主观性，通过SHAP解释提供了针对性干预的洞见（如强化设计、优化维护、升级检测），并通过聚类实现了战略性的资源分配。该框架可作为智能模块集成到现有质量管理体系或工业4.0平台中，提高生产可靠性、成本效益和决策敏捷性。

4.7. 局限性与未来研究

本研究的局限性包括案例研究的单一性、数据集规模有限、未显式建模专家可靠性以及聚类分析未量化不确定性等。未来研究可扩展到更多工业领域，纳入更大数据集、实时传感器数据、上下文特征，探索与加权/模糊FMEA模型的结合，并采用不确定性感知方法以增强稳健性。

综上所述，这项研究成功地开发并验证了一个集成了机器学习和FMEA的创新框架。该框架不仅能够高精度地预测风险，更重要的是，它通过可解释的人工智能技术和数据驱动的聚类分析，揭示了传统方法无法捕捉的风险参数间的复杂关系和不稳定性，从而为制造业提供了一种更透明、更稳健、更智能的风险评估和决策支持工具。这项研究为在工业4.0时代实现数据驱动的质量管理和可靠性工程奠定了重要的方法论基础，具有深远的理论价值和广阔的实践应用前景。

热点排行

新闻专题