《Nature Communications》:Explainable mechanism for production process anomalies based on digital twin
编辑推荐:
为解决离散制造车间生产异常(AP)根因分析困难、数字孪生模型(DTM)可解释性差的问题,研究人员开展了基于数字孪生的可解释生产异常机制(EM2PA)研究。该机制通过数据增强器(DAr)、影响因素识别器(IFRr)和因果解释器(CIr)三个模块,实现了小样本数据生成、复杂耦合关系解耦和因果解释。案例研究表明,EM2PA能有效识别异常根本原因,提升生产过程的可解释性与可追溯性,为智能制造提供了新的分析框架。
在智能制造浪潮中,数字孪生车间作为创新运营模式正逐步推广应用。然而,随着物联网、大数据和人工智能技术的深度融合,数字孪生模型(Digital Twin Model, DTM)变得日益复杂,导致模型可解释性差,限制了其在工业场景的广泛应用。更为棘手的是,离散制造车间生产过程中存在大量不确定性和多重扰动,一旦发生异常生产(Abnormal Production, AP),传统方法难以快速定位根本原因,可能引发严重的经济和声誉损失。
现有研究虽在模型可解释性方面取得了一定进展,如提出了SHAP(Shapley Additive Explanations)和LIME(Local Interpretable Model-agnostic Explanations)等模型无关解释方法,但这些方法多关注"前向"解释(即输入如何影响输出),而根因分析更需要"反向"追溯(即从异常结果反推原因)。尽管有研究尝试将关联规则、专家知识等方法用于原因分析,但它们往往依赖大量规则集或知识库,在复杂工业环境中获取这些因果知识异常困难。数据驱动的方法在异常诊断方面表现出色,但在原因分析方面能力不足,缺乏系统性的异常检测、预测与解释联动方案。
针对这一难题,由钱伟伟、张立同等研究人员组成的团队在《Nature Communications》上发表了最新研究成果。他们创新性地提出了基于数字孪生的可解释生产异常机制(Explainable Mechanism for Production Process Anomalies, EM2PA),为实现生产异常的可解释分析提供了全新解决方案。
研究人员采用了模块化设计思路,构建了包含三个核心组件的EM2PA框架。数据增强器(Data Augmenter, DAr)针对工业场景中小样本、不平衡数据问题,通过特征变换策略生成异常生产的小样本数据。影响因素识别器(Influence Factor Recognizer, IFRr)基于支持向量机(Support Vector Machine, SVM)算法,包含车间级和单元级两个识别模块,分别用于识别异常类型和异常位置。因果解释器(Causal Interpreter, CIr)则通过计算SHAP值,量化各特征变量对预测结果的贡献度,从而提供因果解释。
在实验设计方面,研究团队选择了一个包含13个工位的离散制造车间作为实验平台,使用3900条生产记录(每条包含146个特征)进行模型训练和测试。实验分为两个部分:案例I重点验证数字孪生模型的可解释性,案例II则验证生产异常原因分析能力。
实验案例I:数字孪生模型可解释性验证
研究人员首先建立了用于生产进度预测的数字孪生模型G(.),该模型集成了深度神经网络(Deep Neural Network, DNN)和长短期记忆网络(Long Short-Term Memory, LSTM)两种基学习器。通过IFRr和SHAP方法,团队成功识别出影响生产进度预测精度的五类可追溯因素。结果显示,在缓冲区状态(W-IBSL,N)、加工设备状态(W-PSSL,N)和传输状态(W-TSSL,N)等因素中,缓冲区状态对模型输出的影响最大。具体而言,在缓冲区中在制品(Work In Process, WIP)等待时间的增加会导致生产进度减缓,这为生产人员分析原因提供了直观依据。
实验案例II:原因分析能力验证
在原因分析验证环节,研究团队展示了EM2PA的实际应用流程。首先,通过车间级识别模块分析生产过程中的异常模式类型,然后利用单元级识别模块确定异常发生的具体位置。以传输状态异常(W-TS11,1)为例,系统准确识别出异常发生在4号单元(U-TSI1,4)。
通过SHAP摘要图,研究人员清晰地展示了不同输入变量对各类异常模式的影响范围和分布。分析发现,加工设备状态(U-PSSL,N)对缓冲区异常模式的影响最大,而缓冲区状态(U-IBSL,N)和传输状态(U-TSSL,N)则是次要关键因素。不同变量对异常模式的影响排序存在明显差异,这表明通过恰当设定正常与异常模式之间的决策边界,可以有效揭示异常原因。
为验证所提方法的解释能力,研究团队还进行了与LIME方法的对比实验。结果显示,虽然两种方法在识别重要特征状态时存在50%的重叠,但SHAP在特征贡献的稳定性方面表现更优。除个别情况外,LIME在大多数组别中显示出更高的最大和平均标准差值,表明SHAP能提供更稳定、一致的特征贡献解释。
通过设定边际阈值线,研究人员进一步揭示了生产异常原因的耦合特性。例如,当设定边际阈值为8.0时,加工设备状态(U-PSsL,N)和出缓冲区状态(U-OBsL,N)分别是出缓冲区异常和WIP异常的原因;而当阈值设为7.0时,出缓冲区异常的原因还包括加工设备状态(U-PSSL,N)和设备状态(U-PESL,N)。
为验证因果解释器(CIr)的有效性,团队还提取了实际生产过程数据进行对比分析。结果明确显示,异常模式下加工时间数据与正常模式存在显著差异,这与基于CIr得出的结论高度一致,证实了EM2PA在识别离散制造车间异常生产过程原因方面的有效性。
研究结论与意义
本研究提出的EM2PA机制创新性地解决了数字孪生环境下的生产异常可解释分析难题。通过DAr、IFRr和CIr三个模块的协同工作,该机制不仅能够识别异常生产的类型和位置,还能揭示异常背后的根本原因,实现了从异常检测到原因分析的全流程可追溯。
实验结果表明,车间级识别模块的影响因素识别平均准确率达到95.28%(95%置信区间[93%, 97%]),单元级识别模块的准确率更是高达99.66%(置信区间[98.8%, 100%]),展现出优异的性能。
该研究的现实意义在于,只有准确识别并解决根本原因,才能实现对制造操作的真正改进。例如,通过识别数字孪生模型决策策略中的重要特征,并理解这些特征如何驱动模型的特定决策,生产管理人员可以更有针对性地优化生产过程。
值得注意的是,本研究提出的框架具有一定的抽象性,主要作为概念和方法论基础。EM2PA展现出良好的通用性,适用于需要解释根本原因的各个领域。然而,在工业制造领域内的可转移性需要针对特定场景进行适配,结合工业领域专业知识和技