《Digital Chemical Engineering》:Online learning supported surrogate-based flowsheet model maintenance
编辑推荐:
为应对工业数字孪生系统中流程表模型因工况持续变化而失准的难题,本研究创新性地提出了一个基于在线学习的代理模型连续校准与维护框架。该方法将代理模型嵌入在线学习循环,实现了流程表模型的持续校准,同时将直接、资源密集型的流程表仿真校准步骤减少了高达94%,并在动态工业环境中保持了全局模型精度,为维持数字孪生中代理与流程表模型性能提供了可扩展、自动化且稳健的解决方案。
在工业4.0的浪潮下,制造业与过程工业正经历深刻的数字化变革。数字孪生(Digital Twin, DT)作为这一变革的核心技术,通过构建物理系统的虚拟副本,为系统分析、仿真和优化开辟了新途径。流程表(flowsheet)模型是基于物理定律和热力学原理建立的高保真模型,是过程工业实现操作效率与系统安全的关键支柱,广泛应用于深度分析、场景评估、性能优化和设备状态监控。然而,当这些模型被部署在数字孪生等实时或近实时环境中时,持续面临的挑战日益凸显:物理系统的不断变化,如催化剂失活或热交换器结垢等,会导致模型性能随时间推移而退化,出现模型漂移(model drift)。传统的流程表模型校准通常被构建为优化问题,直接对复杂模型进行优化计算量巨大。为此,代理模型(surrogate model)被广泛用于加速计算密集型任务。但传统代理模型的性能严重依赖于训练数据的代表性,一旦真实系统运行在代理模型训练期间覆盖不佳的区域,其有效性就会大打折扣。如何在动态的工业环境中,高效且持续地维护代理模型和流程表模型的准确性,成为了一个亟待解决的难题。一项发表于《Digital Chemical Engineering》的研究,为此提供了一个创新性的解决方案。
为了应对上述挑战,研究人员提出了一个受在线学习启发的框架,以支持基于代理模型的流程表模型校准的持续维护。该方法弥合了离线代理模型开发与自适应模型维护之间的鸿沟。通过将代理模型嵌入在线学习循环,该框架能在最小化对资源密集型流程表仿真依赖的同时,实现模型的持续校准。研究以工业热交换器网络流程表校准为例,验证了所提方法的有效性。
本研究采用了一系列关键技术方法,构建并验证了所提出的在线学习支持的工作流程。首先,在离线阶段,研究人员使用拉丁超立方采样(Latin Hypercube Sampling, LHS)或基于不确定性的自适应采样策略,生成训练数据并构建了初始的代理模型(包括前馈神经网络FNN和贝叶斯神经网络BNN)。随后,在校准阶段,利用粒子群优化算法,通过最小化模型预测与观测过程数据之间的残差误差(目标函数结合了田口损失函数和参数重要性权重),来求解不确定参数(如结垢因子)。核心创新在于在线学习机制:代理模型会根据新获得的流程表验证结果或直接校准结果,结合原始离线数据集的一小部分(重放缓冲区),进行增量式微调更新。研究比较了多种更新策略,如始终更新验证结果、同时更新验证与直接校准结果、以及在代理校准失败时才更新的条件重训练等。为评估在线学习效果,研究者定义了局部校准改进和全局精度保留两项性能指标。
研究结果部分,通过一个简化的热交换器网络模型案例进行了系统评估。首先,在初始代理模型训练方面,研究比较了一次性采样(如LHS)和自适应采样策略。结果表明,使用更多LHS样本训练的FNN-high模型在测试数据集上精度最高,而基于自适应采样(使用BNN引导)构建的FNN-BNN-low模型,尽管使用样本更少,但其性能超越了使用较少LHS样本的FNN-low模型,证明了自适应采样在样本效率上的优势。
其次,在流程表校准与在线学习效果方面,研究引入了不同的在线更新策略。结果表明,在线学习的引入显著提升了验证精度。其中,始终更新的策略(Always-one和Always-both)取得了最低的验证成本函数和最稳定的性能。条件重训练策略也能提升精度,但改善程度较小。重要的是,在线学习缩小了不同初始模型之间的性能差距:即使初始精度一般的FNN-low模型,在经过在线更新后也能达到与更优初始模型相近的结果。
第三,在计算成本分析方面,所有基于代理模型的方案都减少了直接仿真校准的次数,而在线学习进一步降低了这一需求。始终更新策略所需的直接校准步骤最少。在总校准时间上,贝叶斯神经网络BNN由于重复的不确定性评估带来了显著开销,甚至比直接校准更耗时。而基于前馈神经网络的模型受益于在线学习,同时减少了直接校准步骤和总时间。
第四,在局部改进与全局保留评估中,所有在线学习策略都提高了代理模型对新操作数据的准确性。然而,如果省略重放缓冲区,会导致更高的变异性和偶尔因灾难性遗忘(catastrophic forgetting)导致的性能退化。包含重放缓冲区的策略不仅保持了全局精度,甚至通过整合新旧样本改善了全局性能。
研究结论与讨论部分强调,即使在原始设计空间内准确的初始离线训练代理模型,当应用于不断演变的操作条件时,其预测可靠性也可能下降。在这种情况下,使用过程中对局部操作区域进行增量式适应对于维持性能至关重要。本文提出的在线学习工作流程有效应对了这一挑战。结果表明,在线学习可以显著提高局部校准精度,同时减少对计算昂贵的直接校准运行的依赖。在本案例研究中,使用验证数据或直接校准数据进行增量再训练,足以实现未见过测试数据预测精度的显著提升,将直接校准步骤数量减少了高达94%。从方法论角度看,在线学习中加入重放缓冲区有助于缓解灾难性遗忘,从而在局部适应的同时保持全局模型精度。这些性能增益在不同初始精度的模型中均有体现,表明所提出的方法显著降低了对高精度初始代理模型的依赖,使得即使初始模型精度一般,也能实现快速部署和稳健的长期运行。该研究框架与机器学习运维(Machine Learning Operations, MLOps)的目标一致,专注于在生产环境中保持机器学习模型的可靠性和最新状态。未来的研究可以探索更先进的持续学习技术,如弹性权重巩固(Elastic Weight Consolidation, EWC),以及结合前馈神经网络效率与选择性贝叶斯神经网络不确定性评估的混合方法,以在关键校准点平衡预测速度与鲁棒性。将该工作流程扩展到更高保真度的工业模型和真实工厂数据集,对于验证其在操作噪声和未建模扰动下的可扩展性、稳定性和韧性至关重要。