基于深度学习的核方法动态模态分解参数化框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Computational Science》：A parametric framework for kernel-based dynamic mode decomposition using deep learning

【字体：大中小】 时间：2026年05月22日 来源：Journal of Computational Science 3.7

编辑推荐：

　　代理建模广泛应用于计算科学与工程中，以缓解复杂大规模计算模型实时仿真以及多查询场景（如不确定性量化与设计优化）中的计算效率问题。本研究提出了一种基于线性与非线性解歧优化（LANDO）的核方法动态模态分解参数化框架。所提出的参数化框架由离线与在线两个阶段构成。离

代理建模广泛应用于计算科学与工程中，以缓解复杂大规模计算模型实时仿真以及多查询场景（如不确定性量化与设计优化）中的计算效率问题。本研究提出了一种基于线性与非线性解歧优化（LANDO）的核方法动态模态分解参数化框架。所提出的参数化框架由离线与在线两个阶段构成。离线阶段构建一系列 LANDO 模型，用于模拟具有特定参数的系统动力学。在线阶段利用这些 LANDO 模型在目标时刻生成新数据，并基于这些数据采用深度学习技术逼近参数与状态之间的映射关系。对于高维动力系统，该框架进一步结合适当正交分解（POD），以降低状态空间维数并提升学习过程的效率。通过三个数值算例，包括 Lotka–Volterra 模型、热方程和反应–扩散方程，验证了所提方法的有效性。研究还讨论了近似误差的主要来源，以及与该离线–在线结构相关的计算权衡。

该论文发表于《Journal of Computational Science》，围绕参数化动力系统的高效代理建模问题，提出了一个结合核方法动态模态分解与深度学习的统一参数化预测框架。研究背景在于，计算科学与工程中的复杂动力系统往往具有高维、强非线性以及参数依赖性，在实时模拟、不确定性量化和设计优化等多查询任务中，直接求解原始模型代价高昂，因此需要能够兼顾精度与效率的代理模型。现有数据驱动动力系统方法大致分为两类：一类试图结合先验知识辨识真实控制方程或其参数，另一类则直接从数据中构建重参数化表示以逼近系统演化。动态模态分解（DMD）作为重要的数据驱动方法，能够通过线性切空间近似描述时间演化，但标准 DMD 在表征复杂非线性动力学时能力有限。扩展 DMD 与核 DMD 虽然增强了 Koopman 算子近似能力，但在参数化预测方面仍面临效率、泛化和高维表示等挑战。针对这些问题，研究人员基于线性与非线性解歧优化（LANDO）算法，构建了一个适用于参数化预测的离线–在线框架，并引入深度神经网络实现参数到状态映射的学习；对于高维系统，进一步结合适当正交分解（POD）以降低维数并改善在线学习效率。研究表明，该方法能够有效实现低维和高维参数化动力系统的预测，并在精度与计算成本之间提供清晰的结构化权衡。

从方法上看，研究人员首先针对训练数据集中每个已知参数实例分别训练独立的 LANDO 模型，在离线阶段完成动力学逼近；随后在给定目标时刻，由这些模型生成对应状态数据，并以此作为监督信息训练深度神经网络（DNN），学习参数到该时刻状态的映射。对于高维问题，先利用适当正交分解（POD）提取低维主模态，再在降维空间中进行映射学习。数值样本来自预定义参数空间，并采用 Latin hypercube sampling 划分训练集、验证集与测试集。

在论文主体中，研究人员首先给出了问题陈述（Problem statement）。该部分将研究对象定义为参数化自治动力系统，既包括连续形式的常微分方程，也包括离散采样后的迭代映射形式。系统状态 x(t,μ) 随时间 t 演化，并受物理参数 μ 控制。该形式化定义明确了本文核心目标，即在给定参数条件下高效逼近系统在未来时刻的状态演化，并为后续构建参数化代理模型奠定数学基础。

在“动力系统的核逼近”（Kernel approximation of dynamical systems）部分，论文回顾并引入了 LANDO 算法的基本思想。对于固定参数情形，问题退化为非参数动力系统学习。LANDO 使用核函数 k(·,·) 将动力学 F 表示为由训练快照构成的核展开，并通过优化权重矩阵最小化预测残差。与传统 DMD 及其变体相比，LANDO 的关键优势在于：一方面，它能够在统一框架下分离动力学中的近似线性成分与非线性贡献；另一方面，它结合了核近似与稀疏字典构造，从而在保持非线性表达能力的同时获得更紧凑的表示。因此，LANDO 不仅适用于线性系统，也适用于更一般的非线性动力系统代理建模。

在“LANDO 的参数化框架”（Parametric framework of LANDO）部分，论文提出了全文的核心方法。研究人员将固定参数下的 LANDO 模型推广到参数化预测场景，不再尝试直接训练单一全局参数化算子，而是为训练集中的每个参数样本分别建立一个 LANDO 子模型。这样做的目的在于保留各参数条件下局部动力学结构的精细信息，并避免将不同参数样本简单堆叠后带来的计算膨胀与频率参数无关问题。在在线阶段，首先调用这些已训练的 LANDO 模型，在目标时刻生成与各参数样本对应的状态数据；然后训练或使用深度神经网络近似映射 M_t*，即从参数 μ 到该时刻状态 x(t^*,μ) 的函数关系。对于高维系统，研究人员在这一流程前加入 POD 降维步骤，将原始高维状态投影到低维模态空间，再对模态系数进行学习与预测，从而显著减小学习负担。

在“数值算例”（Numerical examples）部分，研究人员通过三个代表性问题验证了方法性能。第一类算例是 Lotka–Volterra 模型。该模型维数较低，但具有显著动力学非线性，适合检验参数化 LANDO 框架在低维非线性系统中的拟合与泛化能力。研究结果表明，所提方法能够准确学习参数对系统轨迹演化的影响，并实现良好的时刻状态预测。第二类算例是热方程。该问题体现了参数化偏微分方程（PDE）离散后的高维线性或近线性动力学特征，适合评估在高维空间中结合 POD 后的效率提升效果。结果显示，POD 与参数化 LANDO 联用后，能够在保持较好预测精度的同时降低计算与学习复杂度。第三类算例是 Allen-Cahn 反应–扩散方程。该问题兼具高维和非线性特征，是检验该框架综合性能的重要例子。研究表明，该方法在此类更复杂系统中同样能够有效建立参数到状态的映射，说明框架具有较好的普适性。三个算例的参数样本均通过 Latin hypercube sampling 采集，并划分为训练、验证和测试数据集，以系统评估模型表现。

在“讨论”（Discussion）部分，研究人员对误差来源与计算权衡进行了总结。论文指出，所提框架的总体误差主要来自三个方面：其一是 LANDO 预测误差，即每个参数实例对应的动力学代理本身存在近似误差；其二是 POD 误差，即高维状态在低维模态空间中的截断损失；其三是深度神经网络逼近误差，即参数到状态映射学习的不完全性。研究人员指出，若在稀疏字典构造中采用更严格的 ALD 检验阈值，则可能进一步提高 LANDO 表征精度；同时，避免超出训练时间窗口进行外推也有助于改善预测表现。论文还强调，离线–在线结构虽然需要前期构建多个 LANDO 模型并生成训练数据，但其优势在于能够将复杂动力学学习与参数映射学习解耦，从而在多查询场景下获得更高在线效率。这一讨论清晰揭示了精度、存储、离线成本与在线预测速度之间的平衡关系。

在“结论”（Conclusion）部分，论文明确指出：本研究提出了 LANDO 算法的参数化扩展。为实现参数化预测，研究人员针对训练数据中的每个参数实例构建一组 LANDO 模型，并利用这些模型在目标时刻生成新数据。随后采用深度神经网络学习参数与状态之间的映射关系。对于高维动力系统，还可以结合降维技术进一步提升效率。综合三个数值算例的结果，研究证明了该方法在参数化动力系统代理建模中的有效性。

总体而言，该研究的重要意义在于为基于核表示的动力系统学习提供了一个可推广到参数空间的统一实现路径。其贡献并不在于单纯改进某一种 DMD 变体，而是在 LANDO 所具备的核近似、稀疏表示与线性/非线性分离优势基础上，进一步建立了适用于多参数、多查询场景的离线–在线预测框架，并通过深度学习补足了参数映射这一关键环节。对于需要频繁调用模型进行实时预测、设计优化或不确定性分析的计算科学问题，该方法具有明确的方法论价值与应用潜力。

联系信箱：

粤ICP备09063491号

热点排行