双曲偏微分方程(PDEs)在模拟自然和工程系统的动力学中起着核心作用,这些系统中的波传播和传输现象占主导地位。这些方程控制着质量、动量和能量等守恒量的演化,是地球物理流体动力学、大气流动和海冰力学等广泛应用的基础(参见[1]、[2]、[3]、[4]、[5]、[6])。在许多情况下,即使控制方程的确切形式未知,仍然可以合理假设底层动力学受到双曲守恒律的支配。这一观察结果激发了开发数据驱动方法的动力,这些方法能够直接从观测行为中推断出系统的控制结构,从而基于过去的数据预测未来状态。
随着高分辨率观测数据和模拟数据的日益丰富,机器学习已成为从数据中建模动力系统的强大工具。最初的进展集中在从时间序列数据中学习常微分方程(ODEs)([7]、[8]、[9]),以及最近在[10]、[11]、[12]中的努力,将这些想法扩展到了由PDEs控制的时空系统。在PDE学习的背景下,许多现有方法受到经典线法框架的启发。这些方法使用神经网络来近似半离散系统中的时间导数,将其视为系统在先前时间步的状态的黑色盒函数;然后使用标准数值求解器进行时间积分(参见[13]、[14])。这些方法通常被归类为纯数据驱动,它们不包含显式的空间结构或物理约束。虽然它们可能在短期预测中取得成功,但在存在激波、不连续性或守恒量的情况下,往往难以泛化或在长时间范围内保持稳定。需要强调的是,上述方法都没有明确设计来应对双曲守恒律所提出的独特挑战,例如激波形成。此外,这些方法在这些情况下尚未经过严格测试。
为了提高数据驱动PDE模型的准确性,一些方法试图将空间结构直接嵌入到学习过程中。这通常是通过将梯度、散度或拉普拉斯算子等空间算子纳入网络架构来实现的(例如[15]、[16])。这些具有空间信息的模型提供了更好的稳定性和对局部相互作用及几何结构的表示。然而,尽管有这些进步,这样的模型通常不强制执行基本的物理定律,如守恒或熵耗散,而这些对于许多物理系统中解的准确性和可靠性至关重要。缺乏这些约束可能导致非物理伪影和在长期积分过程中的性能下降。
为了进一步弥合这一差距,最近出现了一些方法,它们将经典数值方案中的守恒律原理直接整合到神经网络架构中。这些方法专门设计用于以物理上一致的方式捕捉双曲系统的长期动力学;参见[17]、[18]、[19]、[20]、[21]。例如,在[19]中引入的基于Godunov-Riemann的神经网络使用基于数值分析的浅层神经网络来学习物理通量函数,明确设计用于保持守恒律并通过嵌入的Riemann求解器结构捕捉关键波相互作用。相比之下,受总变分减少方法启发的[20]框架将神经网络闭合集成到离散方程中,以抑制虚假振荡并通过解决PDE约束的优化问题来恢复双曲现象。
另一个著名的例子是[17]中引入的保守通量形式神经网络(CFN),它通过训练神经网络来近似数值通量函数,从而模仿有限体积方案的结构。这使得可以从轨迹数据中纯还原未知的双曲守恒律。类似地,RoeNet([21])建立在经典的Roe方案之上,该方案近似Riemann问题的解([22]),将可模板化的Roe模块作为数据驱动的计算原语来预测双曲系统的演化。CFN和RoeNet都经过训练,使用在初始时间间隔内观测到的轨迹数据来外推系统状态。然而,这两种方法都没有正式设计来促进熵稳定性,这对于准确建模双曲守恒律至关重要。虽然[21]声称没有违反熵,但没有提供正式的分析或实证验证。为了解决这一限制,[18]提出了熵稳定CFN(ESCFN),它以斜率限制数值的形式将熵稳定性明确编码到神经网络架构中。具体来说,他们的方法采用了二阶精确的非振荡Kurganov–Tadmor(KT)方案([23]),并训练神经网络在该框架内近似数值通量项,从而确保学习模型的熵稳定性。
虽然[18]中提出的ESCFN框架在预测双曲守恒律的动力学方面既简单又具有实证效果,但其设计依赖于预先指定的数值方案(例如KT离散化)作为基础。这种依赖性也隐含地假设了一类特定的对应熵对(在第2节中详细讨论),从而限制了该方法在控制方程完全未知或难以用经典方法近似的情景中的灵活性。为了克服这一限制,在这项研究中,我们从[24]中开发的熵稳定性数值通量设计原则中获得灵感,并提出了一种新的数据驱动框架,无需任何预定义的数值方案。在整个工作中,我们采用了这样的建模假设:未知的双曲系统允许存在凸熵函数,正如许多物理模型(如欧拉方程、弹性动力学、磁流体力学和交通流)的情况一样。这一假设提供了一个结构上的归纳偏见,将学习到的PDE限制在一个物理上有意义的类别中。此外,如果观测数据与任何凸熵表示不一致,例如系统无法对称化或优化未能产生稳定的通量-熵对,就会立即给出诊断反馈,表明假设的模型类别不合适。通过这种方式,凸熵框架既作为学习的约束,也作为模型验证的工具。在这种设置中,我们的方法直接从解的轨迹中同时学习底层的双曲守恒律和相应的熵函数。这使得能够纯粹从数据中识别出物理上有意义且动态上一致的模型。由此产生的框架保留了基本的结构属性,如守恒和熵耗散,同时在广泛的系统类别中提供了更高的通用性和适应性。
我们强调了关于熵稳定性概念的一个重要区别。虽然NESCFN旨在通过学习近似满足熵稳定性方案结构条件的通量-熵对来促进熵一致性,但该方法目前尚未提供熵稳定性的正式证明。特别是,我们使用的基于中心通量的熵保守替代方法(见(3.4)并不能保证满足Tadmor混合条件(见[25]中的方程(4.5b)对于一般学习的通量),并且结构约束仅在数值容忍度范围内得到执行。因此,我们结果中观察到的熵稳定性应被视为经验性的而非理论性的。建立严格的保证是未来研究的一个重要方向。
本文的其余部分组织如下。第2节回顾了与双曲守恒律系统相关的关键理论和数值基础。第3节介绍了从解的轨迹中直接学习双曲守恒律的神经熵稳定保守通量形式神经网络(NESCFN)。第4节描述了实验设置和评估指标。第5节,我们展示了一系列数值示例,证明了所提出的NESCFN框架的有效性和鲁棒性。最后,我们在第6节总结了研究并简要讨论了未来研究的方向。