深度学习已经彻底改变了计算力学,为复杂的工程挑战(如应力场预测和拓扑优化)提供了有效的数据驱动解决方案[[1], [2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12], [13], [14]]。其中,物理信息神经网络(PINNs)通过将控制方程直接嵌入神经网络架构中(通过自动微分)成为一种显著的方法[[15]]。通过将物理定律编码为软约束,PINNs减少了对大量标记数据集的依赖,并确保解决方案符合基本原理。在测量数据稀疏或噪声较大的情况下,这一能力尤为有利[[16], [17], [18]]。尽管前景广阔,但传统的PINNs在模拟具有急剧梯度的物理场(如应力集中或热弹性不连续性)时面临重大困难,数值不稳定性和过早收敛到局部最小值会显著降低预测准确性[[19], [20], [21]]。
传统PINNs的主要限制在于其单阶段训练范式,该范式构建了一个统一的损失函数,将不同阶数的项(包括位移、应变和应力)耦合在一起。关于PINNs的许多理论研究集中在数学重构和优化保证上,但很少涉及训练动态。在梯度陡峭的区域,这种无差别的耦合加剧了低阶项(例如位移)和高阶项(例如应力)之间的不平衡,导致优化过程不稳定并阻碍收敛,正如第2.1节所展示的。之前尝试解决这些挑战的方法(如簇采样[[21]]、弱形式或离散形式[[22], [23], [24], [25], [26]]、混合形式[[27,28]]或域分解[[29], [30], [31], [32]])通常会增加计算复杂性或通用性有限。顺序训练策略[[28,33,34]]主要关注训练过程,但没有特别考虑不同阶数损失项的耦合问题。其他方法,包括后处理校正或替代模型[[35], [36], [37], [38], [39], [40]],会破坏严格的物理一致性所需的端到端可微框架。因此,一个关键挑战仍然是:如何在保持数值鲁棒性的同时,实现具有局部急剧梯度的物理场的稳定和高分辨率重建?
为了解决这一挑战,我们提出了一种多阶段优化策略,根据微分阶数分离损失成分并依次进行训练。核心创新是一种分层训练范式,在初始训练阶段强调低阶项(例如位移场),然后逐步引入高阶物理(例如应力平衡)。这种结构反映了物理系统的自然层次结构,使网络能够首先近似全局场趋势,然后再精细化由高阶导数控制的局部特征。在此背景下,该方法首先训练出一个具有改进泛化能力的预训练模型,随后利用完整的物理信息对其进行微调。
此外,我们整合了自适应归一化技术来平衡耦合变量的幅度,减少优化过程中的梯度冲突。通过改进训练流程而不是改变网络架构,该方法与现有的PINN框架兼容,同时显著提高了鲁棒性和收敛效率。实验结果表明,所提出的框架解决了传统PINNs中的不稳定性问题,并在重建局部场变化方面实现了高保真度。这一进展使得深度学习能够在关键工程应用中发挥作用,例如裂纹尖端分析或热冲击建模,这些应用中对急剧梯度的准确表征至关重要。