一种基于场映射的新型物理信息神经网络

【字体: 时间:2026年03月03日 来源:International Journal of Mechanical Sciences 9.4

编辑推荐:

  物理场神经网络(PFNN)通过时空场输入与物理场输出结合,采用超宽输出层和数值差分策略提升高频、多尺度及多物理耦合问题的求解精度与效率。相较于传统PINN方法,PFNN在Helmholtz方程、热传导方程、弹性平衡方程及热电耦合方程中均表现更优,尤其在噪声干扰和应力集中场景下验证了鲁棒性。

  
孙博勋|刘晨旭|于桂兰|李江|刘展利
北京交通大学土木工程学院,中国北京100044

引言

描述力学行为的偏微分方程(PDEs)对于描述和再现物理场至关重要[[1], [2], [3]]。由于初始条件或边界条件的复杂性,直接获得PDEs的解析解非常困难[4]。尽管数值方法已被广泛用于近似求解PDEs,例如有限元方法(FEM)[5,6]和边界元方法(BEM)[7,8],但它们无法应对噪声边界问题和逆问题[9]。为了全面分析和塑造物理场,开发新的智能方法来求解PDEs是必要的。
机器学习是一种强大的人工智能(AI)算法,有望作为基于先验知识和观测数据求解PDEs的新方向[[9], [10], [11]]。物理信息神经网络(PINN)代表了这一新兴理念,通过将微分运算与物理信息和收集的数据相结合来学习PDEs[9,[12], [13], [14]]。利用捕获的物理场控制规律,PINN可以可靠地解决各种领域中的正向和逆向问题,如力学[[15], [16], [17], [18], [19], [20], [21], [22], [23], [24], [25], [26]]、系统生物学[[27], [28], [29]]和材料科学[[30], [31], [32], [33]]。
尽管取得了显著成就,但在处理某些挑战时,PINN仍然存在精度低和成本高的问题,例如高频、多尺度、应力集中、多物理场耦合和噪声干扰问题[9,[34], [35], [36], [37], [38], [39], [40], [41], [42], [43], [44]]。传统的PINN需要优化PDE残差来学习物理场,这导致在使用大量配置点拟合变化剧烈的函数时需要大量的反向传播梯度和高阶微分运算[45,46]。大量的梯度和微分运算不仅会导致计算成本急剧增加,还可能导致在求解具有高频或多尺度行为的复杂PDEs时收敛不稳定[36,38]。为了优化采样数量并提高模式收敛性,开发了一些自适应配置点[47]和加权方法[36,[48], [49], [50], [51]]。考虑到基于残差的PINN公式的局限性,基于变分原理的深度能量方法(DEM)[1,52,53]作为一种解决方案出现,它允许使用更少的梯度和更低阶的微分运算。为了追求更强的逼近能力,提出了混合DEM[54]和其他DEM扩展[[55], [56], [57]],这些方法使得变化剧烈的物理场更容易拟合。
合理的架构也可以增强PINN逼近复杂函数的能力。一些学者专注于专门的网络设计来捕捉场中的强烈变化,包括但不限于具有傅里叶特征的PINN(FF-PINN)[[58], [59], [60], [61], [62]]、物理信息径向基网络(PIRBN)[[63], [64], [65]]、基于卷积神经网络的PINN[[66], [67], [68]]、有限基PINN(FBPINN)[69,70]和Kolmogorov-Arnold信息神经网络(KINN)[[71], [72], [73], [74]]。虽然这些算法在高频、多尺度或应力集中问题上取得了有希望的结果[63,66,68,70,71],但一些专门的结构涉及复杂的运算过程,限制了它们的效率。传统离散化方法的智慧为PINN的构建提供了新的见解,从而产生了几种适用于变化剧烈函数的有希望的模型[10,46,68,[75], [76], [77], [78], [79]],例如物理编码有限元网络(PEFEN)[75,79]和基于Galerkin离散化的可微分有限元方法(DFEM)[76]。在寻求更强大算法的过程中,考虑了参数化PDE的算子学习[[80], [81], [82], [83]],例如深度算子网络(DeepONet)[80]和傅里叶神经算子(FNO)[81],并将其与PINN结合使用,包括基于残差和基于能量的版本[2,3,84,85]。结合算子学习和离散化方法,基于能量的模型[3]可以实现更好的稳定性和学习能力,解决正向发散和逆向崩溃的训练失败模式。尽管物理驱动的机器学习已经得到了改进,但模拟耦合多物理场系统的有效方法仍然不足[9,[86], [87], [88], [89]]。此外,实际噪声干扰了PINN使用观测数据来解决正向和逆问题[68,78,90,91]。为了促进AI在PDEs中的应用,需要构建一种新的先验网络,以满足精度、效率、鲁棒性和通用性的要求,以便有效处理高频、多尺度、应力集中、多物理场耦合和噪声干扰任务。
在这项研究中,我们提出了一种基于时空场输入和物理场输出的物理场神经网络(PFNN),在求解PDE相关问题时实现了效率和精度的数量级提升。改进的输入层从所有时空坐标中获取物理信息进行函数映射,增强的输出层采用了超宽架构,使得捕捉复杂模式变得更加容易。具有超宽架构的PFNN与使用宽网格的离散化增强型PINN[3,68,75,79]有相似之处,其中通过特定神经元表征每个物理量可以被视为从全局域到许多具有相对简单模式的离散子域或元素的学习的自然转变。这有助于更轻松、更详细地学习每个点的变化。应用数值差分策略来获得高阶物理场,考虑到网络中链式规则微分产生的密集雅可比矩阵与PDE微分项的理论独立性之间的不一致性。集成了一个坐标转换模块,将物理场迁移到不同的计算域上,使基于数值微分的PFNN能够在不规则物理域上逼近PDEs。研究了PFNN在高频、多尺度、应力集中、多物理场耦合和噪声干扰挑战下的性能,其中解决了亥姆霍兹方程、热传导方程、弹性平衡方程和热电耦合方程。PFNN不仅有效地解决了亥姆霍兹方程和热传导方程中的高频和多尺度挑战,还可靠地解决了弹性平衡方程和热电耦合方程中变化剧烈的应力、电场和温度场。此外,PFNN在噪声条件下对热电耦合方程的参数识别表现出很强的抗干扰能力。与PINN、FF-PINN、DEM和KINN相比,PFNN在精度、效率和鲁棒性方面表现出色,为科学机器学习提供了宝贵的参考。
本文的其余部分组织如下:第2节描述了PFNN,第3节提供了结果和讨论,第4节总结了结论。

节选内容

物理场神经网络

在本节中,简要回顾了PINN架构,并研究了其在精度和效率方面的局限性。为了解决这些局限性,建立了一个新的PINN框架,即PFNN。

结果与讨论

在本节中,我们通过四个代表性示例比较了PFNN与其他模型的性能,包括亥姆霍兹方程、热传导方程、弹性平衡方程和热电耦合方程。所有模型都在配备AMD Ryzen 9 5950×16核处理器的计算平台上运行,相应的结果可以通过代码在https://github.com/BoXun-Sun/Physical-field-neural-network-PFNN.git处重现。

结论

在这项研究中,提出了一种基于时空场输入和物理场输出的新的PDEs AI,即PFNN。改进的输入层从所有时空坐标中获取物理信息进行函数映射,增强的输出层采用了超宽架构,有助于捕捉复杂模式。超宽架构使PFNN类似于使用宽网格的离散化增强型PINN。神经元与

CRediT作者贡献声明

孙博勋:写作 - 审稿与编辑、撰写 - 原始草稿、可视化、验证、方法论、研究、形式分析、概念化。刘晨旭:写作 - 审稿与编辑、撰写 - 原始草稿、可视化、验证、方法论、研究、监督、资源获取、概念化。于桂兰:写作 - 审稿与编辑、监督、资源获取、概念化。李江:写作 - 审稿与编辑、研究,

数据可用性

数据将根据请求提供。

CRediT作者贡献声明

孙博勋:写作 – 审稿与编辑、撰写 – 原始草稿、可视化、验证、方法论、研究、形式分析、概念化。刘晨旭:写作 – 审稿与编辑、撰写 – 原始草稿、可视化、验证、监督、资源获取、方法论、研究、概念化。于桂兰:写作 – 审稿与编辑、监督、资源获取、概念化。李江:写作 – 审稿与编辑、验证,
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号