通过在统一的流形上协作融合特征来学习多物理系统

《Engineering Applications of Artificial Intelligence》:Learning multi-physical system on a unified manifold by collaboratively fused features

【字体: 时间:2026年02月20日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  多物理系统稀疏测量下的联合特征融合与重建框架研究。提出CoFFe框架,通过自监督预训练实现多物理场统一低维特征映射,结合自注意力编码器与DeepONet解码器,有效处理动态网格和非规则几何的稀疏数据,在燃料颗粒热降解、碱性水电解槽运行和生物质炉燃烧三个基准测试中验证其跨物理场特征融合能力,实现2%训练数据下的参数反演和传感器优化,为智能工业系统提供通用性解决方案。

  
林正旺|陈子拓|李耀军|邓瑞秋|张瑞志|罗永豪|卢璐|邓思丽
美国麻省理工学院机械工程系,马萨诸塞州剑桥市,02139

摘要

理解和控制多物理系统的时空动态对于自然和工业过程至关重要,然而部分和稀疏的测量数据往往阻碍了准确的特征描述。我们提出了协作融合特征(CoFFe)框架,这是一种自监督的预训练策略,它将不同的物理场统一到一个低维流形上。CoFFe灵活地结合了基于自注意力的场编码器模块和基于DeepONet的场解码器模块,形成了一个高效的多场稀疏重建工作流程的核心。通过采用迭代随机稀疏采样预训练策略,CoFFe能够无缝适应动态网格和不规则几何形状,并规避了全阶模型处理相关的计算负担。当针对只有部分物理场的稀疏传感器进行微调时,它可以可靠地提取系统级特征,从而实现所有物理场的快速准确重建。我们在三个复杂的多物理工程问题上验证了CoFFe的有效性,包括燃料颗粒的热降解、碱性水电解器的运行以及生物质格栅炉中的燃烧。我们的结果表明,无论是处理时间受限的信号、空间受限的传感器布局,还是不规则计算域中的随机分布的稀疏测量数据,预训练的CoFFe都能一致地实现稳定且快速的多场重建。此外,它整合不同物理场信息的能力即使在稀疏测量条件下也能提高重建精度。CoFFe的强大稀疏模式识别能力还支持多种下游任务,包括参数反演、传感器优化以及对之前未见变量的少样本学习。这些能力展示了其在推进智能工业系统和重塑多物理现象分析方面的变革潜力。

引言

准确捕捉多物理系统的完整状态仍然是许多科学和工程领域的核心挑战(Rivera等人,2021年;Zhang等人,2024b年;Haworth,2010年)。这些系统受参数化偏微分方程(PDEs)的控制,这些方程表现出不同物理场之间的不同程度的耦合(Chai等人,2024年)。系统的整体状态可能受到一系列参数的非线性影响,包括操作条件、设计配置和材料属性(Xiao等人,2017年;Chen等人,2022年;Cho等人,2024年)。实际上,我们对这些系统的访问通常仅限于来自部分物理量的稀疏测量数据(Li等人,2021年),而其他感兴趣的量可能难以或无法直接测量(Tomassetti等人,2020年)。从稀疏可观测量中重建不可测量物理量的全场分布可以显著改善制造和生产设施在变化条件下的结构设计、操作控制和故障诊断(Daneker等人,2024年;Deng等人,2025年;Fedorka1等人,2025年)。
科学机器学习(ML)的最新进展将重点从低维、单变量的早期问题转移到了高维、多物理场景(Wang等人,2023年;Hassan等人,2023年;McCabe等人,2023年;Rahman等人,2024年;Sun等人,2024b年;Wang等人,2025年)。一种常见的策略是使用专门的预训练方法来建立基础模型,然后对其进行微调或扩展以用于各种下游任务(Zhang,2024年)。例如,McCabe等人(2023年)提出了多物理预训练(MPP),使用轴向视觉变换器(AViT)作为基本框架进行基于步骤预测的自回归预训练。Rahman等人(2024年)提出了域注意力神经算子(CoDA-NO),其中图神经算子(GNO)和多头域注意力相结合,用于进行自监督的掩蔽和重建预训练。
尽管这些创新方法很有前景,但在输入模式和任务定义方面仍存在根本性差距。这些基础模型主要设计为用于自回归时间演化的神经算子,依赖于密集的结构化历史数据来预测未来状态。它们缺乏处理非结构化、稀疏传感器数据的固有能力,如果不引入引入近似误差的预插值步骤的话。一般来说,每个物理场都提供了对系统的独特但相互关联的视角,所有这些视角最终都表示相同的底层状态。不同物理量之间的相互推断具有重要的实际效益(Tao等人,2021年;Cheng等人,2023年),但在构建多物理系统的替代模型时,这种相互关联尚未得到足够的关注(Jiang等人,2023年)。在现有的有限研究中,来自不同物理场的数据通常要么被直接作为输入扁平化(Aversano等人,2021年;Blaud等人,2023年;Salvador和Marsden,2024年),要么被视为并行任务(Liu等人,2024年;Achermann等人,2024年;Pang等人,2024年)。此外,大多数方法在训练和推理阶段都需要在固定网格上直接处理全阶模型(FOM)数据,这导致了巨大的计算成本,并限制了传感器布置的灵活性。在使用基于ViT的架构(例如MPP)的其他情况下,需要初步的修补方法,这些方法严重依赖于结构化网格输入。这样的分词策略可能会限制多尺度特征的分辨率,破坏连续性,并且在方法上与随机稀疏传感器布局不兼容(Rahman等人,2024年;Zhang等人,2024a)。因此,专门为从多场稀疏数据集中进行空间重建而设计的算法仍然很大程度上未被探索。主要挑战在于如何从部分、非结构化的观测数据中有效提取嵌入在多个相互关联物理场中的固有特征。
近年来,复杂物理系统的稀疏重建引起了广泛关注,其应用范围扩展到了许多现实和实际情境(Yaman等人,2020年;Song等人,2024a)。端到端方法的著名例子包括基于CNN的Voronoi镶嵌辅助深度学习(Fukami等人,2021年)和基于注意力的Senseiver模型(Santos等人,2023年)。基于预训练的方法,如基于分数的生成模型S3GM(Li等人,2024年),也显示出了有希望的结果。同时,模型降维已成为管理场分布数据的另一种突出方法。这种范式通常涉及将高维数据投影到一个低维流形上,然后建立稀疏测量数据与潜在特征之间的相关性(Loiseau等人,2018年;Lee和Carlberg,2020年;Hemmasian和Farimani,2024年)。
所有这些快速出现的方法背后,稀疏重建的成功证明了流形假设的有效性,即高维环境数据存在于或接近一个低维流形上(Meil?和Zhang,2024年)。从技术上讲,可以根据一小部分FOM数据可靠地识别一个高维物理系统。相反,可以得出系统的紧凑特征表示来捕捉系统的整体动态(Lei等人,2020年;Floryan和Graham,2022年;Fukami和Taira,2023年)。与学习多物理系统(其中相互依赖的物理场动态交互)有有趣相似性的一个领域是计算机视觉中的多视图对比学习,它利用多个视角来提取低维特征(Tian等人,2020年;Hassani和Khasahmadi,2020年;Xu等人,2022年)。这些视角的观测结果被用来训练一个与观测条件无关的视角不变模型,从而实现更稳健的信息提取。
受此概念的启发,我们提出多物理系统中的不同场可以解释为对同一底层状态的多样化视角,因此可以共享一个统一的潜在特征,以用于各种基于ML的任务。此外,初步的特征提取过程和下游系统识别阶段都应该能够基于稀疏数据进行。因此,为了克服现有方法的局限性,包括训练效率低、数据结构要求严格以及特征交互不足,我们提出了协作融合特征(CoFFe)预训练框架,以便在统一的流形上学习多物理系统,以用于各种下游任务,如图1所示。
CoFFe将稀疏重建作为自监督学习任务,并强调了不同物理场之间的相互推断。它有效地解决了现有方法的局限性,包括训练效率低、数据结构限制以及特征交互不足的问题。与现有方法相比,CoFFe提供了以下关键贡献:
  • 多物理系统的统一流形学习:与标准DeepONet方法不同,后者独立学习算子或通过简单连接学习算子,CoFFe构建了一个统一的潜在流形,明确捕捉了场之间的相关性。这在极端稀疏情况下将重建误差降低了30%–50%,这一点在三个不同的物理基准测试中得到了验证。
  • 独立于网格的稀疏感知:我们引入了一个自注意力编码器,完全将模型与固定网格解耦。与需要在不规则网格上进行插值的基于CNN的方法相比,CoFFe可以直接处理任意传感器坐标。这使得传感器布置更加灵活,并允许模型处理时变几何形状,而无需重新训练或重新网格化。
  • 数据高效的迁移性:通过捕捉多物理系统的不变特征,该模型可以轻松适应涉及稀疏和部分观测的任务,如参数反演、传感器布置优化以及对之前未观测变量的少样本预测。实验表明,即使只有2%的可用训练数据,CoFFe也能实现收敛,而基线模型在这种情况下无法泛化,这证明了学习到的物理一致特征的稳健性。

章节片段

多场特征提取

图2(a)展示了CoFFe在统一流形上学习多物理系统的工作流程。基本模块包括一个基于自注意力的场编码器Ψ和一个基于DeepONet的场解码器Ψ?。编码器接受来自系统的稀疏采样点作为输入,以产生一个潜在特征,解码器可以利用该特征推断任何目标位置的所有物理量的值。
该框架分为两个不同的阶段:离线预训练和在线推理。

结果

我们建立了三个真实应用的数据集来证明CoFFe的有效性,如图4所示。颗粒降解案例(Deng等人,2021年)涉及多孔介质中的热和质量传递以及具有时变几何形状的固相反应(收缩核心模型),电解器案例(Lim等人,2024年)涉及气液多相流中的电化学反应,而生物质燃烧案例(Wang等人,2024年)主要研究反应流问题

CoFFe的有效性

对于多物理系统,我们假设可以识别出一个低维特征,从而准确重建所有涉及变量的时空分布。关键问题在于:(1)如何高效地识别复杂多物理数据背后的统一低维流形;(2)如何快速建立从部分和稀疏测量数据到统一系统特征的映射。
关于问题(1),我们

结论

在这项工作中,我们开发了CoFFe(协作融合特征)框架,通过将多种物理量统一到一个低维流形中来捕捉多物理系统的演变。通过利用自稀疏重建和预训练阶段的相互稀疏推断,CoFFe消除了在每个训练周期处理高维FOM数据的需要,并且不对输入维度、计算域形状或离散化方法施加任何限制。

CRediT作者贡献声明

林正旺:撰写——原始草稿、方法论、研究、概念化。陈子拓:可视化、方法论、研究。李耀军:可视化、方法论、研究。邓瑞秋:软件、数据管理。张瑞志:软件、数据管理。罗永豪:软件、数据管理。卢璐:撰写——审稿与编辑、方法论。邓思丽:撰写——审稿与编辑、监督。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

LW感谢上海交通大学生物质能源研究中心国际博士后奖学金计划的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号