一种结合物理原理和数据驱动的混合模型,用于利用遥感图像估算海洋内波的相速度

《Remote Sensing of Environment》:A hybrid physics-informed and data-driven model for estimating ocean internal wave phase speeds from remote sensing imagery

【字体: 时间:2026年02月01日 来源:Remote Sensing of Environment 11.4

编辑推荐:

  内部波相位速度研究提出融合物理约束与迁移学习的自适应集成模型,通过KdV、BO和eKdV方程构建物理约束层,结合深度学习与统计回归的自适应框架,并采用迁移学习解决理论预测与实测数据差异。模型在南海验证中相位速度呈现先增后减再增的波动特征,测试集RMSE达0.04m/s,R2达98.8%,全球验证平均误差4.95%。

  
崔光希|蔡中雅|刘志强
中国澳门大学海洋科学与技术系,智慧城市物联网国家重点实验室

摘要

内波的传播速度是理解其物理机制、动态行为和环境影响的基本参数。然而,传统的估算方法通常基于数值模拟或稀疏的现场观测数据,这限制了它们的准确性和可扩展性,并导致可用的相位速度数据集严重不足。为了克服这些挑战,我们提出了一种基于物理知识和数据驱动的模型,用于从卫星图像中估算内波的相位速度。该模型包含三个关键创新:(1)将理论方程(KdV、BO和eKdV方程)作为物理约束条件,以确保与真实海洋动力学的吻合;(2)采用自适应集成学习框架,融合数据驱动和物理知识特征,以提高模型的鲁棒性和预测准确性;(3)引入迁移学习策略,以减少理论预测与实际观测结果之间的差异。实验结果表明,该模型在不同水深条件下均表现出优异的性能,测试集上的平均RMSE为0.04米/秒,MRE为2.5%,R2为98.8%。此外,该模型应用于南海,揭示了内波的传播模式:内波在向西穿过东沙群岛和海南岛的过程中,平均相位速度先增加(从2.427米/秒增加到2.53米/秒),然后减小(降至1.464米/秒),随后再次增加(达到1.703米/秒)。该模型还在全球范围内进行了验证,平均百分比误差为4.95%,证实了其可扩展性和泛化能力。本研究提出了一种高效且自动化的方法,用于准确获取内波的相位速度。

引言

内波是一种在稳定分层的水柱中传播的重力波(Alpers,1985)。当外部力量(如地震、潮汐作用或大气压力变化)扰动水体时,会在密度分层界面产生振荡,从而形成内波(Apel,2002;Rogers等人,2025)。具有显著振幅和强水流的内波在大陆架边缘、岛屿附近陡峭的水下斜坡以及海峡中的岩石床附近广泛观测到(Olbers,1983;Whalen等人,2020)。它们的传播范围可达数百公里,伴随强烈的剪切流,对海洋物质输送、生态环境和海洋工程产生深远影响(Alpers和Huang,2010)。现有研究表明,内波可以在相对较短的时间内显著改变海洋流场结构和热分布(Huang等人,2016)。此外,内波的相位速度作为其物理特性之一,是理解其传播机制的关键因素(Alford等人,2015)。因此,准确估算内波的相位速度对于监测、预警及相关应用至关重要。
研究内波的传统方法通常依赖于理论模型、现场观测和数值模拟。理论模型为理解内波动力学提供了基础,并可反演波长、振幅和相位速度等关键参数(Alpers和Vlasenko,2019;Chen等人,2023;Cui等人,2021;da Silva等人,2025;Rong等人,2023;Wang等人,2025;Zeng等人,2024)。现场观测提供了最直接和准确的内波参数测量数据(Barkan等人,2021;Baumann等人,2023;Huang等人,2016;Johnson等人,2022)。然而,由于测量范围有限和成本高昂,这些方法的广泛应用受到限制(Chen,2011;Huang等人,2016;Zeng等人,2024)。数值模拟通过结合多种物理过程,提供了内波动力学的详细表征(Fu等人,2021;Tang等人,2025;Zeng等人,2024;Zhi等人,2025)。尽管这些模拟遵循理论方程,但由于初始/边界条件的变化和复杂的水深地形,计算成本较高且灵活性不足(Wang和Li,2024;Zhang等人,2025)。
近年来,卫星遥感数据的快速扩展为人工智能(AI)技术在内波研究中的应用奠定了坚实的基础,特别是在特征检测和参数反演方面(Alpers和Vlasenko,2019;Li等人,2020;Liang等人,2022;Meng等人,2022;Tian等人,2023;Zhen等人,2024)。虽然卫星遥感和AI是传统方法的有希望的替代方案,但当前的AI模型由于物理基础有限和数据集稀疏且异构,仍面临挑战(Meng等人,2024;Wang和Jiang,2024)。
在特征检测方面,许多研究探索了基于AI的方法来识别遥感图像中的内波。这些方法通常分为两类:语义分割和目标检测。语义分割方法通常基于U-Net框架(Barintag等人,2023;Cui等人,2025;Ma等人,2022;Vasavi等人,2021;Wan等人,2025;Zheng等人,2022a,Zheng等人,2022b),直接从图像中提取内波条纹图案。目标检测方法,如YOLO系列(Cai等人,2024b;Huo等人,2025;Zi等人,2024)和Faster R-CNN(Cai等人,2024a;Wang等人,2019),能够自动定位内波区域。尽管现有的内波检测模型在遥感图像上表现良好,但它们依赖于特定区域的训练数据集,这限制了它们在未观测或多样化的海洋区域的适用性(Meng等人,2024)。
相比之下,基于AI的内波参数反演(包括波幅和相位速度)仍处于早期阶段。当前的研究主要依赖于纯数据驱动的方法来估算内波的传播相位速度和振幅(Liang等人,2022;Zhang和Li,2021,Zhang和Li,2022;Zhang等人,2021,Zhang等人,2022)。这些研究存在一些固有的局限性,包括构建具有代表性和高质量数据集的挑战、物理约束的不足以及对于不同海洋条件的泛化能力有限。目前,内波相位速度的数据主要通过传统方法收集,如波浪水槽实验(Liang等人,2022)、多时相图像(MTI)方法和潮汐周期图像(TPI)方法(Furtney等人,2024;Li等人,2024;Meng等人,2024;Zhang和Li,2021,Zhang和Li,2022)。值得注意的是,这些方法产生的数据集质量参差不齐,直接影响模型性能。虽然波浪水槽和MTI方法具有高精度,但存在可扩展性或配准问题(Zhang和Li,2021),而TPI方法虽然更具可扩展性,但由于对长期传播过程中的地形和水动力变化的敏感性而精度较低(Hong等人,2015;Liu等人,2014;Zhang等人,2025)。除了数据限制外,基于AI的模型还面临泛化能力和物理知识嵌入不足的问题。虽然纯数据驱动的预测模型(Liang等人,2022;Zhang和Li,2021;Zhang等人,2022)通常效率较高且精度高,但大多数现有模型是在特定区域的数据集上训练的(Zhang和Li,2021),导致在应用于其他海洋区域时泛化能力较差。此外,它们缺乏物理约束,可能导致预测结果与实际海洋动力学不一致,尤其是在复杂或数据稀疏的情况下(Zhang等人,2025)。
近年来,混合模型(如基于物理知识的神经网络(PINNs)及其衍生物(Chen等人,2025;Wei等人,2025;Xu等人,2024)在各个科学领域受到了越来越多的关注。例如,Wang和Li(2024)将物理模型的输出作为先验知识,指导模型更有效地学习物理规律。为了将物理知识整合到基于AI的内波参数反演模型中,Li等人(2025a)利用了在不同条件下Korteweg-de Vries(KdV)方程(Korteweg和Vries,1895)的数值解,并将KdV方程作为偏微分方程约束条件纳入PINN框架中,以模拟内波相位速度。然而,这种方法仅在数值模拟数据上得到了验证,尚未应用于真实海洋环境。最近,Zhang等人(2025)将PINN与迁移学习相结合,利用MTI方法收集的数据集预测了班达海的内波相位速度。他们的结果展示了整合物理约束和迁移策略的潜力,为在基于AI的模型中融入物理原理提供了重要和有价值的参考。然而,这种方法是为特定区域开发的,其泛化能力仍需验证。
为了解决现有方法在泛化能力方面的局限性以及数据集构建相关的挑战,我们提出了一种混合自适应集成方法,将基于物理知识的建模与数据驱动的学习相结合,用于预测内波的相位速度。训练数据集使用成熟的内波理论模型构建,如KdV、Benjamin-Ono(BO)(Benjamin,1967)和扩展的Korteweg-de Vries(eKdV)(Zhang等人,2011)方程,并引入了基于物理知识的损失函数。为了弥合理论与实际观测之间的差距,我们明确采用了迁移学习策略。这一过程使模型能够将其学习到的表示适应真实的海洋条件,从而支持区域定制和全球可扩展性。本文的其余部分安排如下:第2节介绍数据集,第3节详细说明实验方法,第4节展示结果,第5节讨论,第6节提供结论。

章节片段

内波的卫星图像

海洋内波会在海面上引起辐散和汇聚,表现为卫星图像中的明暗相间的条纹(Jackson,2007),如图1(a)所示。这些表面粗糙度的变化是由于内波引起的水流在海面上传播时产生的汇聚(粗糙)和辐散(平滑)区域(Alpers,1985;Cheng等人,2024;Jackson,2007)。值得注意的是,表面流速模式通常与底层

方法论

统计回归模型(如支持向量回归(SVR)、随机森林回归(RFR)等)旨在构建输入和输出之间的最佳映射,重点是从数据中提取明确的、低维的经验特征(üstün等人,2007)。相比之下,神经网络(NN)通过多层结构自动提取深层非线性特征,提供更强的特征学习和表示能力。此外,NN还可以整合物理

模型性能

为了评估EIWS模型的特征融合和增强模块以及迁移学习模块的性能,我们进行了消融实验和交叉验证测试。此外,我们还分析了模型性能随水深的变化情况。另外,使用了一对来自南海的匹配遥感内波图像来进一步验证模型的有效性。

EIWS模型与典型机器学习模型的性能对比

基于eKdV物理约束数据集构建的EIWS模型首先与传统的数据驱动机器学习方法进行了比较,用于预测内波相位速度。这些传统方法(如SVM、RFR、GBR、KNNR和XGBoost)易于实现,并能捕捉大型数据集中的统计模式。然而,它们缺乏明确的物理约束,这往往导致可解释性有限和过拟合,特别是在数据稀疏的区域或环境中

结论

内波相位速度是内波研究中的基本参数,但由于观测数据集的有限性,对其研究特别具有挑战性。为了解决这个问题,本研究提出了一个强大的机器学习框架,称为EIWS(Ensemble Internal Wave Speed模型)。EIWS模型将来自NN的深度特征驱动预测与自适应的统计稳健回归方法结合到一个统一的自适应框架中

CRediT作者贡献声明

崔光希:撰写——原始草稿,可视化,验证,方法论,数据分析,概念化。蔡中雅:撰写——审稿与编辑,监督,软件,资源,项目管理,方法论,调查,数据分析,概念化。刘志强:撰写——审稿与编辑,撰写——原始草稿,监督,资源,项目管理,调查,概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

本工作得到了国家自然科学基金(编号42450181)和澳门特别行政区科学技术发展基金(文件/项目编号0093/2020/A2,001/2024/SKL)的支持;本工作得到了澳门大学区域海洋中心(SP2025-00005-CRO)的支持;本工作还得到了CORE的支持,这是崂山实验室与香港科技大学之间的联合海洋研究机构,并得到了香港研究资助委员会的资助
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号