内波是一种在稳定分层的水柱中传播的重力波(Alpers,1985)。当外部力量(如地震、潮汐作用或大气压力变化)扰动水体时,会在密度分层界面产生振荡,从而形成内波(Apel,2002;Rogers等人,2025)。具有显著振幅和强水流的内波在大陆架边缘、岛屿附近陡峭的水下斜坡以及海峡中的岩石床附近广泛观测到(Olbers,1983;Whalen等人,2020)。它们的传播范围可达数百公里,伴随强烈的剪切流,对海洋物质输送、生态环境和海洋工程产生深远影响(Alpers和Huang,2010)。现有研究表明,内波可以在相对较短的时间内显著改变海洋流场结构和热分布(Huang等人,2016)。此外,内波的相位速度作为其物理特性之一,是理解其传播机制的关键因素(Alford等人,2015)。因此,准确估算内波的相位速度对于监测、预警及相关应用至关重要。
研究内波的传统方法通常依赖于理论模型、现场观测和数值模拟。理论模型为理解内波动力学提供了基础,并可反演波长、振幅和相位速度等关键参数(Alpers和Vlasenko,2019;Chen等人,2023;Cui等人,2021;da Silva等人,2025;Rong等人,2023;Wang等人,2025;Zeng等人,2024)。现场观测提供了最直接和准确的内波参数测量数据(Barkan等人,2021;Baumann等人,2023;Huang等人,2016;Johnson等人,2022)。然而,由于测量范围有限和成本高昂,这些方法的广泛应用受到限制(Chen,2011;Huang等人,2016;Zeng等人,2024)。数值模拟通过结合多种物理过程,提供了内波动力学的详细表征(Fu等人,2021;Tang等人,2025;Zeng等人,2024;Zhi等人,2025)。尽管这些模拟遵循理论方程,但由于初始/边界条件的变化和复杂的水深地形,计算成本较高且灵活性不足(Wang和Li,2024;Zhang等人,2025)。
近年来,卫星遥感数据的快速扩展为人工智能(AI)技术在内波研究中的应用奠定了坚实的基础,特别是在特征检测和参数反演方面(Alpers和Vlasenko,2019;Li等人,2020;Liang等人,2022;Meng等人,2022;Tian等人,2023;Zhen等人,2024)。虽然卫星遥感和AI是传统方法的有希望的替代方案,但当前的AI模型由于物理基础有限和数据集稀疏且异构,仍面临挑战(Meng等人,2024;Wang和Jiang,2024)。
在特征检测方面,许多研究探索了基于AI的方法来识别遥感图像中的内波。这些方法通常分为两类:语义分割和目标检测。语义分割方法通常基于U-Net框架(Barintag等人,2023;Cui等人,2025;Ma等人,2022;Vasavi等人,2021;Wan等人,2025;Zheng等人,2022a,Zheng等人,2022b),直接从图像中提取内波条纹图案。目标检测方法,如YOLO系列(Cai等人,2024b;Huo等人,2025;Zi等人,2024)和Faster R-CNN(Cai等人,2024a;Wang等人,2019),能够自动定位内波区域。尽管现有的内波检测模型在遥感图像上表现良好,但它们依赖于特定区域的训练数据集,这限制了它们在未观测或多样化的海洋区域的适用性(Meng等人,2024)。
相比之下,基于AI的内波参数反演(包括波幅和相位速度)仍处于早期阶段。当前的研究主要依赖于纯数据驱动的方法来估算内波的传播相位速度和振幅(Liang等人,2022;Zhang和Li,2021,Zhang和Li,2022;Zhang等人,2021,Zhang等人,2022)。这些研究存在一些固有的局限性,包括构建具有代表性和高质量数据集的挑战、物理约束的不足以及对于不同海洋条件的泛化能力有限。目前,内波相位速度的数据主要通过传统方法收集,如波浪水槽实验(Liang等人,2022)、多时相图像(MTI)方法和潮汐周期图像(TPI)方法(Furtney等人,2024;Li等人,2024;Meng等人,2024;Zhang和Li,2021,Zhang和Li,2022)。值得注意的是,这些方法产生的数据集质量参差不齐,直接影响模型性能。虽然波浪水槽和MTI方法具有高精度,但存在可扩展性或配准问题(Zhang和Li,2021),而TPI方法虽然更具可扩展性,但由于对长期传播过程中的地形和水动力变化的敏感性而精度较低(Hong等人,2015;Liu等人,2014;Zhang等人,2025)。除了数据限制外,基于AI的模型还面临泛化能力和物理知识嵌入不足的问题。虽然纯数据驱动的预测模型(Liang等人,2022;Zhang和Li,2021;Zhang等人,2022)通常效率较高且精度高,但大多数现有模型是在特定区域的数据集上训练的(Zhang和Li,2021),导致在应用于其他海洋区域时泛化能力较差。此外,它们缺乏物理约束,可能导致预测结果与实际海洋动力学不一致,尤其是在复杂或数据稀疏的情况下(Zhang等人,2025)。
近年来,混合模型(如基于物理知识的神经网络(PINNs)及其衍生物(Chen等人,2025;Wei等人,2025;Xu等人,2024)在各个科学领域受到了越来越多的关注。例如,Wang和Li(2024)将物理模型的输出作为先验知识,指导模型更有效地学习物理规律。为了将物理知识整合到基于AI的内波参数反演模型中,Li等人(2025a)利用了在不同条件下Korteweg-de Vries(KdV)方程(Korteweg和Vries,1895)的数值解,并将KdV方程作为偏微分方程约束条件纳入PINN框架中,以模拟内波相位速度。然而,这种方法仅在数值模拟数据上得到了验证,尚未应用于真实海洋环境。最近,Zhang等人(2025)将PINN与迁移学习相结合,利用MTI方法收集的数据集预测了班达海的内波相位速度。他们的结果展示了整合物理约束和迁移策略的潜力,为在基于AI的模型中融入物理原理提供了重要和有价值的参考。然而,这种方法是为特定区域开发的,其泛化能力仍需验证。
为了解决现有方法在泛化能力方面的局限性以及数据集构建相关的挑战,我们提出了一种混合自适应集成方法,将基于物理知识的建模与数据驱动的学习相结合,用于预测内波的相位速度。训练数据集使用成熟的内波理论模型构建,如KdV、Benjamin-Ono(BO)(Benjamin,1967)和扩展的Korteweg-de Vries(eKdV)(Zhang等人,2011)方程,并引入了基于物理知识的损失函数。为了弥合理论与实际观测之间的差距,我们明确采用了迁移学习策略。这一过程使模型能够将其学习到的表示适应真实的海洋条件,从而支持区域定制和全球可扩展性。本文的其余部分安排如下:第2节介绍数据集,第3节详细说明实验方法,第4节展示结果,第5节讨论,第6节提供结论。