《Ocean Engineering》:Physics and data dual-driven deep learning model for tide level forecasting
编辑推荐:
潮位预测与物理约束深度学习融合研究提出Phy-BiGRU模型,通过双向门控GRU捕捉时序特征,集成非stationary谐波分析物理约束,并利用贝叶斯优化动态平衡物理损失与数据损失权重,在美日12站多潮型数据验证中实现1-24小时高精度预测,较传统方法误差降低30%-45%,兼具物理一致性与泛化能力。
Jiange Jiao|Zhengben Gao|Senjun Huang|Zhilin Sun|Junbao Huang|Xiao Zheng|Maofa Wang
中国吉利大学机电工程学院,杭州,310018,中国
摘要
高精度的潮位预测对于预防沿海灾害和确保海洋工程项目的安全性至关重要。当前的研究表明,利用观测数据的高级学习模型在潮位预测方面能够达到高精度,但其结果缺乏物理一致性。为了解决这一问题,提出了一种名为Phy-BiGRU的高精度1-24小时预测模型,该模型结合了基于物理的约束和双向门控循环单元。该模型将非平稳谐波分析作为物理约束纳入其中。贝叶斯优化平衡了物理驱动和数据驱动的损失权重,以提高模型的性能。实验在美国的9个潮汐测量站进行,这些站点具有不同的潮汐类型。此外,日本的3个潮汐测量站也展示了该模型的跨区域适应性。通过将神经网络的卓越非线性表示能力与物理约束相结合,所提出的模型在保持潮位预测任务高性能的同时,能够刻画物理机制。与非平稳谐波分析、美国国家海洋和大气管理局(NOAA)模型以及其他经典深度学习模型相比,该模型表现更为优越。这项研究为沿海地区的早期灾害预警以及海洋资源的开发和利用提供了科学基础和技术支持。
引言
潮位是指在潮汐周期内,海面相对于指定基准面的垂直高度,是海洋水文观测中的一个关键参数。准确的潮位预测对于预防和减轻海洋灾害、安排海上航行以及开发海洋资源具有重要意义。例如,风暴潮会在沿海地区引发极端高的水位,可能导致海堤溃决、港口和桥梁基础设施受损以及巨大的经济损失。同样,海上风电场的建设需要实时潮位监测,以优化运营调度和船舶部署。因此,高精度的潮位预测对于保护沿海安全、支持高效的港口和航运运营以及实现海洋资源的开发和能源利用至关重要。
传统的潮位预测主要采用谐波分析和数值建模方法。谐波分析基于经典的平衡潮汐理论,通过傅里叶级数分解潮汐信号以识别主要成分。其核心方法是从历史数据中确定成分的振幅和相位,从而合成未来的潮位(Pan等人,2018年)。与非平稳谐波分析相比,非平稳谐波分析假设潮汐成分的振幅和相位随时间变化,并直接将非平稳外部强迫纳入谐波分析的基函数中。数值建模则通过求解控制水动力方程来计算水运动,其中包含了天文强迫和地球自转等物理机制(Yang等人,2019年)。然而,这两种方法在潮汐预测应用中都面临计算密集型的挑战。
随着人工智能技术的快速发展(Wan等人,2025年),基于深度学习的潮位预测逐渐成为海洋预测领域的一个研究热点,显示出显著的应用潜力(Igarashi和Tajima,2021年)。近年来,从经典机器学习算法(Wang等人,2021a)到先进的深度学习架构(Leng等人,2024年),AI模型在提高预测精度、扩展预测范围和捕捉特征方面展现了显著优势(Wang等人,2023年,2024年)。早期研究主要关注使用传统机器学习算法和基本的人工神经网络(ANN)来预测单个站点的 hydrological 变量。Kim等人(2019年)提出了一种系统化的ANN构建方法,在日本Sakaiminato开发了具有不同提前时间的风暴潮预测模型,通过优化隐藏层神经元和输入参数的组合来实现。然而,传统ANN在捕捉长序列数据中的时间依赖性方面仍存在局限性。因此,循环神经网络(RNN)的变体,如长短期记忆(LSTM)和门控循环单元(GRU),已成为潮汐预测的常用方法(Li等人,2025年),其中LSTM通过门控机制解决了标准RNN的长期记忆限制(Yang等人,2020年)。Dharmawan等人(2024年)评估了三种RNN变体(vanilla RNN、LSTM和GRU),结果表明GRU具有更高的预测精度。此外,Yang等人(2023年)进行了涉及Transformer模型的比较分析,发现由于其自注意力机制,Transformer具有更高的预测精度。
双向门控循环单元(BiGRU)通过其双向架构解决了单向GRU模型的局限性,能够更全面地捕捉时间序列的动态特征,使其成为复杂时间建模的宝贵工具(Shahabi和Tahvildari,2024年)。为了解决基线模型在处理非线性和非平稳时间序列方面的预测能力不足问题,研究人员使用了经验模态分解(EMD)(Liao等人,2025年)、变分模态分解(VMD)(Huang等人,2024年)、迭代变分模态分解(IVMD)(Jiao等人,2026年)、带有自适应噪声的完整集合经验模态分解(CEEMDAN)等算法(Jiao等人,2025年)。这些方法用于减轻非平稳因素的干扰并提高预测精度。
与传统的潮位预测方法相比,基于人工智能的方法具有响应速度快、计算效率高和易于部署等优点。然而,该领域的当前应用仍受到限制,尤其是缺乏物理信息的整合。深度学习模型的“黑箱”特性(Sirignano和Spiliopoulos,2018年;Kashefi等人,2021年)导致其可解释性有限,并且在模拟物理定律方面存在固有缺陷(Hanachi等人,2019年),这阻碍了它们在解决复杂科学和工程挑战方面的有效性(Xu和Liu,2024年)。为了解决这些问题,近年来出现了基于物理知识的神经网络(PINN)框架(Lawal等人,2022年)。物理知识驱动的深度学习将物理知识整合到深度学习模型的架构和训练过程中,旨在提高预测性能、增强可解释性并确保物理一致性。
PINN也被应用于化学和材料科学等其他领域(Chen等人,2023年)。这些成就不仅验证了基于物理知识的深度学习在提高模型精度方面的潜力,还展示了其在增强物理一致性和可解释性方面的优势(Wang等人,2021b)。因此,基于人工智能和物理模型融合的潮位预测具有重要的科学价值和应用前景。在潮汐预测领域,传统的深度学习模型往往缺乏理论支持,而基于物理知识的深度学习模型可以有效解决这一限制。一种增强物理一致性的方法是使用数值建模软件生成数据集,然后用于训练深度学习模型(Lu等人,2021年;Fu等人,2024年)。然而,利用潮汐物理约束使深度学习模型内化物理定律存在某些挑战,主要是因为观测数据和建模数据在采集方法、应用场景和特征方面存在显著差异。另一种方法是使用PINN,将神经网络与物理定律相结合,以提高模型的准确性和可解释性。尽管这一领域的研究仍有限,但Zhu等人(2025年)使用结合了风暴潮物理机制的PINN来预测冷浪引发的风暴潮,并取得了良好的结果。然而,该研究中的数据来自数值建模,作者指出该方法在非风暴潮期间捕捉规律性时间模式的能力较差。
目前基于数值模拟生成的数据的深度学习研究由于地理范围狭窄和物理表示过于简化,普遍存在泛化能力有限的问题。将基于物理的约束与神经网络结合以增强模型的迁移能力尚未得到充分探索。因此,开发一个由观测数据指导的基于物理知识的深度学习框架对于实现稳健的潮位预测至关重要。
因此,本研究提出了一种将物理约束与深度学习融合的新框架,称为Physics-BiGRU(Phy-BiGRU)。该模型基于BiGRU架构,双向提取潮汐数据的时间特征,并将非平稳谐波分析作为物理约束纳入其中。这一约束作为加权项整合到损失函数中,以提高预测结果的物理一致性。此外,还采用了贝叶斯优化来动态调节物理损失和数据驱动损失的权重,从而提高模型的预测能力。该模型的优势如下:
- (1)
该模型结合了BiGRU架构和非平稳谐波分析,利用观测数据和物理约束信息进行潮汐预测,从而增强物理一致性。
- (2)
在三种典型的潮汐类型(半日潮、全日潮和混合半日潮)下进行了系统验证。结果表明,该模型在不同潮汐条件下保持了稳定的预测性能。
- (3)
对于1至24小时的预测范围,Phy-BiGRU模型在多个评估指标上的预测误差低于传统物理模型和传统深度学习模型,显示出在统一配置下的优越性能。
- (4)
该模型使用来自美国东海岸、西海岸和墨西哥湾的9个潮汐测量站以及日本的3个站点的观测数据进行了训练和验证。结果表明,该模型适用于不同的地理区域和水文条件。
- (5)
在训练过程中引入了贝叶斯优化,以联合优化学习率和物理损失与数据驱动损失的权重,从而在物理一致性和数据拟合精度之间取得平衡。
数据收集
在本研究中,从12个潮汐测量站收集了潮汐和气象数据(如图1所示),以增强样本多样性。其中选择了9个位于美国的潮汐测量站,涵盖了所有类型的潮汐,包括每种潮汐类型的3个站点。此外,为了评估模型在不同海洋区域的泛化能力,还加入了来自日本3个额外潮汐测量站的数据进行验证。
模型在所有类型潮汐中的表现
在本节中,选择了美国9个潮汐测量站的数据,涵盖了所有类型的潮汐。使用RMSE、MAE和R2作为指标评估了模型的性能。该物理和数据双驱动模型用于进行1小时至24小时的潮位预测。通过与基于物理的模型和经典深度学习模型进行比较,全面验证了预测准确性。
结论
为了解决深度学习模型在潮位预测中物理约束不足的问题,本研究提出了一种物理和数据双驱动模型。该方法使用代表半日潮、全日潮和混合潮汐类型的12个站点的数据集进行了验证,预测范围设置为1小时、3小时、6小时和24小时。结论如下: