海温是海气相互作用的关键指标,在气候调节、海洋灾害预警和生态系统响应中起着重要作用。在中国山东沿海地区,黄海和渤海交汇处,由于复杂的水团交换和强烈的大气强迫作用,海温表现出明显的多尺度、非线性时空变异性。因此,提高该区域海温预测的准确性和及时性对于沿海经济活动和生态安全具有重要意义(Zhao等人,2024年)。
传统的海温预测方法主要依赖于物理模型或统计模型(Ozbek,2022年)。其中,有限体积社区海洋模型(FVCOM)是一种广泛使用的三维水动力模型,通过求解控制方程来模拟热力学和动态过程,从而系统地捕捉海温的时间变化。尽管FVCOM能够表示物理机制,但由于相对粗糙的水深分辨率、不完整的参数化方案以及缺乏高分辨率的近岸观测数据,其在沿海预报应用中仍存在局限性。这些限制通常导致浅海区域站点尺度的海温预测能力下降(Kuang等人,2016年)。
近年来,机器学习(ML)已成为优化数值模型和改善环境预测的重要工具。早期研究主要侧重于通过将ML技术与单个站点或有限空间尺度上的数值模型输出相结合来提高预测能力。例如,Patil等人(2016年)将数值模型与基于Meyer小波的神经网络结合,实现了印度洋六个站点日、周和月尺度上的高精度海温预测,尽管没有明确解决站点间的空间异质性问题。Xiao等人(2019年)提出了一个混合LSTM–自适应提升(AdaBoost)模型,用于东海多个站点的1–10天预测,但未探讨站点间性能差异的物理机制。类似地,Qin等人(2021年)证明LSTM在气候变化和水库运行共同影响下优于其他ML模型,能够捕捉每日河流温度变化。
随着ML在地球物理建模中应用的增加,最近的研究推动了机器学习与物理模型的整合,从纯粹的数据驱动的实证校正转向物理指导的混合框架。Costa等人(2023年)应用LSTM网络校正ERA5海洋再分析数据中的系统性偏差,展示了基于ML的后处理在改进大尺度物理数据集方面的有效性。Gao和Jiang(2024年)开发了一个基于物理的深度学习模型,通过结合多尺度风场来预测波谱,从而在复杂的风波相互作用条件下提高了预测能力。此外,Chen等人(2023年)使用物理信息神经网络(PINNs)通过将控制物理方程明确嵌入学习过程来联合反演近岸水深和波场。最近的综述研究进一步强调,物理约束或物理指导的ML模型对于提高海洋预测的可靠性、鲁棒性和可解释性至关重要(Qin等人,2023年;Song等人,2023年)。总体而言,这些研究表明,从黑盒ML校正向明确考虑物理过程的混合建模策略发生了明显转变。
在这一不断发展的框架中,基于FVCOM的混合ML–数值模型方法在沿海和河口应用中显示出强大的潜力。Wang和Ge(2025年)提出了一个混合ML-FVCOM模型用于盐度预测,显著提高了长江口的盐水入侵预测,并阐明了径流和波浪动力学的协同效应。同样,Su等人(2025年)开发了一个集成ML-FVCOM框架用于渤海的风暴潮预测,通过结合FVCOM模拟和ML模型。在混合风场条件下,他们的方法显著提高了预测性能,并在观测数据稀疏的情况下减少了基于物理的模型的不确定性,同时保持了在时间和空间域上的强泛化能力。
对于与温度相关的应用,Fei等人(2022年)提出了一个混合深度学习框架(3DCNN-CBAM-ConvLSTM-AT),该框架将HYCOM预测与卫星观测相结合,将南海海表温度预测的均方根误差(RMSE)从0.60降低到0.35。这些结果表明深度学习能够补偿数值海洋模型中的系统性偏差和结构限制。
基于浮标的海温观测的一个持续挑战是由于传感器故障导致的数据缺失问题。尽管LSTM能够建模非线性时间序列,但在观测数据稀疏或存在间隙的情况下,其预测精度会降低。常见的处理间隙策略,如丢弃不完整样本或使用初步插值,通常会减少有效数据的使用或使插值过程与建模阶段分离,可能引入人为误差。为了克服这些问题,Che等人(2018年)提出了带有衰减的门控循环单元(GRU-D),该模型通过可训练的衰减机制结合缺失模式和时间间隔特征,从而改善了不规则采样医学时间序列的性能。鉴于海温的强周期性和物理特性,静态间隙填充方法(如均值插值)往往会导致非物理的表示。在本研究中,我们提出了一个带有动态填充(GRU-DF)的GRU模型,它在保留GRU-D优点的同时,结合了来自数值模拟的动态生成的插值值。这些近似值与基于历史有效观测的衰减机制相结合,改善了数据缺失情况下海温变异的物理表示,并增强了预测的鲁棒性。
基于数值模拟,本研究开发了一个结合ML和物理建模的混合框架。核心思想是在FVCOM模拟和浮标观测之间的偏差上训练ML模型,从而从大气强迫、热通量和潮汐动力学等输入变量中提取与误差相关的特征。这些偏差和输入特征之间的稳定映射表明存在系统性的、物理驱动的偏差(Yan等人,2024年)。利用四个浮标站的多深度观测数据,我们构建了基于LSTM的混合模型来模拟偏差,然后将这些模型添加到原始FVCOM输出中以校正系统性偏差。此外,应用SHAP分析(Lundberg和Lee,2017年;Yang等人,2022年;Wang等人,2024年)来量化输入变量的贡献,并阐明潜在的空间误差机制,从而提高模型的可解释性。为了处理缺失观测数据,GRU-DF模型将FVCOM输出作为GRU-D架构中的动态填充器,显著提高了具有扩展数据间隙的序列的预测精度。
本文的结构如下:第2节描述数据和方法;第3节展示结果;第4节讨论局限性和未来工作;第5节提供结论。