使用LSTM-FVCOM和GRU-DF-FVCOM混合模型对山东沿海海域的海水温度进行偏差校正

《Estuarine, Coastal and Shelf Science》:Bias Correction of Sea Temperature in Shandong Coastal Waters Using LSTM-FVCOM and GRU-DF-FVCOM Hybrid Models

【字体: 时间:2026年03月10日 来源:Estuarine, Coastal and Shelf Science 2.6

编辑推荐:

  海表温度预测存在非线性时空特征,FVCOM模型虽能部分模拟物理过程但存在系统性偏差。本研究构建融合LSTM(处理短期偏差)与GRU-DF(动态填补缺失数据)的机器学习框架,通过SHAP分析量化驱动因子贡献,有效提升山东黄海-渤海沿岸海域温度预测精度,验证混合模型在近岸复杂地形下的适用性。

  
陈中原|高广东|毕聪聪|陈长刚|宋伟|冯星茹|尹宝树
中国科学院海洋研究所海洋观测与预报重点实验室、海洋环流与波浪重点实验室,中国青岛

摘要

在大陆架动力学和海气相互作用的影响下,山东沿海水域的海温表现出明显的时空非线性特征。尽管有限体积社区海洋模型(FVCOM)能够在一定程度上捕捉到潜在的物理过程,但在复杂的近岸区域仍存在系统性偏差。为了提高模拟精度并更好地理解偏差的来源,本研究提出了一种结合数值建模和机器学习(ML)的偏差预测框架,该框架基于浮标观测数据。该框架通过长短期记忆网络(LSTM)来捕捉短期偏差,并采用改进的门控循环单元与动态填充(GRU-DF)来处理长期偏差。将预测的偏差叠加到FVCOM输出上以改进模拟结果。为了更好地考虑FVCOM和浮标数据之间偏差的时变幅度,引入了一种新的数据分割策略。此外,还应用了Shapley加性解释(SHAP)方法来分析不同强迫因素对海温预测偏差的贡献。
结果表明,所提出的方法优于直接使用FVCOM进行海温预测:LSTM显著降低了A1–A4站的均方根误差(RMSE),而提出的数据分割策略能够客观评估其在不同时间段的校正性能;同时,GRU-DF有效处理了A5站的高缺失数据率问题。SHAP分析进一步表明,在热通量主导的条件下,LSTM-FVCOM校正效果更好,并揭示了输入变量在空间和深度上的不同贡献,突显了物理过程的空间异质性对模型性能的影响。
总之,将机器学习与FVCOM相结合的混合模型显著提高了近岸海温预测的准确性和可解释性,为海洋预报系统中的偏差校正提供了实用途径。

引言

海温是海气相互作用的关键指标,在气候调节、海洋灾害预警和生态系统响应中起着重要作用。在中国山东沿海地区,黄海和渤海交汇处,由于复杂的水团交换和强烈的大气强迫作用,海温表现出明显的多尺度、非线性时空变异性。因此,提高该区域海温预测的准确性和及时性对于沿海经济活动和生态安全具有重要意义(Zhao等人,2024年)。
传统的海温预测方法主要依赖于物理模型或统计模型(Ozbek,2022年)。其中,有限体积社区海洋模型(FVCOM)是一种广泛使用的三维水动力模型,通过求解控制方程来模拟热力学和动态过程,从而系统地捕捉海温的时间变化。尽管FVCOM能够表示物理机制,但由于相对粗糙的水深分辨率、不完整的参数化方案以及缺乏高分辨率的近岸观测数据,其在沿海预报应用中仍存在局限性。这些限制通常导致浅海区域站点尺度的海温预测能力下降(Kuang等人,2016年)。
近年来,机器学习(ML)已成为优化数值模型和改善环境预测的重要工具。早期研究主要侧重于通过将ML技术与单个站点或有限空间尺度上的数值模型输出相结合来提高预测能力。例如,Patil等人(2016年)将数值模型与基于Meyer小波的神经网络结合,实现了印度洋六个站点日、周和月尺度上的高精度海温预测,尽管没有明确解决站点间的空间异质性问题。Xiao等人(2019年)提出了一个混合LSTM–自适应提升(AdaBoost)模型,用于东海多个站点的1–10天预测,但未探讨站点间性能差异的物理机制。类似地,Qin等人(2021年)证明LSTM在气候变化和水库运行共同影响下优于其他ML模型,能够捕捉每日河流温度变化。
随着ML在地球物理建模中应用的增加,最近的研究推动了机器学习与物理模型的整合,从纯粹的数据驱动的实证校正转向物理指导的混合框架。Costa等人(2023年)应用LSTM网络校正ERA5海洋再分析数据中的系统性偏差,展示了基于ML的后处理在改进大尺度物理数据集方面的有效性。Gao和Jiang(2024年)开发了一个基于物理的深度学习模型,通过结合多尺度风场来预测波谱,从而在复杂的风波相互作用条件下提高了预测能力。此外,Chen等人(2023年)使用物理信息神经网络(PINNs)通过将控制物理方程明确嵌入学习过程来联合反演近岸水深和波场。最近的综述研究进一步强调,物理约束或物理指导的ML模型对于提高海洋预测的可靠性、鲁棒性和可解释性至关重要(Qin等人,2023年;Song等人,2023年)。总体而言,这些研究表明,从黑盒ML校正向明确考虑物理过程的混合建模策略发生了明显转变。
在这一不断发展的框架中,基于FVCOM的混合ML–数值模型方法在沿海和河口应用中显示出强大的潜力。Wang和Ge(2025年)提出了一个混合ML-FVCOM模型用于盐度预测,显著提高了长江口的盐水入侵预测,并阐明了径流和波浪动力学的协同效应。同样,Su等人(2025年)开发了一个集成ML-FVCOM框架用于渤海的风暴潮预测,通过结合FVCOM模拟和ML模型。在混合风场条件下,他们的方法显著提高了预测性能,并在观测数据稀疏的情况下减少了基于物理的模型的不确定性,同时保持了在时间和空间域上的强泛化能力。
对于与温度相关的应用,Fei等人(2022年)提出了一个混合深度学习框架(3DCNN-CBAM-ConvLSTM-AT),该框架将HYCOM预测与卫星观测相结合,将南海海表温度预测的均方根误差(RMSE)从0.60降低到0.35。这些结果表明深度学习能够补偿数值海洋模型中的系统性偏差和结构限制。
基于浮标的海温观测的一个持续挑战是由于传感器故障导致的数据缺失问题。尽管LSTM能够建模非线性时间序列,但在观测数据稀疏或存在间隙的情况下,其预测精度会降低。常见的处理间隙策略,如丢弃不完整样本或使用初步插值,通常会减少有效数据的使用或使插值过程与建模阶段分离,可能引入人为误差。为了克服这些问题,Che等人(2018年)提出了带有衰减的门控循环单元(GRU-D),该模型通过可训练的衰减机制结合缺失模式和时间间隔特征,从而改善了不规则采样医学时间序列的性能。鉴于海温的强周期性和物理特性,静态间隙填充方法(如均值插值)往往会导致非物理的表示。在本研究中,我们提出了一个带有动态填充(GRU-DF)的GRU模型,它在保留GRU-D优点的同时,结合了来自数值模拟的动态生成的插值值。这些近似值与基于历史有效观测的衰减机制相结合,改善了数据缺失情况下海温变异的物理表示,并增强了预测的鲁棒性。
基于数值模拟,本研究开发了一个结合ML和物理建模的混合框架。核心思想是在FVCOM模拟和浮标观测之间的偏差上训练ML模型,从而从大气强迫、热通量和潮汐动力学等输入变量中提取与误差相关的特征。这些偏差和输入特征之间的稳定映射表明存在系统性的、物理驱动的偏差(Yan等人,2024年)。利用四个浮标站的多深度观测数据,我们构建了基于LSTM的混合模型来模拟偏差,然后将这些模型添加到原始FVCOM输出中以校正系统性偏差。此外,应用SHAP分析(Lundberg和Lee,2017年;Yang等人,2022年;Wang等人,2024年)来量化输入变量的贡献,并阐明潜在的空间误差机制,从而提高模型的可解释性。为了处理缺失观测数据,GRU-DF模型将FVCOM输出作为GRU-D架构中的动态填充器,显著提高了具有扩展数据间隙的序列的预测精度。
本文的结构如下:第2节描述数据和方法;第3节展示结果;第4节讨论局限性和未来工作;第5节提供结论。

部分摘录

浮标观测数据集

使用位于山东沿海水域的五个浮标站(A1–A5)进行海温观测。然而,由于部署周期的不同和传感器故障,各个观测深度的开始和结束时间不一致,导致有效样本量有所变化。详细信息见表1。
五个浮标的空间分布如图1所示。各站点之间的记录长度和数据缺失存在显著差异(

评估指标的比较分析

为了评估LSTM-FVCOM混合模型在统一的三步预测方案下的校正性能,我们将其与原始FVCOM模拟进行了比较,使用了两种数据分割策略:滑动窗口作为主要方法,常规分割作为参考。如表2所示,结果表明,在滑动窗口分割下,混合模型显著降低了所有站点和深度的偏差;例如,A1站3米深度的RMSE从

讨论

在本研究中,LSTM–FVCOM混合模型在A1浮标站的预测能力相对有限。该站点位于莱州湾的浅水近岸水域,水深约为6.29米,受到潮汐、风浪和局部环流等高频扰动的强烈影响。这些过程经常破坏局部海表热平衡,给准确表示热结构带来很大挑战。

结论

本研究提出了一个基于机器学习的海温偏差校正框架,通过整合现场浮标观测、FVCOM模拟和ERA5再分析数据,在山东沿海地区进行了验证。主要结论如下:包括LSTM-FVCOM和GRU-DF-FVCOM在内的混合模型在所有五个站点的表现均优于独立的FVCOM模型,尽管它们的校正效果存在明显的空间异质性。
A2–A4站点

CRediT作者贡献声明

高广东:写作 – 审稿与编辑、监督、资源获取、资金申请、正式分析。陈中原:写作 – 原始草稿、可视化、验证、方法论、概念化。尹宝树:监督。冯星茹:监督。宋伟:验证。陈长刚:数据管理。毕聪聪:写作 – 审稿与编辑、监督

未引用的参考文献

Q等人,2021年;高和江,;高和江,;高,2018年;范家等人,2025年。

数据可用性

数据将应要求提供。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本研究得到了国家自然科学基金(NSFC,编号42576003、42476015)和山东省自然科学基金(ZR2024LQX002)的支持。本研究还得到了黄海海洋观测和研究站的支持。感谢中国科学院海洋数据中心(CASODC)提供的数据服务(http://msdc.qdio.ac.cn)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号