《Marine Policy》:Integrating physics-based modeling and deep learning for high-resolution vertical chlorophyll-a predictions in the ocean
编辑推荐:
海洋叶绿素a垂直分布预测混合框架研究:融合物理模型与深度学习并采用贝叶斯模型组合提升精度,验证显示MAE降至0.0289 mg/m3,R2达0.97。
张勋|胡淼|耿秀琳
杭州电子科技大学通信工程学院,中国杭州,310018
摘要
准确预测海洋叶绿素-a浓度的垂直分布对于理解海洋生态系统结构和碳循环至关重要。传统的观测方法,包括生物地球化学Argo浮标和被动遥感,受到低垂直分辨率和云层干扰的限制。纯物理模型依赖于理想化的假设,而深度学习模型需要大量的数据集,这使得这两种方法在复杂环境中的可靠性较低。本研究提出了一种混合框架,该框架结合了主动-被动融合水柱光学剖面模型和深度学习架构,包括Transformer、长短期记忆(LSTM)和卷积神经网络(CNN)。进一步采用了贝叶斯模型组合方法来提高预测性能。结果表明,由主动-被动融合水柱光学剖面模型生成的叶绿素-a浓度剖面与水体的光学特性和验证数据非常吻合,平均绝对误差(MAE)范围为0.023至0.207 mg/m3,提供了准确且具有物理解释性的训练数据。深度学习模型取得了较高的预测性能,决定系数高达0.97,有效捕捉了叶绿素-a浓度的垂直变化。贝叶斯模型组合策略进一步改善了不同海洋区域的预测效果。在印度洋的A子区域,单个模型的MAE从0.0326 mg/m3降低到0.0289 mg/m3,证明了所提出框架在复杂海洋条件下的可靠性和稳健性。
引言
叶绿素-a浓度(Chla)是浮游植物生物量和初级生产力的重要指标。它在揭示海洋生态系统结构、碳循环以及对气候变化的响应中起着关键作用。准确了解Chla的垂直分布对于理解生态过程和监测环境变化至关重要。研究人员通常依赖被动遥感和BGC-Argo浮标观测来获取相关数据(Mignot等人,2014年;Arteaga和Rousseaux,2024年)。然而,被动遥感常常受到云层污染的影响,尤其是在高纬度地区,并且只能提供表面信息(<1米)。这一限制降低了其描述整个水柱的能力(Baudena等人,2025年)。BGC-Argo浮标可以测量垂直剖面,但垂直分辨率较低,难以检测到细微的Chla变化(Xing等人,2011年;Mignot等人,2019年)。最近的研究将遥感和Argo数据与深度学习模型相结合,用于预测叶绿素-a的垂直剖面。基于海表面Chla和其他遥感变量的深度神经网络,结合Argo剖面数据,能够重建区域尺度的Chla垂直结构并识别次表层叶绿素最大值(SCM)(Chen等人,2022年)。另一种方法引入高斯激活函数来构建深度神经网络,使得在卫星-Argo融合条件下能够估计三维Chla分布(Zhao等人,2024年)。尽管取得了这些进展,深度学习方法仍然高度依赖于训练数据量和空间覆盖范围,这在高纬度或观测稀疏的区域限制了其可靠性。
基于物理的模型将固有的光学特性与生物光学经验关系相结合,更完整地表示Chla的垂直结构。这些模型可以生成高分辨率、连续的剖面,解决了传统观测在垂直分辨率和连续性方面的限制。在千岛湖,通过从船载激光雷达中推导出漫反射系数和颗粒物后向散射系数,并通过经验函数估算生物贡献,生成了从0到30米的连续Chla垂直剖面,有效克服了传统离散采样在捕捉垂直细节方面的局限性(Sang等人,2024年)。此外,ICESat-2卫星激光雷达可以用来获取水柱中的颗粒物后向散射信息,通过经验算法可以估算Chla浓度,从而在上层海洋构建连续的Chla垂直剖面,并弥补了传统观测的低垂直分辨率(Zheng等人,2022年)。然而,基于物理的模型往往依赖于简化的光学假设,这在复杂的水体条件下可能会引入偏差(Wu等人,2025年)。模型参数还依赖于先验知识或特定区域的经验公式,这限制了其在不同水体类型和大规模空间范围内的适用性(Chen等人,2016年)。
混合方法结合了物理模型和深度学习的优势。基于物理的模型为训练提供了可靠的高分辨率数据,而深度学习可以纠正物理模型输出中的偏差,提高预测准确性。物理引导的深度学习混合模型(PGDL)结合了二维水动力-水质模型(CE-QUAL-W2)的能量守恒约束和长短期记忆(LSTM)网络,能够在分层水库中预测水温,并在模拟准确性和物理一致性方面取得显著改进(Kim和Chung,2023年)。此外,一种基于物理约束的深度学习混合参数化方法,在热带太平洋十年的观测数据上进行训练,有效改善了海洋边界层湍流模拟,并提高了气候模型的准确性和物理一致性(Zhu等人,2022年)。然而,关于叶绿素-a垂直预测的此类研究仍然相对有限。由于各种模型的基本原理不同,预测结果往往存在不确定性。因此,结合多模型集成预测方法已成为提高预测准确性和稳健性的有效途径。贝叶斯模型组合(BMC)作为一种动态加权的概率集成方法,在海洋学领域表现出优异的性能(Hoteit等人,2024年;Huang等人,2025年)。多项研究还表明,它可以产生更准确和可靠的预测结果(Monteith等人,2011年;Wei,2023年)。
考虑到当前方法在预测海洋叶绿素-a垂直剖面方面的多重限制,被动遥感只能捕捉表面信息,并且容易受到云层覆盖的影响,而BGC-Argo浮标剖面数据稀疏,导致垂直分辨率低且连续性差。因此,深度学习模型在观测稀疏或垂直信息不足的区域难以准确捕捉叶绿素-a的垂直结构。此外,在水柱垂直变化复杂或受到强烈干扰的区域,单个深度学习模型的预测准确性和稳定性也可能下降。为了解决这些问题,本研究结合了基于物理的主动-被动融合水柱光学剖面模型(AP-WCOP)和三种深度学习模型,包括Transformer、长短期记忆(LSTM)和卷积神经网络(CNN)。这些模型被用来生成叶绿素-a的多模态垂直预测。进一步使用贝叶斯模型组合(BMC)策略来提高预测准确性和稳健性。本研究的主要目标是:(1)使用物理模型生成的数据训练深度学习模型,从而构建一个用于海洋叶绿素-a垂直预测的框架,并在数据稀缺的区域提高垂直连续性和可靠性;(2)比较三种深度学习模型(Transformer、LSTM和CNN)的预测性能,并评估它们在复杂垂直结构下的表现,为后续的BMC方法中的加权融合提供基础;(3)使用BMC方法融合每个模型的输出,以提高在垂直信息复杂或水柱受到强烈干扰区域的预测准确性和稳健性。
材料与方法
所提出的叶绿素-a浓度(Chla)垂直预测方法的工作流程如图1所示。首先,在由六个ICESat-2轨道覆盖的研究区域内,使用主动-被动融合水柱光学剖面模型(AP-WCOP)生成了从5到15米的Chla垂直剖面,然后将其划分为深度学习模型的训练和测试数据集。由于云层覆盖导致缺失值的纬度区间被
基于物理的模型(AP-WCOP)的验证
为了验证AP-WCOP模型生成的光学参数和Chla剖面的可靠性,使用被动海洋颜色产品和BGC-Argo浮标观测进行了比较分析。在各种光学参数中,选择了作为主要比较变量,因为它不仅是被动海洋颜色产品中常见的稳定参数,也是AP-WCOP模型的核心变量。因此,验证确保了
讨论
准确预测叶绿素-a浓度(Chla)的垂直分布对于理解海洋碳循环、评估浮游植物生物量以及评估气候变化对海洋生态系统的影响至关重要(Sauzède等人,2015年)。本研究创新性地结合了基于物理的主动-被动融合水柱光学剖面模型(AP-WCOP)和深度学习模型,并引入了贝叶斯模型组合(BMC)方法,旨在克服这些限制
结论
本研究提出了一个贝叶斯模型组合(BMC)框架,将物理约束与数据驱动的深度学习相结合,用于预测海洋中叶绿素-a浓度(Chla)的垂直分布。AP-WCOP模型生成的连续剖面严格遵循水柱的光学特性,并在多源观测验证中表现出高保真度,为深度学习模块提供了可解释的物理先验。利用
CRediT作者贡献声明
张勋:撰写——原始草稿、可视化、软件、方法论、调查、数据管理。胡淼:撰写——审阅与编辑、监督、资金获取。耿秀琳:撰写——审阅与编辑、监督、概念构思。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文所述的工作。
致谢
本研究部分得到了浙江省重点研发计划(2023C03014)、“先锋”和“领头鹅”研发计划(2024C03033)以及浙江省属高校基本科研经费(GK239909299001-045)的支持。