利用环境协变量和基于图的深度学习技术重建缺失的海洋CDOM(氯化有机物)剖面
《Deep Sea Research Part I: Oceanographic Research Papers》:Reconstructing missing marine CDOM profiles using environmental covariates and graph-based deep learning
【字体:
大
中
小
】
时间:2026年03月15日
来源:Deep Sea Research Part I: Oceanographic Research Papers 2.3
编辑推荐:
准确重建海洋CDOM垂直剖面对理解海洋生物地球化学过程至关重要。针对BGC-Argo数据集存在的CDOM观测缺失问题,提出基于图注意力网络(GAT)与门控循环单元(GRU)结合的GGS-net深度学习框架,通过整合环境数据与空间关联特征,有效填补复杂缺失模式下的CDOM垂直剖面,实验表明其R2、MAE和RMSE等指标均优于传统方法。
谢北北|刘新慧|孟凡志|张迪|袁凯龙
中国河北省秦皇岛市燕山大学人工智能学院,066004
摘要
准确重建海洋有色溶解有机物(CDOM)的垂直分布对于深入理解海洋生物地球化学过程至关重要。为了解决全球Biogeochemical-Argo(BGC-Argo)数据集中CDOM观测数据缺失的普遍问题,本文提出了一种基于深度学习的新插补框架GGS-net。该框架整合了环境观测数据,有效利用了空间相关特征和垂直结构特性。具体而言,首先采用图注意力网络(GAT)来表征相邻浮标之间的空间依赖性,从而实现CDOM及其相关环境变量的耦合空间表示。提取的空间特征随后被输入到一个由门控循环单元(GRU)和自注意力(SA)机制组成的序列建模模块中,通过这种方式增强了关键水层CDOM垂直结构的表示。通过结合基于空间的关系依赖性和深度序列建模,GGS-net能够有效处理CDOM垂直分布中的复杂和不规则缺失模式。综合实验结果表明,与传统插补方法相比,GGS-net在多个评估指标上表现出更优和更稳定的性能,包括决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)。这些结果表明,结合环境数据的图增强深度学习方法在重建稀疏海洋生物地球化学剖面方面具有巨大潜力,从而为海洋碳循环和生态动态研究提供了更可靠的数据支持。
引言
有色溶解有机物(CDOM)是海洋溶解有机物的重要组成部分,其来源包括外部因素(如河流输入和陆地径流)和内部海洋过程(如浮游植物生产、衰老和微生物再矿化)(Yan等人,2021年;Zheng等人,2023年)。作为海水中的光学活性成分,CDOM强烈吸收短波辐射,从而调节水下光场并影响初级生产力的分布,在海洋碳循环中起着关键作用(Brezonik等人,2015年)。在垂直尺度上,CDOM的分布受光衰减、垂直混合、水体结构和生物地球化学过程的共同控制,通常表现出明显的深度依赖性梯度(Johnston等人,2020年)。这种垂直异质性不仅反映了不同深度层有机物来源和转化途径的差异,还为理解海洋生物地球化学过程和生态功能分区提供了重要见解。因此,准确表征CDOM的垂直分布对于理解海洋生物地球化学过程至关重要,并且对于评估光照可用性、初级生产力和全球碳预算的变化至关重要(Liu等人,2020年;Gomes等人,2018年;Nima等人,2016年)。然而,由于现有观测技术在空间和时间分辨率及覆盖范围上的限制,全球尺度CDOM剖面数据的完整性和可靠性仍然是一个重大挑战(Song等人,2019年)。
当前的CDOM观测系统在深度覆盖范围和空间分辨率方面存在显著局限。遥感反演技术已能够在沿海和大陆架地区实现高分辨率的CDOM估计。例如,Li等人(2018年)开发了一种改进的浅水生物光学特性算法,有效消除了光学浅水区的底部反射干扰。Zeng等人(2024年)将准解析算法应用于洱海复杂的淡水环境,实现了动态监测能力。Sun等人(2021年)使用Landsat 8影像对多种机器学习算法进行了比较分析,发现高斯过程回归具有更高的稳定性。将遥感影像与随机森林(RF)和反向传播神经网络(BPNN)等机器学习方法相结合,显著提高了CDOM估计的准确性(Chen等人,2024年;Mu等人,2024年;Feng等人,2024年)。然而,由于遥感在捕捉深层和深水信息方面的固有局限性,CDOM沿垂直方向的光化学衰减过程仍缺乏充分研究。
传统的基于船舶的观测方法能够获取公里级别的CDOM剖面数据。但由于高昂的运营成本和后勤限制,其空间和时间覆盖范围仍然有限,限制了其在全球尺度研究中的应用(Su等人,2021年;Cao等人,2025年)。Biogeochemical Argo(BGC-Argo)浮标的出现为解决这些限制提供了重要突破。配备荧光传感器的BGC-Argo浮标可以监测包括CDOM、溶解氧和营养物质在内的关键生物地球化学参数,其采样频率和自动化水平远优于传统方法(Hu等人,2023年;Claustre等人,2020年)。尽管如此,BGC-Argo数据仍存在空间覆盖不完整的问题。浮标的漂移路径受海洋 currents影响,设备故障和能量限制导致的数据中断可能会在某些时间段或地区造成CDOM观测的缺失(Chen等人,2024年)。这些数据缺失不仅阻碍了对CDOM空间分布的全面理解,还直接影响基于浮标观测构建的生态和气候模型的准确性(Sui和Jiang,2024年)。
因此,开发有效的插补方法以填补数据空白是提高CDOM监测准确性和可靠性的关键。现有的数据插补方法主要包括传统插值方法和基于机器学习的建模技术。传统方法如线性插值(Kim等人,2023年)、样条插值(Keller和Borkowski,2019年)和逆距离加权(Qiao等人,2019年;Qin等人,2021年)通常假设变量变化是静止的或空间连续的,这限制了它们处理海洋变量的高非线性和浮标分布的稀疏性的能力。相比之下,数据驱动的方法在数据重建方面表现出更强的能力。例如,Poloczek等人(2014年)提出使用k最近邻(kNN)回归作为短期风速预测的地理插补方法,与其他方法相比具有更高的插补准确性和预测性能。Li等人(2024年)开发了一种基于RF的地理插值模型,结合海洋动态数据有效填补了南海的叶绿素浓度缺失。Chakraborty等人(2025年)设计了一个结合卷积神经网络和长短期记忆(LSTM)网络的深度学习框架,准确重建了浮标时间序列中的短期波高数据缺失。Kim等人(2022年)提出了一种结合基于回归的估计和领域知识校正的插补策略,用于恢复缺失的关键船舶参数。这些方法在处理非线性和不完整的复杂时空数据集方面显示出广泛的应用性(Durán-Rosal等人,2016年;Thomas和Rajabi,2021年)。然而,大多数现有插补研究仅关注局部时间缺失或二维空间插值问题,没有充分考虑CDOM剖面中存在的空间依赖性、垂直变化模式和连续深度层的缺失特征。因此,迫切需要开发一种能够同时建模空间依赖性和捕捉垂直物理结构的插补方法,以实现复杂海洋剖面数据的准确重建。
为了解决上述挑战,本文旨在开发一种高效可靠的海洋CDOM垂直剖面重建方法,重点在于整合环境数据并有效利用空间和垂直结构特征,以提高剖面重建的准确性和适用性。主要贡献总结如下:
(1) 建立了一个结合环境数据的深度序列建模框架,用于重建缺失的CDOM垂直剖面,同时考虑了浮标之间的空间依赖性和剖面内的垂直变化模式。
(2) 在多种缺失数据场景下进行了系统评估,证明了所提出的方法在不同深度层和时间背景下都能实现稳定和准确的重建,为未来的海洋生物地球化学研究提供了可靠的数据集。
(3) 进行了消融研究,以检验关键组分的贡献,为理解模型性能提供了实证依据,并指导优化策略。
总体而言,本文提供了一种高精度重建海洋CDOM垂直剖面的有效方法,并为深入理解海洋碳循环和生态动态提供了宝贵的数据资源。
研究区域和数据
本节介绍了选定的研究区域、数据来源和预处理方法。
方法
本节介绍了CDOM数据插补模型的完整架构及其关键组成部分。第3.1节概述了整体框架。第3.2节介绍了基于GAT的空间编码器。第3.3节描述了由GRU层和单头SA机制组成的深度建模模块。第3.4节总结了模型超参数设置。第3.5节描述了实验设置。
结果与讨论
本节详细报告了所提出模型的实验结果和性能分析。首先,第4.1节介绍了用于评估模型性能的评估指标。然后,第4.2节描述了三种不同的缺失数据插补场景,并将所提出的模型与其他最先进方法进行了对比实验。该模型在不同深度、时间周期等条件下的适用性得到了验证。
结论
本文提出了一种基于深度学习的CDOM数据填补模型GGS-net,该模型结合了GAT、GRU和自注意力机制,实现了从Argo浮标观测数据中高精度重建CDOM垂直剖面的目标。与传统方法相比,GGS-net在捕捉浮标之间的空间异质性和CDOM的垂直序列特征方面具有明显优势,在各种条件下均表现出稳定和更优越的插补性能。
CRediT作者贡献声明
谢北北:撰写 – 审稿与编辑、监督、方法论、资金获取、概念化。刘新慧:撰写 – 原始草稿、方法论、调查、数据管理。孟凡志:验证、调查、数据管理。张迪:监督、正式分析。袁凯龙:项目管理、正式分析。
利益冲突声明
作者声明没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
致谢
本工作得到了河北省中央引导地方科技发展基金(236Z1704G)和秦皇岛市科技研发项目(202302B023)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号