USEM:一种利用Landsat 5/7/8和Sentinel-2影像同时估算沿海水域多种营养物质浓度的统一模型

【字体: 时间:2026年03月05日 来源:Environmental Research 7.7

编辑推荐:

  近海营养物监测|多源卫星遥感|统一估计模型|XGBoost算法|贝叶斯优化

  
秦叶|易中胜|梁月季|黄晓婷|李静
桂林理工大学环境科学与工程学院,中国桂林541004

摘要

准确估计营养盐浓度对于监测沿海富营养化现象至关重要,但由于缺乏营养盐的直接光谱特征以及单传感器观测的局限性,这一任务仍然具有挑战性。为了解决这些问题,本研究提出了一种统一的同步估计模型(USEM)。USEM模型能够同时估计沿海水体中的四种关键营养盐:正磷酸盐(PO4P)、溶解无机氮(DIN)、总氮(TN)和总磷(TP)。我们在Google Earth Engine平台上整合了来自Landsat 5/7/8和Sentinel-2的多传感器卫星图像。通过提取各传感器共有的光谱带并加入传感器类型标识符,构建了一个统一的特征集。采用极端梯度提升(eXtreme Gradient Boosting)算法,并通过贝叶斯优化方法调整超参数来构建USEM模型。将USEM的性能与其他五种机器学习模型进行了比较:K-最近邻(K-Nearest Neighbors)、反向传播神经网络(back-propagation neural network)、支持向量回归(support vector regression)、随机森林(random forest)和光梯度提升机(light gradient boosting machine)。结果表明,USEM模型在独立测试集上的准确率更高,PO4P、DIN、TN和TP的判定系数(R2)分别为0.70、0.77、0.69和0.67。此外,其均方根误差也最低。该模型在10折交叉验证中表现出较强的稳健性。USEM模型能够实现对沿海水体营养盐浓度的长期监测,直接支持富营养化评估、污染源追踪以及管理效果的评价。

引言

富营养化对全球水生生态系统构成了重大威胁。大约115万平方公里的深度小于200米的沿海水域可能处于富营养化状态(Maúre等人,2021年)。这一现象主要由营养盐浓度控制。在这些营养盐中,正磷酸盐(PO4P)、溶解无机氮(DIN,即硝酸盐、亚硝酸盐和铵的总和)、总氮(TN)和总磷(TP)是关键的监测指标(Niu等人,2021年;Zhu等人,2024年)。TN和TP反映了总营养盐含量,而DIN和PO4P则代表可直接促进浮游植物繁殖的生物可利用形式。这些营养盐通过调控浮游植物的生物量和群落结构来影响海洋生产力,从而影响生态系统功能(Li等人,2021年;Albarico等人,2025年)。过量的营养盐会导致富营养化,破坏浮游植物群落并引发藻类大量繁殖(Lan等人,2024年)。因此,准确及时地监测营养盐浓度对于有效的环境管理和有害藻类爆发的早期预警至关重要。
基于现场采样和实验室分析的传统监测方法成本高昂且空间覆盖范围有限。相比之下,卫星遥感技术提供了全面的空间覆盖、高时间分辨率和成本效益(Zhu等人,2024年;Chen等人,2024年;Anees等人,2025c年)。用于水质参数估计的遥感方法包括物理模型、经验模型和半经验模型。基于辐射传输理论的物理模型不足以反演营养盐浓度。营养盐没有明显的诊断性光谱特征,也没有直接将其与遥感反射率联系起来的物理关系(Niroumand-Jadidi等人,2019年;Adjovu等人,2023年)。因此,研究人员利用光学特性与水质成分之间的经验关系来构建带比率回归模型,以估计TN、TP和PO4P(Sun等人,2021年;Soomets等人,2022年;Xia等人,2023年;Rajaveni等人,2024年)。然而,这些线性模型无法充分反映水生系统中的非线性相互作用。机器学习(ML)算法能够有效捕捉这种非线性,并已成功应用于多种复杂的环境监测任务(Anees等人,2024年,2025b年;Mehmood等人,2025a年;Liu等人,2025a年;Qin等人,2025年)。这些算法也被验证可用于估计多种营养盐指标,包括TP(Fang等人,2024年;Liu等人,2025b年)、TN(Sinshaw等人,2019年;Zhu等人,2023年)、溶解氧(Valera等人,2020年;Zhu等人,2022年)、DIN(Huang等人,2021年;Zhang等人,2023年)、PO4P(Huang等人,2023年;Rajaveni等人,2024年)、溶解无机磷酸盐(Wu等人,2022年;Liu等人,2022年)和溶解硅酸盐(Liu等人,2022年)。
然而,仍存在两个主要限制。首先,大多数研究将营养盐参数视为独立的反演目标,从而忽略了它们之间的生态相互作用和协同效应。这些相互作用对于评估富营养化至关重要。其次,现有算法通常是针对特定传感器设计的,例如MODIS、Landsat、Sentinel-2和Sentinel-3(Soomets等人,2022年;Rajaveni等人,2024年;Liu等人,2025b年)。这种“一个传感器一个模型”的范式导致了算法的一致性问题,阻碍了长期、连续数据的积累,并增加了多平台融合的复杂性,从而影响了时空分辨率的提高。实际上,每种传感器都有其独特的优缺点:Landsat提供了数十年的数据档案,但重访周期为16天且经常受到云层覆盖;而Sentinel-2具有较高的空间分辨率,但数据时间跨度有限(Zhou等人,2024年;Anees等人,2025d年;Nikoo等人,2025年)。依赖单一传感器无法同时实现长期连续性、高空间分辨率和充足的时间覆盖(Anees等人,2025a年;Fang等人,2025年)。因此,多源数据整合对于构建长期、可靠、高时空分辨率的沿海营养盐数据集至关重要。然而,不同传感器之间的光谱配置差异使得直接数据合并或特定传感器的算法容易产生系统偏差。因此,需要一个统一的算法框架,能够利用多种传感器的共同光谱特征,同时估计关键营养盐变量。
为了解决这些挑战,提出了一个统一的同步估计模型(USEM)。该模型通过整合Landsat 5/7/8和Sentinel-2的图像,同时估计沿海水体中的四种关键营养盐:PO4P、DIN、TN和TP。在Google Earth Engine(GEE)平台上,提取了Landsat 5/7/8和Sentinel-2共有的光谱带,并添加了四个分类传感器标识符,以构建跨传感器特征集。随后,使用极端梯度提升(XGBoost)算法开发了这四种营养盐的同时估计模型,并通过贝叶斯优化自动调整超参数。最后,在深圳和香港的沿海水域通过与其他主流机器学习模型的比较实验,评估了该模型的准确性和稳定性。

研究区域

深圳是中国广东省的一个主要城市,西侧毗邻珠江口。香港位于深圳南部,濒临南海。深圳和香港的海洋面积分别为1145平方公里和1648.7平方公里,平均海岸线长度分别约为260公里和360公里(Feng和Xu,2021年)。鉴于珠江口复杂的水质状况,我们选择了

模型性能比较

如2.1.1节所述,如果反射率值是在现场测量PO4P、DIN、TN或TP后的±3天内获得的,则保留这些值。这些值在像素级别从四个卫星传感器中合并。经过时空过滤后,共识别出2,839个有效匹配对,其中来自Landsat 5的1,306个,来自Landsat 7的1,098个,来自Landsat 8的238个,来自Sentinel-2的197个。图3总结了单波段反射率与

USEM框架的优势

USEM在同时估计沿海水体中多种营养盐浓度方面表现出强大的性能。这得益于XGBoost在捕捉复杂非线性方面的优势;同时,它还通过贝叶斯优化得出了一个通用化的超参数集。与RF和LGBM相比,USEM具有更高的平均准确率和更小的泛化差距(表3),以及更低的交叉验证方差(图4),显示出更好的稳定性和更少的

结论

本研究提出了用于沿海水体监测的统一同步估计模型(USEM)。该模型在机器学习框架内运行,整合了多传感器卫星图像(Landsat 5/7/8和Sentinel-2),同时估计四种关键营养盐的浓度:PO4P、DIN、TN和TP。其实现依赖于两个核心组件:(1)从跨传感器光谱带构建的统一特征集,并添加了特定于传感器的标识符;

数据可用性

数据可应要求提供。

利益冲突声明

作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。

CRediT作者贡献声明

秦叶:写作 – 审稿与编辑,撰写原始草稿,方法论。梁月季:监督,项目管理,调查。易中胜:验证,项目管理,调查,概念化。李静:数据管理。黄晓婷:软件开发,正式分析

未引用参考文献

Aurin和Dierssen,2012年;Gómez等人,2021年;Lundberg,2019年;Nazeer和Nichol,2016年;Perez和Vitale,2023年。

参与同意

所有作者都对这项工作做出了重要贡献。

伦理批准

本研究遵循了各机构伦理委员会的指导方针进行。

出版同意

所有作者均同意发表本文。

资助

本研究得到了国家自然科学基金(编号22166015、42064003和41901409)和广西自然科学基金(编号2022GXNSFAA035448、2021GXNSFBA220046)的资助。

利益冲突声明

? 作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。

致谢

主要作者感谢Google Earth Engine(GEE)平台提供Landsat数据,以及香港环境保护署(HKEPD)公开共享的现场海水质量数据(网址:https://data.gov.hk/en-data/dataset/hk-epd-epd-marinewaterquality)。所有卫星图像包括来自Landsat 5 TM(LANDSAT/LT05/C02/T1_L2)、Landsat 7 ETM+(LANDSAT/LE07/C02/T1_L2)和Landsat 8 OLI的公开可用表面反射率产品
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号