一种结合ERA5陆地数据和Landsat数据进行长期植被潜热估算与预测的框架

【字体: 时间:2026年03月03日 来源:Agricultural and Forest Meteorology 5.7

编辑推荐:

  植被潜在热通量(LE)的遥感估算框架研究:融合ERA5-Land再分析数据和Landsat NDVI数据,通过随机森林模型优化六项气象与植被驱动因子,验证其R2=0.74的全球适用性,并开发LE-ML(基于驱动因子预测)和LE-Direct(历史数据直接预测)两种框架,评估数据可用性对预测精度的影响。

  
魏一照|黄金辉
环境科学与工程学院,中加水与环境安全研发中心,南开大学,天津300071,中国

摘要

植被潜热(LE)是陆地-大气能量交换的关键组成部分,对气候建模、干旱监测和生态水文研究具有广泛的影响。本研究开发了一个全球适用的框架,该框架结合了ERA5-Land再分析和Landsat观测数据,生成了从1984年至今的月度潜热估计值,分辨率为30米。使用Fluxnet2015的塔式观测数据进行验证,通过穷举搜索从22个候选变量中确定了6个ERA5-Land变量,并通过敏感性分析评估了Landsat NDVI。随机森林模型表现最佳(R2 = 0.74;RMSE = 16.74 W m?2)。随着NDVI提取半径的增加,模型精度下降,这反映了超出通量覆盖范围的植被所引入的空间噪声。为了实现预测,开发了两个互补的框架:LE-ML使用时间序列模型预测七个确定的驱动因素(六个ERA5-Land变量和Landsat NDVI),然后利用训练好的随机森林模型估计潜热;LE-Direct直接根据历史记录预测潜热。基准实验表明,在训练数据有限的情况下(平均R2 = 0.62 vs. 0.48),LE-ML表现更好;而在较长记录(>9年)的情况下,LE-Direct由于能够捕捉季节性变化而优于LE-ML。案例研究展示了该框架在多种全球生态系统中的适用性,为潜热估计和预测提供了可扩展的解决方案,并为根据数据可用性选择策略提供了指导。

引言

潜热(LE)和蒸散作用(ET)与地表和大气之间的水和能量交换密切相关(Lei和Yang 2010;Lin等人2022;Yang等人2023)。作为表面能量平衡的关键组成部分,潜热通常占净辐射的50%以上,其估计值根据所使用模型的不同而变化,范围从48%到88%不等(Trenberth等人2009;Wang和Dickinson 2012)。基础理论表明,潜热受表面能量分配和边界层动力学的影响,其估计需要综合考虑辐射、湍流和水分传输过程(Brutsaert 2013)。同时,对遥感衍生指标(如NDVI)的解释必须考虑物理和生物限制,并通过地面观测来确保在空间和时间尺度上的可靠性(Bolle等人2006)。鉴于超过80%的陆地蒸散作用来自植物蒸腾作用(Schlesinger和Jasechko 2014),准确及时地估计植被潜热对于深入理解水文过程、生态系统功能和陆地-大气相互作用至关重要(Lan等人2021)。
植被潜热模拟方法大致可以分为物理(机理)模型和统计(数据驱动)模型(Fu等人2021;Wang等人2007)。物理模型,如Penman-Monteith方程(Monteith 1965;Penman 1948)和陆地表面能量平衡算法(Bastiaanssen等人1998),依赖于能量平衡原理和成熟的生物物理过程。这些模型具有坚实的理论基础,并已在各种气候和地表条件下得到验证(Chen等人2021)。然而,它们往往受到经验参数化的限制,例如空气动力阻力或冠层导度因子,这可能引入显著的不确定性(Chen等人2022)。相比之下,统计模型基于观测到的潜热与相关环境变量之间的经验关系进行估计。这些方法包括线性和非线性回归(Khanmohammadi等人2018)、神经网络(Liu等人2020)、深度学习、随机森林(Chen等人2020)和支持向量机(Ashrafzadeh等人2020)。尽管许多这些经验关系基于数十年的物理理论和实验观察,但数据驱动模型可以提供一种灵活且可扩展的方法来扩展现有理解——特别是在缺乏密集现场测量的地区。它们不是替代物理模型,而是作为补充工具,利用大规模的地球观测数据集来支持广泛的时空范围内的潜热估计。特别是那些整合了全球可用再分析和卫星数据(例如ERA5-Land和Landsat)的模型,可以在不依赖本地通量塔校准的情况下估计潜热,从而提高数据稀缺地区的适用性。然而,许多模型需要局部通量测量或详细的环境输入,而这些在数据稀缺地区往往不可用,限制了它们的时空通用性。因此,确保输入数据的质量和评估模型的通用性是可靠应用的基本前提。
基于云的地理空间平台的最新进展显著提高了遥感和再分析数据的可访问性和处理能力(Yao等人2019)。诸如Google Earth Engine(GEE)和NASA Earthdata这样的平台提供了对Landsat、MODIS和ERA5等综合数据集的免费访问(Huang等人2017;Kong等人2019)。这些平台支持在多个空间和时间尺度上的持续长期观测,同时消除了大量野外工作和本地数据准备的需要(Wang等人2020;Tamiminia等人2020)。Landsat卫星系列自1972年发射以来,提供了超过四十年的高质量30米光学数据,支持了植被监测、水文学和土地管理的众多应用(Loveland和Dwyer 2012)。此外,ERA5-Land提供了从1981年至今的高分辨率(9公里)再分析数据,涵盖了与水文气象建模相关的关键气象和土壤变量(Hersbach等人2020)。将ERA5-Land的大气数据与Landsat的高分辨率地表观测数据融合,为评估不同景观和气候区的陆地-大气能量通量提供了统一且可扩展的框架。
以往使用AI模型进行潜热估计的研究通常采用与物理模型相似的输入变量,如温度、湿度、辐射、压力和归一化植被指数(NDVI)(Chen等人2020;Chen等人2022;Zhu等人2022)。虽然这种方法合理,但它假设物理模型中重要的变量对AI模型同样适用。然而,数据驱动方法对特征冗余和噪声非常敏感,可能导致过拟合并降低模型性能(LeCun等人2015)。因此,选择最佳的输入变量集对于提高预测精度和模型通用性至关重要。此外,包括NDVI或增强植被指数(EVI)在内的植被指数提供了关于冠层条件的额外信息,在估计以蒸腾作用为主的潜热时特别有用(Barraza等人2017;Joiner等人2018)。在涡度协方差塔处,气象条件通常是均匀的,而在通量覆盖范围内的植被条件由于局部异质性而显著变化(Heidbach等人2017)。为了使卫星衍生的植被指数与地面通量测量结果一致,通常会在估计的通量覆盖半径内对植被信号进行平均处理,该半径通常在几十米到几百米之间(Kljun等人2015)。然而,植被指数提取半径、季节动态和生态系统特征对潜热估计的影响尚未在全球范围内系统地进行评估(Wang等人2019)。
尽管在空间显式潜热估计方面取得了进展,但对其未来动态的预测仍不成熟——尤其是在捕捉快速景观变化所需的高空间和时间分辨率方面。这一差距限制了我们预测生态系统对气候变化和土地利用强度加剧的反应的能力。在由于CO?施肥或恢复工作导致植被绿化增加的地区,或在面临热浪加剧和热岛效应扩大的城市地区(Santamouris等人2015),潜热的变化深刻影响局部能量平衡、水文循环和热舒适度(Wei等人2024)。例如,干旱期间的蒸腾作用减少或植被覆盖的突然变化会加剧地表升温,而持续的绿化可能通过增强蒸发冷却来缓解温度上升(Zhao等人2016)。因此,准确及时的潜热预测对于指导气候适应、城市可持续性和生态系统韧性规划至关重要。利用不断扩展的卫星和再分析时间序列数据档案,本研究评估了在不同环境和数据可用性水平下预测植被潜热的替代策略。
本研究的目标有四个:(1)确定使用Landsat和ERA5-Land数据结合估计植被潜热的最适合AI模型;(2)通过穷举选择ERA5-Land预测因子组合来优化模型输入;(3)评估潜热模型性能对NDVI输入的敏感性,涵盖不同空间尺度、生态系统类型、季节和纬度梯度;(4)在数据可用性不同的条件下,比较两种潜热预测框架——LE-ML(根据预测的环境驱动因素估计潜热)和LE-Direct(直接根据历史记录预测潜热)。

部分摘要

现场潜热数据收集

本研究使用了FLUXNET2015数据集提供的267个涡度协方差(EC)塔站的观测潜热数据(https://fluxnet.fluxdata.org/data/download-data/)(Pastorello等人2020)。这些站点涵盖了多种气候类型和植被类型,包括森林、草地、湿地、耕地、灌木丛、城市地区、水域、雪地和裸土(图1)。本研究中使用的FLUXNET2015站点信息,包括FLUXNET ID和/或站点DOI,可在//zenodo.org/records/18476748获取

植被潜热估计框架评估

本研究选择了七类人工智能模型,涵盖了基于不同机制的十个不同模型(图2)。潜热模拟的输入变量包括2米露点温度、10米u分量风速、10米v分量风速、地表净太阳辐射总量、第一层土壤温度、第一层土壤体积含水量和NDVI。其中,NDVI数据来自Landsat卫星图像,而其余变量

全球适用性和模型框架

最近在全局蒸散作用(ET)建模方面的进展——如FLUXCOM(Jung等人2019)和干旱地区ET框架(Nelson等人2024)——证明了集成机器学习在大规模水和能量通量估计中的实用性。FLUXCOM采用了两步建模策略:首先在通量塔站点校准模型,然后使用MODIS时代的遥感和气象输入将预测结果放大到全球尺度。Nelson等人(2024)同样应用了XGBoost

结论

本研究通过整合ERA5-Land再分析和Landsat衍生的NDVI,开发了一个全球适用的植被潜热估计框架。在评估的十个人工智能算法中,随机森林模型取得了最高的准确性(R2 = 0.74,RMSE = 16.74 W/m2),优于贝叶斯、神经网络和深度学习方法。通过对超过四百万种组合的穷举变量选择,确定了六个最佳的ERA5-Land变量作为预测因子:

CRediT作者贡献声明

魏一照:写作——审稿与编辑、原始草稿撰写、可视化、验证、软件开发、方法论设计、调查、数据分析、概念化。黄金辉:写作——审稿与编辑、监督、资金获取。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号