基于数据的方法,利用地球观测数据和地面数据对碳通量的时空变化进行稳健评估

《Environmental Modelling & Software》:Data-driven approach to robust spatio-temporal assessment of carbon fluxes using Earth observation and ground-based data

【字体: 时间:2026年01月21日 来源:Environmental Modelling & Software 4.6

编辑推荐:

  本研究开发了一个基于机器学习的综合流程,通过整合FLUXNET地面观测数据、NASA POWER气象再分析数据及MODIS卫星数据,有效提升区域尺度净生态系统交换(NEE)值的预测精度,并利用SHAP值分析和预测区间覆盖率进行不确定性评估与特征解释,最终在俄罗斯Tver州实现高时空连续性的碳通量动态监测。

  
阿尔乔姆·戈尔巴连科|米哈伊尔·加萨诺夫|埃利扎维塔·戈尔巴连科|波琳娜·特雷古博娃|安娜·彼得罗夫斯卡娅|乌斯曼·塔苏耶夫|斯韦特兰娜·伊拉里奥诺娃|德米特里·沙德林|叶夫根尼·布尔纳耶夫
应用人工智能中心,斯科尔科沃科学技术研究院,莫斯科,121205,俄罗斯

摘要

有效监测碳通量对于实施气候变化缓解和适应措施至关重要。本研究开发了一种先进的机器学习(ML)流程,利用地球观测数据和地面测量结果来评估区域尺度上的整体碳通量。我们旨在解决与忽视环境过程物理性质相关的主要空间ML评估限制。我们提出了一种训练流程,以确保预测的稳健性和模型的泛化能力,引入了有影响力的特征和真实数据选择策略。这导致了一个具有不确定性估计的稳健映射工具,并通过基于Shapley值的特征重要性分析来支持可解释性和物理意义。我们的方法利用了来自168个FLUXNET站点的数据、NASA POWER气象再分析以及MODIS卫星观测数据来训练CatBoost梯度提升模型。该模型在预测月度净生态系统交换(NEE)值方面的准确率为0.76,具有较高的空间-时间一致性,为全面评估陆地生态系统碳动态提供了可能性。

引言

理解和量化陆地生态系统与大气之间的碳通量对于评估环境变化下的生态系统功能以及减轻人类活动对气候及其对各种经济部门的影响至关重要(Tol, 2018)。净生态系统交换(NEE)是这些通量的关键指标,代表了通过光合作用吸收的碳与通过呼吸作用和分解释放的碳之间的平衡(Baldocchi, 2003)。
目前,用于评估地球表面与大气之间CO通量的方法数量有限。主要的原位观测方法是涡度协方差法,它允许在覆盖和地形或水域均匀的几公顷或更大面积的土地上直接连续测量垂直热通量、温室气体(GHGs)和气溶胶(Aubinet et al., 2012)。该技术基于高频(10–20 Hz)测量风速的水平 and 垂直分量、温度特性、湿度以及大气气体和气溶胶的浓度。专门的测量设备使得这些高频测量成为可能,从而提供了关于局部碳通量动态的详细见解。
尽管涡度协方差法提供了高时间分辨率和直接测量,但其空间覆盖范围有限,因此在大范围内准确测量和估计NEE仍然具有挑战性。
为了解决这一限制,人们开发了生物地球化学模型作为估计较大区域NEE通量的有效方法(Huntzinger et al., 2012)。这些模型基于关于景观覆盖特性、天气条件和其他环境因素的数据来模拟碳通量。生物地球化学模型可以考虑植被和土壤覆盖中发生的各种过程,包括光合作用、植物和微生物的呼吸作用、土壤和枯落物中有机物的分解,以及土壤-植被-大气系统中的相互作用(Cronan, 2017, Berardi et al., 2020)。最终,生物地球化学模型在验证和交叉检查其他估计方法(包括基于卫星的方法和数据驱动模型)方面发挥着关键作用(Schwalm et al., 2010)。然而,由于其物理意义的高度精确性,生物地球化学模型可能难以捕捉到细微的异质性,并需要大量的参数化(Dietze et al., 2014)。因此,它们在基础研究应用以及实际应用中的适用性受到限制,需要进一步扩展。
近年来,机器学习(ML)方法作为建模和预测NEE通量的强大工具而出现(Tramontana et al., 2016, Jung et al., 2017, Reichstein et al., 2019)。将ML技术(包括经典和深度学习算法)与涡度协方差数据、遥感观测和气候模型输出相结合,有潜力显著提高我们分析不同地区和尺度上碳封存和释放复杂过程的能力。几项关键研究在应用ML进行碳通量估计方面取得了显著进展。随机森林(RF)算法已被用于全球范围内升级FLUXNET 2015的测量结果,NEE、总初级生产力(GPP)和生态系统呼吸(RECO)的预测准确率分别达到了0.94(Zeng et al., 2020)。引入了一种元学习方法,使用元训练的深度学习模型集合开发了MetaFlux数据集。这种创新方法显著改善了数据稀疏区域(特别是在热带和半干旱地区)的碳通量估计,填补了全球碳循环建模中的一个关键空白(Nathaniel et al., 2023)。
ML的应用已扩展到草地和农田,使用了人工神经网络(ANN)和一种新的优化与遗传算法和傅里叶级数(IOGAFS)集成模型(Kheradmand et al., 2023)。这种方法实现的值高达0.88,展示了在数据可用性有限的地区开发成本效益高的通量塔替代方案的潜力。大气CO浓度已被纳入ANN模型,提高了生态系统对环境变化响应的检测能力(Liu et al., 2016)。这项研究强调了在碳通量建模中考虑动态环境因素的必要性。
已经探索了循环神经网络(RNN)在捕捉时间动态方面的潜力,使用RNN和LSTM网络对与地表变量相关的动态时间序列数据进行建模(Reichstein et al., 2019)。这种方法优于传统的回归方法,表明在碳通量建模中考虑时间依赖性的重要性。
为了进一步推进这一领域,提出了一种深度卷积神经网络(CNN)模型,用于估计全球年度森林GPP和NEE(Wu et al., 2019)。该模型在Google Earth Engine平台上实现,与FLUXNET记录高度一致,并且优于传统的ML模型和中分辨率成像光谱辐射计(MODIS)产品。对神经网络方法的比较分析表明,LSTM模型在通过GPP预测NEE方面表现特别好,达到了约0.78的
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号