融合多源遥感与气候数据:基于可解释深度学习的森林地上生物量估算及其生态驱动机制分析

《Trees, Forests and People》:Explaining Ecological Drivers and Management Implications of Forest Biomass: An Explainable Deep Learning Fusion of Remote Sensing and Climate Data

【字体: 时间:2026年01月09日 来源:Trees, Forests and People 2.7

编辑推荐:

  本研究针对传统遥感方法在森林地上生物量(AGB)估算中依赖单一数据类型、可解释性不足的问题,提出了一种融合多传感器遥感(Sentinel-1 SAR、Sentinel-2和Landsat-8光学数据)、过程性气候变量(Climate-FVS)和LiDAR地形指数的深度学习新框架。通过结合可解释AI(XAI)分析,该研究不仅提升了预测精度(最优模型U-Net3+的RMSE为28.10 Mg/ha,R2为0.89),还揭示了降水、温度及短波红外波段等生态驱动因子的相对贡献,为碳核算和可持续森林管理提供了精准、透明的技术支撑。

  
森林,作为地球上最大且最重要的自然生态系统之一,在维持生态稳定和长期生物演化中扮演着核心角色。然而,人类活动正通过直接的土地利用变化以及温室气体排放和气候变化对生态系统结构与功能的间接影响,日益干扰着森林的碳循环。因此,准确估算森林地上生物量(Above-Ground Biomass, AGB)对于量化森林碳储量和评估气候变化条件下的生态系统健康至关重要。可靠的AGB信息还支撑着广泛的应用,包括可持续森林管理、商业资源规划、碳核算以及预测生态系统对气候变化的响应。
传统的AGB估算最准确的方法依赖于异速生长方程,但这些方程具有物种和地区特异性,并且需要大量的野外调查,这使得大范围的AGB评估既耗时又费力,尤其是在茂密或难以进入的森林环境中。此外,在许多林区,所需的物种特异性异速生长方程并不存在,而异质性森林使得收集足够的野外数据在统计上十分困难。遥感技术提供了有效的替代方案,其广阔的空间覆盖和重复的时间观测有助于克服这些限制。机器学习和近年来兴起的深度学习模型(如U-Net)在从遥感数据估算AGB方面显示出巨大潜力。鉴于AGB受到广泛生物物理和环境变量的影响,其准确评估需要具备多样化和互补能力的传感器。
用于AGB估算的遥感传感器通常分为激光雷达(LiDAR)、光学和合成孔径雷达(SAR)系统。机载LiDAR可提供森林结构的高精度测量,但因其采集成本高而时间分辨率有限;星载LiDAR系统(如GEDI)时间覆盖更好,但受限于粗糙的空间采样。光学传感器(如Sentinel-2和Landsat 8)提供用于植被监测的高空间分辨率多光谱影像,但其对天气和光照条件的依赖性降低了时间一致性,且其被动特性阻碍了对冠层下结构的观测。SAR传感器通过提供全天候、昼夜不停的观测以及穿透茂密植被层的能力,克服了许多这些限制,使其在获取与AGB估算相关的三维结构信息方面具有重要价值。
传感器融合被广泛提出以克服单个遥感系统的局限性并利用其互补优势。通过整合LiDAR的结构穿透能力、SAR的时间可靠性以及光学影像的光谱丰富性,融合方法可以显著提高AGB估算的准确性和完整性。然而,较少有研究系统性地检验单个传感器的纳入或排除对整体性能的贡献,每种模态在提高AGB估算准确性中的具体作用仍未得到充分探索。
将多个传感器集成后,为AGB估算模型提供了更全面的输入数据,利用先进的机器学习算法,特别是深度学习模型,可以显著提高AGB估算的准确性。近年来,机器学习算法在准确估算AGB方面发挥了重要作用。然而,现有的许多研究仍主要依赖于经典的机器学习方法,深度学习架构的全部潜力尚未得到充分探索。经典模型(如随机森林和支持向量回归)严重依赖特征工程,这是一个耗时且基于假设的过程,可能限制其泛化能力,尤其是在具有非线性关系的复杂森林生态系统中。此类手工制作的特征可能引入偏差或忽略细微模式,从而制约预测性能。
深度学习模型,特别是卷积神经网络(CNNs),通过从原始遥感影像中自动提取信息特征并捕捉增强AGB估算准确性的复杂非线性模式,解决了经典方法的局限性。将多源数据集集成到这些架构中可以进一步增强泛化能力和预测性能。基于U-Net的模型是用于生物量估算最广泛使用的深度学习框架之一。然而,这些研究主要依赖于传感器影像本身,深度学习模型与其他有影响力的参数(如气候变量)的相互作用仍未得到充分探索。
气候因素(如降水和温度)强烈影响树木生长并驱动AGB的空间变异。地形特征(包括坡度和坡向)也影响生物量分布。然而,许多先前的研究并未充分检验这些参数对AGB估算的贡献。考虑到降水、温度和地形直接影响植物生长和生物量积累,对这些因素评估不足可能会限制此类方法在不同环境条件下的普适性。
总体而言,有限的AGB估算深度学习研究很大程度上仅依赖于卫星影像,气候和地形变量在模型设计或评估中很少受到关注。因此,在理解模型可解释性和评估不同输入参数如何影响深度学习性能方面仍然存在主要的研究空白。
鉴于深度学习模型依赖多样化的多源输入进行准确的AGB估算,使用可解释人工智能(Explainable Artificial Intelligence, XAI)对于阐明其决策过程至关重要。虽然基于U-Net的深度学习架构在从遥感数据提取空间和复杂特征方面表现出强大性能,但其“黑箱”性质限制了透明度。现有的AGB相关研究尚未将XAI应用于深度学习模型,阻碍了对预测有效性或影响模型行为因素的清晰评估。
在此背景下,本研究的主要目标是开发一个框架,该框架集成多源卫星影像、气候参数和地形指数,以实现准确的AGB估算,同时克服异速生长方程和经典机器学习方法的局限性。本研究的一个核心创新是融合多源遥感数据,包括光学影像(Sentinel-2, Landsat 8)和SAR观测(Sentinel-1),以构建捕捉森林生态系统多维特征的综合输入层。将气候变量(如降水和温度)与地形指数(如坡度和坡向)相结合,进一步增强了模型表征环境对树木生长和AGB动态控制的能力。另一个目标是评估修改或移除气候变量如何影响预测准确性,从而评估模型对这些参数的敏感性。采用深度学习架构为难以捕捉复杂非线性相互作用的经典方法提供了强大的替代方案。为了提高透明度和可解释性,将使用XAI方法(如基于梯度和基于排列的重要性度量)来揭示每个输入特征对AGB预测的贡献。这一解释层使得能够更清晰地理解模型的优势和局限性,并支持建模框架的改进。最终,分析遥感输入与气候因素之间的相互作用,结合多源数据融合,为开发高精度AGB估算模型提供了一个整体的、无偏的方法。
本研究旨在为参与森林管理和气候减缓的自然资源管理者和政策制定者提供一个精确、灵活和可扩展的框架。与先前主要依赖光学和SAR观测的生物量研究不同,这项工作引入了一种集成的深度学习方法,系统性地结合了多传感器遥感数据与Climate-FVS气候变量和地形指数。通过将可解释AI(XAI)纳入融合框架,该研究在提高AGB估算准确性的同时,也阐明了生态驱动因子(如降水、温度和关键光谱波段)的相对重要性。这种对性能和可解释性的双重关注,为环境应用提供了方法论进展和生态学见解,支持开发透明且可信的AGB估算系统。
关键技术方法概述
为开展研究,研究人员首先通过Google Earth Engine(GEE)平台收集了Sentinel-1 SAR、Sentinel-2和Landsat 8 OLI等遥感数据,以及来自USGS 3DEP计划的LiDAR衍生的地形指数(坡度和aspect)和来自Climate-FVS模型的气候变量(如平均年降水量、生长季降水、最高/最低温度等),构建了一个包含31个波段的综合数据集。所有数据统一空间参考系统(EPSG:5072)并重采样至30米分辨率与AGB参考图对齐。研究采用了七种基于U-Net的深度学习架构(包括U-Net、V-Net、Attention U-Net、U-Net3+、TransU-Net、SWIN U-Net和ResU-Net)进行模型训练与比较。模型输入为128×128像素的影像块,使用Adam优化器(学习率10??)和均方误差(MSE)损失函数进行训练,并以均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2)评估性能。研究设计了三种渐进的数据融合场景(S1+S2; S1+S2+CM+T; S1+S2+CM+T+LS8)以评估不同数据源的贡献。最终,利用梯度重要性和排列重要性等XAI技术对训练好的模型进行解释,分析各输入特征的相对贡献。
研究结果
5.1. 基于Sentinel-1和Sentinel-2融合的U-Net AGB估算结果
使用仅包含Sentinel-2光学和Sentinel-1 SAR共15个波段的第一个场景进行评估,结果表明,利用多尺度结构和注意力机制的更先进模型比基础U-Net架构实现了更高的精度。具体而言,U-Net3+架构在训练和测试阶段的RMSE分别为32.04 Mg/ha和30.66 Mg/ha,表现出优于其他模型的精度,并且在面对未见数据时展现出更好的稳定性。Attention U-Net和TransU-Net模型也通过利用注意力机制和Transformer架构,为提取植被特征提供了更有效和精确的结构。
5.2. 气候数据对AGB估算的影响
在第二个融合场景(S1+S2+CM+T)中,除了之前的15个波段,还加入了7个气候参数和2个地形参数。评估结果表明,在纳入气候和地形数据后,大多数模型的预测准确性得到了一致性提升。在此场景下,U-Net3+模型再次表现出最佳性能,测试RMSE为29.46 Mg/ha,测试MAE为18.51 Mg/ha。气候参数和地形指数的加入使U-Net3+模型的RMSE性能提升了约3.9%,MAE提升了约5.1%。
5.3. 多传感器融合对AGB估算的影响
在第三个场景(S1+S2+CM+T+LS8)中,在第二个场景的基础上增加了Landsat 8的7个光学波段,进行全面的融合。基于第二个场景的准确性评估指标,筛选出表现前三的架构(TransU-Net, U-Net3+, 和 Attention U-Net)应用于此场景。U-Net3+模型取得了最佳性能,测试R2达到0.89,RMSE为28.15 Mg/ha,MAE为17.49 Mg/ha。
5.4. 基于XAI技术的AGB估算特征重要性分析
使用基于梯度和随机排列两种标准XAI技术评估特征重要性。结果表明,光学数据,特别是Sentinel-2和Landsat-8的波段,在模型学习过程中扮演了关键角色。在两种分析框架中,这些源获得了最高的重要性分数,而雷达(SAR)和气候(FVS)数据贡献较小,排名靠后。更详细的基于梯度的检查显示,可见光和短波波段(如Sentinel-2的卷云、红光和海岸波段,以及两种传感器的SWIR1和SWIR2波段)对模型的决策结构影响最大。
6.1. U-Net3+和Attention U-Net模型AGB预测准确性和误差模式的空间分析
对预测图和误差图的空间分析揭示了重要的模式。最大的误差幅度主要出现在森林覆盖与开阔地或农业区的边界处。这表明模型在准确描绘异质土地覆盖边界方面遇到困难。相比之下,在植被均匀的茂密森林核心区域,模型误差显著较低。在农业或转化土地利用区,误差幅度较高。在具有剧烈地形起伏的区域(如狭窄山谷或陡峭山坡),误差也有所增加。
6.2. 泛化能力与空间独立性
采用“留出一个区域”的地理独立实验评估模型的泛化能力。在随机分割下,U-Net3+模型在测试集上表现出RMSE为29.46 Mg/ha,R2为0.87。然而,在地理独立的测试区域进行评估时,RMSE增加至37.90 Mg/ha,R2降至0.80。性能的下降符合预期,并凸显了局部空间结构和自相关在随机采样框架下对模型精度的影响程度。
6.3. 对大气效应的鲁棒性及对模型可解释性的启示
使用大气校正后的(BOA)Sentinel-2影像进行评估。比较结果表明,在大气校正后,整体预测性能保持稳定。U-Net3+的测试RMSE值仅显示 modest 变化(TOA为37.90 Mg/ha,BOA为38.89 Mg/ha),而R2值保持可比性。在特征归因模式上观察到更明显的差异。在TOA实验中,蓝光和海岸气溶胶波段在两种XAI分析中均显示出高重要性。应用大气校正后,这些波段的相对重要性显著降低。
6.5. 经典机器学习模型与深度学习架构的性能比较
使用相同的多源输入特征对两种经典机器学习模型(随机森林和XGBoost)进行了实现和评估。评估表明,两种经典模型实现的准确性明显低于深度学习架构。XGBoost产生的RMSE为55.09 Mg/ha,R2为0.57,而随机森林实现的RMSE为52.67 Mg/ha,R2为0.61。这些值明显弱于在相同输入条件下基于U-Net的模型获得的结果。
研究结论与讨论
本研究通过设计三种不同的数据融合场景(从简单的Sentinel-1和Sentinel-2结合,到完整集成光学、SAR、气候和地形数据)并测试七种不同的基于U-Net的深度学习架构,证明了多源数据融合和多尺度深度网络的应用为准确估算森林地上生物量提供了稳健的基础。模型比较突出了U-Net3+和Attention U-Net等架构的优越性;它们的全尺度跳跃连接和注意力门分别使得能够同时学习局部森林纹理、全局冠层模式和空间异质性,在最终场景中将RMSE降低至约28 Mg ha?1。
此外,使用梯度和排列框架的特征重要性分析确认了来自Sentinel-2和Landsat 8传感器的红、近红外和短波红外波段的主导作用。分析还揭示,气候指数(特别是生长季降水、最暖月最高温度和无霜期长度)降低了预测误差,特别是在更崎岖地形和湿润气候区。同时,Sentinel-1的C波段后向散射在区分具有不同冠层结构的区域方面扮演了次要但补充性的角色,这是由于其在中茂密森林中有限的穿透能力和信号饱和。
对误差图的检查确定了森林-非森林边界、阴影山谷区域和相邻农业地块是模型偏差的主要来源,在这些地方光谱反射率的突变增加了误差。短波红外波段与坡度和坡向信息的集成有助于减轻其中一些误差。海岸和卷云波段的加入——尽管最初被认为主要是大气校正工具——在实践中允许模型学习由水蒸气和气溶胶引起的模式,并隐式地尝试消除其影响。这种学习也防止了在薄雾或薄云遮蔽的像元中高估生物量——这一发现在U-Net3+的梯度分析和Attention U-Net的注意力门的自适应能力中清晰可辨。
总之,本研究的结果表明,多源遥感数据和气候参数的协同作用,结合可解释的、多尺度的深度学习架构,为生成准确可靠的森林生物量图提供了一条稳健的途径。此类地图对于在区域和国家尺度计算碳储存、评估REDD+项目以及实施气候适应性管理策略至关重要。
局限性与未来方向
尽管取得了这些进展,仍需承认几个局限性。Climate-FVS数据4公里的空间分辨率仍不足以表征精细尺度的微气候变异性。因此,降尺度方法或使用原生高分辨率气候产品对于未来的改进至关重要。此外,参考AGB地图和完整多传感器影像的可用性仅限于2016年夏季,阻碍了实施时间留出实验。因此,无法评估模型跨年份或季节的泛化能力,未来的研究将受益于多年或多季节生物量数据集以评估时间鲁棒性。而且,基于Transformer的架构的计算需求对于大规模或业务化监测仍然是一个实际挑战。未来的工作可以通过应用气候降尺度、探索跨区域和时间段的迁移学习、集成LiDAR和即将到来的P波段SAR任务(如ESA的BIOMASS),以及开发先进的XAI策略来更好地表征地上生物量的季节和年际动态,从而解决这些局限性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号