基于机器学习和多源数据融合的亚热带疏林草原结构属性与碳储量建模研究

《Trees, Forests and People》:Modeling structural attributes and carbon stock in subtropical wooded savannas using machine learning and multi-source data

【字体: 时间:2026年02月14日 来源:Trees, Forests and People 2.7

编辑推荐:

  本研究聚焦于面临土地利用变化威胁、但作为重要碳汇的亚热带疏林草原。为应对大规模评估需求,研究人员整合全球冠层高度模型(CHM)、高分辨率多光谱卫星数据和全球土壤数据集,利用机器学习算法对乌拉圭亚热带疏林草原的树木胸径(DBH)、平均高度(H)、最大高度(MAXH)和地上碳储量(AGC)进行了建模与全国尺度制图。结果表明,随机森林(RF)和梯度提升机(GBM)在多数指标上表现最优,数据融合有效提升了模型精度,所生成的地图为该生态系统的保护、监测和基于碳汇的可持续管理提供了宝贵的基线数据。

  
在全球气候变化与土地利用转变加剧的背景下,草原,尤其是那些点缀着疏落木本植被的疏林草原,扮演着至关重要的角色。它们不仅是生物多样性的热点区域,更是全球范围内不可忽视的碳汇,储存了约17%的地上碳。然而,这些生态系统正日益受到农业扩张和放牧系统转化的威胁,这不仅导致栖息地丧失,也加剧了二氧化碳的排放。位于南美洲的乌拉圭,其境内分布着约10万公顷的亚热带疏林草原,这些区域被视为优先保护对象,并在《巴黎协定》框架下被赋予气候减缓的期望。然而,要实现有效的保护和碳汇管理,一个首要的、基础的难题横亘在面前:如何快速、准确且大范围地评估这些广阔而稀疏的生态系统中,树木的结构特征(比如有多粗、多高)以及它们到底储存了多少碳?传统的野外调查方法耗时耗力,难以覆盖全国尺度。因此,开发一种能够整合新兴遥感技术与数据分析方法的高效评估工具,成为了迫切的需求。
为了回答上述问题,并填补乌拉圭在国家尺度上对该生态系统研究的空白,由Andrés Baietto领衔的研究团队在《Trees, Forests and People》上发表了一项开创性研究。他们首次尝试将Meta与世界资源研究所开发的1米分辨率全球冠层高度模型(CHM)、Planet Labs的RapidEye星座提供的5米分辨率多光谱数据,以及国际土壤参考和信息中心(ISRIC)的250米分辨率全球土壤数据集进行整合。利用这些多源数据作为输入,研究人员采用了四种机器学习算法——随机森林(RF)、支持向量机(SVM)、梯度提升机(GBM)和K近邻(KNN),旨在建立能够从遥感信息中准确反演实地测量参数的预测模型。他们的目标不仅仅是比较算法优劣,更要识别影响树木生长和碳积累的关键环境因子,并最终将最佳模型扩展到全国范围,绘制出乌拉圭亚热带疏林草原首幅高分辨率的结构属性与碳储量地图,同时评估预测的不确定性和空间适用性。
本研究主要应用了以下几项关键技术方法:首先,研究数据来源于乌拉圭国家森林清查的64个实地样地(200平方米),测量了所有树木的胸径和树高,并利用南美洲干旱林通用异速生长方程估算了单木生物量,进而通过转换因子得到地上碳储量(AGC)。其次,在遥感数据提取方面,对所有样地应用了5米的外扩缓冲区,以统一从高分辨率CHM(提取高度百分位数及纹理特征)、RapidEye多光谱影像(计算包括NDVI、NDRE等在内的10个植被指数)以及SoilGrids土壤数据(提取0-30厘米深度加权平均的砂粒、粉粒、粘粒、有机碳等属性)中提取特征值的方法。最后,在建模环节,采用了嵌套空间10折交叉验证框架,并结合前向特征选择方法筛选最优预测变量组合,以确保模型的稳健性和空间泛化能力。
3.1. 结构变量与碳储量建模
通过严谨的建模与验证流程,研究发现不同算法对不同变量的预测能力各异。对于胸径(DBH)、平均高度(H)和地上碳储量(AGC),随机森林(RF)表现最佳,其决定系数(R2)分别为0.44、0.59和0.51,均方根误差(RMSE)也最低。而对于最大高度(MAXH),梯度提升机(GBM)则以R2为0.59和RMSE为0.97米的成绩略胜一筹。模型普遍呈现出对低值高估、对高值低估的趋势,这反映了在数据范围两端进行预测的普遍挑战。尽管如此,其误差水平相对于该生态系统树木的实际尺寸范围而言是可接受的,为大规模监测提供了可靠的基线。
3.2. 消融研究
为了厘清不同数据源的贡献,研究进行了消融分析。结果清晰地表明,数据融合的策略至关重要。对于高度相关变量(H和MAXH),加入CHM数据能大幅提升预测精度,这印证了冠层高度模型在捕捉垂直结构信息方面的核心作用。然而,对于更为复杂的变量,如胸径(DBH)和地上碳储量(AGC),则需要多源信息的互补。例如,仅使用多光谱数据时,AGC的预测RMSE为10.28 Mg ha-1,而同时加入CHM和土壤数据后,RMSE显著降低至8.71 Mg ha-1。这证明土壤属性(如有机碳、质地)虽然本身预测力不强,但能提供关于站点肥力和水分条件的非冗余信息,与反映冠层状态的光谱和结构信息相结合,能更全面地解释树木生长和碳积累。
3.3. 全国尺度结构变量与地上碳储量制图
利用表现最佳的模型集合,研究首次生成了覆盖乌拉圭全国亚热带疏林草原的20×10米分辨率地图。通过“适用区域”分析,绝大部分地区(DBH覆盖97%,AGC覆盖91%)的预测被认为是可靠的。空间不确定性分析显示,预测误差在植被斑块边缘和高度异质的区域较高。最终地图揭示了一个重要的生态学模式:所有变量的像素值分布都呈现右偏态,即小树占主导,大树较少。全国平均估计值为:胸径9.63厘米,平均高度3.43米,最大高度4.56米,地上碳储量11.92 Mg ha-1
本研究成功构建了一个融合全球冠层高度模型、高分辨率多光谱影像和土壤属性的机器学习框架,首次实现了对乌拉圭亚热带疏林草原树木结构属性和碳储量的国家尺度、高精度估算与制图。结论部分强调,随机森林和梯度提升机在该类开放冠层生态系统的建模中表现出色。研究明确了不同数据源的独特贡献:冠层高度信息是预测树木高度的核心,而准确估算胸径和碳储量则需要光谱、结构和土壤环境数据的协同作用。特别是含有红边波段的多光谱指数(如NDRE)和土壤质地、有机碳等属性,虽然直接解释力有限,却是提升复杂属性预测精度的关键互补信息。
最终生成的全国地图不仅提供了宝贵的基线数据,其揭示的“以小型树木为主导”的右偏态分布结构,很可能反映了该生态系统历史上曾遭受过干扰(如选择性砍伐大型树木),这为理解其当前生态状态和恢复潜力提供了线索。这项研究的意义重大,它展示了一种利用日益普及的全球开源数据和先进机器学习方法,对复杂、稀疏植被生态系统进行高效、低成本监测的可行路径。所产出的空间明确的数据,能够直接服务于乌拉圭的生物多样性保护策略制定、生态系统变化监测,以及在《巴黎协定》和REDD+等框架下的碳汇核算与可持续森林管理实践,为全球类似生态系统的评估提供了可复制的技术范例。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号