半监督机器学习在山地植被制图中的应用:结合PlanetScope影像数据以及气候和地形梯度信息,以刻画肯尼亚山山地生态系统中短期土地覆盖变化特征

《Remote Sensing Applications: Society and Environment》:Semi-supervised machine learning for montane vegetation mapping: Integrating PlanetScope imagery with climatic and topographic gradients to characterize short-term land cover transitions in Mount Kenya’s montane ecosystems

【字体: 时间:2026年01月20日 来源:Remote Sensing Applications: Society and Environment 3.8

编辑推荐:

  半监督机器学习框架结合高分辨率遥感与地形气候数据,揭示肯尼亚山地植被动态变化及驱动机制,分类精度达93.5%。

  
文森特·奥格韦诺(Vincent Ogweno)|内森·摩尔(Nathan Moore)|杰夫·安德烈森(Jeff Andresen)
密歇根州立大学地理、环境与空间科学系,美国密歇根州东兰辛市Auditorium Road 673号,邮编48824

摘要

肯尼亚山的山地生态系统正面临日益加剧的气候变化和人为压力,这要求我们建立可扩展的监测框架,以实现基于证据的保护措施。传统的监督学习分类方法在处理植被碎片化、参考数据有限以及地形复杂的情况下存在困难。我们开发了一种半监督机器学习(SSML)框架,该框架结合了高分辨率的PlanetScope NICFI影像(4.77米)、地形衍生数据(NASADEM)和气候变量(ERA5-Land),用于分析2017–2019年和2021–2023年间的植被变化及土地覆盖类型转换。
从可见光和红边波段衍生出的光谱指数——红边归一化植被指数(RENDVI)和红绿比指数(RGRI),即使在没有近红外波段的情况下,也能有效区分植被胁迫和生物量异质性。时间对比特意排除了2020年数据,以隔离稳定的气候状况,避免厄尔尼诺-南方涛动(ENSO)和印度洋偶极子(IOD)相位变化对植被状态的干扰。
SSML框架的整体准确率达到93.5%,数量不一致性仅为48像素,分配不一致性为3465像素。高海拔地区(如竹林和雪地)表现出相对稳定性,而低海拔的农业/混合植被减少了7.8%,稀疏植被和裸土面积增加了5.6%,这反映了2021–2023年拉尼娜现象期间土地利用强度的增加和气候变化的影响。
本研究表明,将高分辨率遥感技术、半监督学习和多分辨率环境预测因子相结合,可以在数据稀缺的山地地区实现可靠的植被监测。这种方法为全球热带山地生态系统的适应性保护规划和气候适应型土地管理策略提供了实用见解。

引言

全球范围内,山地生态系统覆盖了地球陆地表面的约27%,支撑着世界15%的人口,并为近一半的人类提供关键的生态系统服务(K?rner, 2024)。由于农业扩张、城市化和气候变化导致的植被分布变化,山地地区的土地利用和土地覆盖(LULC)变化正在加速(Zhao et al., 2025, Christmann and Menor, 2021)。在热带山地系统中,这些压力尤为严重,因为低地人口密度高,且生物多样性集中在狭窄的海拔带内(Hemp, 2006, Parracciani et al., 2023)。肯尼亚山是非洲第二高峰,海拔5199米,它正是这些全球性挑战的典型例子,其不同生态带同时受到人为活动和气候变化的严重影响。
肯尼亚山是一个重要的生物多样性热点和生态资产,多样的气候带支持着丰富的植物物种,并提供关键生态系统服务,如水分调节、碳封存和重要的野生动物栖息地(Downing et al., 2023, Adimo et al., 2011, Jacob et al., 2015, Cavanagh, 2018)。然而,这些山地生态系统正面临日益严重的人为威胁,包括森林砍伐、农业扩张和过度放牧,以及导致降水模式和温度变化的气候变化(Rotich and Ojwang, 2021, Downing et al., 2023, Zhao et al., 2023)。该地区的土地利用和土地覆盖变化已被广泛记录,主要是由农业扩张和人类定居点向森林地区的扩展所驱动(Eckert et al., 2017, Njora and Y?lmaz, 2022, Cavanagh, 2018)。这些压力导致栖息地破碎化、土壤侵蚀和生物多样性丧失,削弱了该地区的长期生态可持续性(Young and Peacock, 1992, K?rner, 2005, Hemp, 2006, Bewket and Abebe, 2013)。气候变化通过影响植被物候、改变水文循环和降低生态系统韧性,加剧了这些挑战(Omambia et al., 2012, Cavanagh, 2018, Zafar et al., 2025)。这些因素的相互作用凸显了需要数据驱动的保护和适应性管理策略,以综合考虑环境和人为因素。
森林砍伐、水资源可用性和生态系统完整性之间的关系表明,在山地环境中采取整体性的保护和土地管理方法是必要的。研究表明,森林砍伐会破坏水文循环,改变径流模式和地下水补给率,进而影响植被分布和生态系统健康(Bonan and Doney, 2018, Balana et al., 2011, Nyingi et al., 2013, Tarkeshdouz et al., 2021)。正如印度河上游高海拔流域的积雪覆盖与径流之间的紧密耦合关系(Zafar et al., 2025)一样,肯尼亚山的植被变化反映了通过降水变化和蒸散需求介导的水文-气候相互作用。然而,传统的监测技术往往无法捕捉这些复杂相互作用,因此需要采用能够整合多维环境梯度的遥感和机器学习分析方法。
遥感和机器学习(ML)的进步为多空间和时间尺度的植被动态监测提供了变革性的可能性(Paliwal et al., 2024, Ojwang et al., 2024, Han et al., 2025)。高分辨率卫星影像、云计算平台(如Google Earth Engine(GEE)和机器学习算法彻底改变了复杂景观中的植被制图(Liu, 2024, Zheng et al., 2024, Hermosilla et al., 2022)。传统的监督学习分类方法需要大量的地面真实数据,在山地环境中往往因植被异质性高、地形坡度陡峭和微气候条件多变而难以应用(Hemp, 2009, Young and Peacock, 1992, Vijayakumar et al., 2024)。实证证据表明,整合辅助变量(如坡度、朝向、距离指标和纹理)可以显著提高分类准确性,在南非异质景观中效果提升5%–6%(McNemar p < 0.05)(Shandu et al., 2025)。随机森林(RF)分类器对标签噪声和多重共线性具有很强的鲁棒性,在多传感器设置中始终优于其他算法(Zafar et al., 2024)。这些挑战凸显了需要数据高效的分类方法,以在减少对标记训练数据依赖的同时提高准确性。
半监督机器学习(SSML)通过利用标记和未标记数据来克服这些限制,从而在数据稀缺、空间异质性强的景观中提高分类准确性和鲁棒性(Banerjee and Buddhiraju, 2015, Tao et al., 2020, Zhao et al., 2023)。与纯监督方法不同,SSML采用基于置信度的迭代样本增强技术,逐步扩展训练数据集;这种方法与自我监督的深度学习协议一致,在城市和生态学研究中已被证明有效(Roy et al., 2025, Kim et al., 2022)。这些技术特别适合山地生态系统,能够检测不同植被类别中的细微光谱变化,并在不同土地覆盖类型间实现有效的泛化(Roy et al., 2025, Wakulińska and Marcinkowska-Ochtyra, 2020)。最新研究表明,通过对训练样本的严格筛选并结合人工验证,可以将整体准确率提高6%–9%(Hermosilla et al., 2022)。
尽管有这些优势,SSML在山地植被制图中的应用仍不充分。大多数研究仍依赖传统监督技术,很少有研究系统评估高分辨率卫星数据衍生的光谱指数如何提高山地环境中的分类准确性(Matyukira and Mhangara, 2024, Dubovyk et al., 2015, Zoungrana et al., 2014)。如红边归一化植被指数(RENDVI)和红绿比指数(RGRI)等光谱指数,可以从PlanetScope的四波段配置中计算得出,为高海拔地区的植被健康和生物量评估提供了有前景的替代方法(Chivasa et al., 2017, Imran et al., 2020)。此外,单一植被指数无法捕捉水分胁迫的多个维度;结合光谱、热力和气候指标的多指数干旱框架能更全面地诊断植被胁迫和生态转换(Zhao et al., 2025, Duan et al., 2025)。
本研究在Google Earth Engine中开发了一个半监督分类框架,用于分析2017至2023年间肯尼亚山山地生态系统的植被动态。具体而言,我们(1)使用高分辨率PlanetScope NICFI影像结合RENDVI和RGRI光谱指数对主要植被类型进行分类和制图;(2)评估2017–2019年和2021–2023年间的短期植被变化,量化山地森林、竹林和混合植被区的变化,并识别潜在的土地覆盖转换驱动因素;(3)通过整合ERA5-Land气候再分析数据,分析气候变率对植被动态的影响,重点关注ENSO和印度洋偶极子(IOD)对降水和温度模式的影响;(4)通过评估不同植被类别的分类准确性和特征重要性,评估半监督分类技术在异质山地环境中的有效性。
通过实现这些目标,本研究推进了高分辨率遥感和半监督机器学习在高山热带山地生态系统植被监测中的应用。将基于数据的监测方法嵌入恢复框架中,对于应对水文变化和土地利用强度增加的热带山地生态系统至关重要(Christmann and Menor, 2021),确保空间分析能够为韧性规划提供有意义的依据。研究结果为土地覆盖变化、气候-植被相互作用和分类改进提供了定量见解,支持基于证据的保护政策、可持续的土地利用管理和适应气候变化的战略,适用于肯尼亚山及全球类似的山地地区。

研究区域

肯尼亚山位于南纬0°09′、东经37°18′,海拔5199米(图1)。这座已灭绝的成层火山在310万至260万年前处于活跃状态,最初估计其高度约为6500米,后因冰川作用和侵蚀作用形成了目前的形态(Liu et al., 2012)。研究区域涵盖了六个与肯尼亚山接壤的县:Meru、Nyeri、Tharaka Nithi、Embu、Kirinyaga等。

结果

结合高分辨率PlanetScope NICFI影像、地形衍生数据和ERA5-Land气候数据的分类框架揭示了2017–2019年和2021–2023年间肯尼亚山山地生态系统中的空间连贯的植被模式和可量化的土地覆盖变化。结果包括方法学验证(模型调整、准确性评估)、气候分析、分类输出和变化动态。

讨论

本研究证明,半监督机器学习(SSML)结合高分辨率PlanetScope影像、地形衍生数据和ERA5-Land气候再分析,能够在肯尼亚山复杂的生态梯度上进行可靠的植被监测。93.5%的整体准确率、较低的数量不一致性(48像素,1.4%)和可解释的分配不一致性(3465像素,98.6%)证实了该框架在区分不同植被类别方面的有效性。

结论

本研究通过将半监督机器学习与高分辨率PlanetScope影像、地形衍生数据和ERA5-Land气候再分析相结合,在可复制的Google Earth Engine框架中实现了数据稀缺的热带山地生态系统的植被监测。93.5%的分类准确率,以及特征重要性分析显示海拔(28.4%)和RENDVI(22.1%)是主要的区分因素,验证了多维度预测因子的整合效果。

作者贡献声明

文森特·奥格韦诺(Vincent Ogweno):撰写初稿、可视化、软件开发、方法论设计、数据整理、概念构建。内森·摩尔(Nathan Moore):审稿与编辑、监督、概念构建。杰夫·安德烈森(Jeff Andresen):监督、数据整理。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。
所有作者均已阅读并批准最终稿件,确认不存在需要披露的利益冲突。
本研究未获得公共、商业或非营利部门的任何特定资助,除了来自Great Lakes Integrated Sciences and Assessments的一般支持。
致谢
作者感谢他们的科学网络在研究过程中的支持和帮助,特别是第一作者感谢导师杰弗里·安德烈森(Jeffrey Andresen)在利用气候数据进行短期植被动态研究方面的出色指导,以及GLISA NOOA CAP/RISA项目在本研究期间及之后的财务支持。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号