融合时间序列遥感数据与多算法聚类分层(Clustering Stratification)的森林碳储量(Carbon Storage / Carbon Stock)建模方法研究

《Trees, Forests and People》:Research on forest carbon storage modeling method integrating time series remote sensing data and multi-algorithm clustering stratification

【字体: 时间:2026年06月01日 来源:Trees, Forests and People 2.7

编辑推荐:

  已有研究大多聚焦于单一算法,关于不同无监督聚类(Unsupervised Clustering)算法对森林碳储量估算精度提升作用的研究仍不充分。为此,研究人员基于滇西北区域1997—2017年五期连续森林调查数据集与Landsat遥感影像,结合归一化植被指数(

  
已有研究大多聚焦于单一算法,关于不同无监督聚类(Unsupervised Clustering)算法对森林碳储量估算精度提升作用的研究仍不充分。为此,研究人员基于滇西北区域1997—2017年五期连续森林调查数据集与Landsat遥感影像,结合归一化植被指数(Normalized Difference Vegetation Index, NDVI)时间序列,分别采用K-Means聚类(K-Means Clustering, K-Means)、高斯混合模型(Gaussian Mixture Model, GMM)及自组织映射(Self-Organizing Map, SOM)进行聚类分层,并应用随机森林(Random Forest, RF)构建森林碳储量估算模型。结果表明:(1)年均NDVI于2013年达最大值0.71,2010年最低为0.53,整体呈稳定上升趋势,平均增长率0.006/a。(2)基于NDVI时序特征的聚类产生互不重叠的分层,SOM算法五个时序特征的平均轮廓系数(Silhouette Coefficient, SC)均高于其余算法;经主成分分析(Principal Component Analysis, PCA)降维可视化,K-Means与SOM的聚类紧致度优于GMM,SOM的SC(0.418)与戴维森堡丁指数(Davies–Bouldin Index, DB)(0.935)均优于K-Means和GMM。(3)基于SOM分层的随机森林模型精度最高,决定系数(Coefficient of Determination, R2)为0.90,均方根误差(Root Mean Square Error, RMSE)为3.19 t/hm2,相对均方根误差(relative RMSE, rRMSE)为34.69%,平均绝对误差(Mean Absolute Error, MAE)为2.05 t/hm2。NDVI时序特征结合SOM算法可在保证估算精度的同时降低对样本量的需求,从而减少成本与人力物力投入。
论文解读:《融合时间序列遥感数据与多算法聚类分层(Clustering Stratification)的森林碳储量(Carbon Storage / Carbon Stock)建模方法研究》
发表于《Trees, Forests and People》
【研究背景】
森林是陆地生态系统的重要组成部分,其碳循环调节功能对缓解气候变化至关重要,森林碳储量是评估生态系统固碳能力的核心指标。现有主流估算方法多依赖密集野外样地调查及基于林型、龄组或地形等静态环境因子的经验分层(Static Stratification),成本高耗时长,且难以捕捉森林生态系统时空异质性与动态变化过程,导致样本代表性不足、模型泛化能力弱。长时间序列光学遥感数据可反映植被指数(如归一化植被指数,Normalized Difference Vegetation Index, NDVI)的年际动态与季节振幅,NDVI时间序列(NDVI Time Series)蕴含植被覆盖与生态过程信息,适合识别具相似生态行为的林地单元。无监督聚类(Unsupervised Clustering)可从复杂高维森林数据中识别结构并归类,但已有研究多聚焦单一算法,缺乏K-Means聚类(K-Means Clustering, K-Means)、高斯混合模型(Gaussian Mixture Model, GMM)与自组织映射(Self-Organizing Map, SOM)等不同无监督聚类算法在森林碳储量估算中分层机制、稳定性及对最终模型精度影响的系统比较。滇西北位于横断山脉南段,地形复杂、垂直植被带谱完整,是西南地区重要碳汇功能区与生态安全屏障,受地形交通限制传统调查难实现全覆盖与高频监测,亟需高效精确的遥感监测方法。本研究以滇西北1997—2017年五期森林连续清查固定样地与Landsat遥感影像为基础,提取NDVI年际变化七项特征构成高维向量,分别用K-Means、GMM、SOM进行聚类分层并按比例抽样,再构建随机森林(Random Forest, RF)模型估算碳储量,系统比较三种聚类分层方案与非分层对照的估算精度,筛选最优算法并绘制2025年碳储量空间分布。
【主要技术方法概述】
研究人员选用云南省1997、2002、2007、2012、2017年五期森林资源连续清查272个固定样地(分布于滇西北),依据蓄积量—生物量转换模型(含各优势树种参数)与含碳系数计算样地碳储量(Carbon Storage, C, 单位t/hm2);在Google Earth Engine(GEE)平台获取同期Landsat TM/ETM+/OLI影像(云量<10%,取年中值合成)及数字高程模型(Digital Elevation Model, DEM, 30 m),提取样地对应像素NDVI值构建1997—2017年NDVI时间序列,计算均值(mean)、标准差(standard deviation, std)、最大值(max)、最小值(min)、极差(range)、斜率(slope)、变异系数(coefficient of variation, cv)共七项时序特征作为输入;同步提取6个原始波段、10种植被指数(含大气阻抗植被指数Atmospheric Resistant Vegetation Index, ARVI;增强植被指数Enhanced Vegetation Index, EVI;归一化水体指数Normalized Difference Water Index, NDWI等)、3项地形因子(海拔Elevation、坡度Slope、坡向Aspect)及3×3窗口下灰度共生矩阵Gray-Level Co-occurrence Matrix, GLCM纹理特征(均值Mean、方差Variance、同质性Homogeneity等共48个)作为建模因子;用肘部法则(Elbow Method)确定最佳聚类数K=3,分别以K-Means、GMM、SOM对NDVI时序七维特征聚类分层,每层按30%比例简单随机抽样(层内不足1补为1),设非分层随机抽样为对照;经Pearson相关分析与随机森林特征重要性排序筛选前6个最重要遥感因子,按80%训练、20%测试划分数据集建立随机森林回归模型,采用决定系数(Coefficient of Determination, R2)、均方根误差(Root Mean Square Error, RMSE)、相对均方根误差(relative RMSE, rRMSE)、平均绝对误差(Mean Absolute Error, MAE)评价精度,并以轮廓系数(Silhouette Coefficient, SC)、戴维森堡丁指数(Davies–Bouldin Index, DB)、Calinski–Harabasz指数(CH)评价聚类效果,经主成分分析(Principal Component Analysis, PCA)降至二维做可视化比较,最终基于最优SOM分层模型预测滇西北2025年森林碳储量空间分布。
【研究结果】
3.1 NDVI年际变化趋势分析
研究人员计算研究区1997—2017逐年平均NDVI,结果显示NDVI值在0.53~0.71间波动,2013年最高(0.71),2010年最低(0.53);整体呈稳定上升趋势,平均增长率0.006/a,各年份均>0.5表明滇西北植被覆盖总体良好,与区域生态环境改善趋势一致。
3.2 不同算法聚类对比分析
3.2.1 K值确定
以NDVI时序七特征输入三种算法,用肘部法则评估不同K值下簇内平方和(Within-cluster Sum of Squares, WCSS),K=2→3时WCSS降幅明显,K≥3后趋缓,拐点即最佳聚类数为K=3。
3.2.2 轮廓系数分析
计算各特征平均轮廓系数(SC),SOM在mean、max、min、cv、range五项特征上的平均SC均高于K-Means与GMM,std仅比K-Means低0.01;GMM六项特征平均SC均为三者最低,表明SOM对本研究数据聚类效果较优,GMM最差。
3.2.3 聚类中心比较
三算法均将样地分为三类:第1类平均NDVI最低(K-Means 0.4793、GMM 0.5217、SOM 0.4488),变异系数较小,对应低覆盖较稳定类型;第2类平均NDVI居中(K-Means 0.5896、GMM 0.5817、SOM 0.5879),std与cv最大,对应中等覆盖且年际波动大、可能受干扰或处于演替阶段;第3类平均NDVI最高(K-Means 0.6662、GMM 0.6687、SOM 0.6636),cv较低,对应高覆盖成熟林。三类划分与"退化—演替—成熟"森林生态阶段具一致性。
3.2.4 可视化分析
经PCA将七维特征降至二维作图,K-Means簇间分离清晰、簇内集中、重叠少;GMM簇边界模糊、重叠多、部分样本离散;SOM保持一定拓扑结构,簇间有分离但局部边界略重叠。K-Means与SOM聚类紧致度优于GMM。
3.2.5 聚类算法效果评价
综合指标:SOM的SC=0.418(最接近1)、DB=0.935(最小),K-Means的SC=0.416、DB=0.951、CH=173.1(最大),GMM的SC=0.352、DB=1.187、CH=129.8。SOM的SC与DB均优于K-Means与GMM,CH略低于K-Means但仅差2.4,综合判定SOM聚类效果最佳,GMM最差。
3.3 模型构建与验证
经Pearson相关与RF特征重要性筛选各方案前6个最重要遥感因子后建RF模型(训练集80%、测试集20%)。精度结果:未分层R2=0.77、RMSE=5.57 t/hm2、rRMSE=55.86%、MAE=3.32 t/hm2;K-Means分层R2=0.83、RMSE=4.19、rRMSE=44.70%、MAE=2.72;GMM分层R2=0.85、RMSE=4.43、rRMSE=42.84%、MAE=2.92;SOM分层R2=0.90、RMSE=3.19 t/hm2、rRMSE=34.69%、MAE=2.05 t/hm2。三种聚类分层精度均显著高于未分层,其中SOM分层RF模型精度最高。
3.4 森林碳储量预测
基于SOM分层筛选的前6个最重要因子建立RF模型,对滇西北2025年森林碳储量作空间估算,结果显示碳储量空间分布具显著异质性,总体北高南低并伴局部高值区:高碳储量区主要分布于迪庆、怒江北部高海拔山区,以云杉(Picea asperata Mast.)、冷杉(Tsuga chinensis (Franch.) E. Pritz.)等针叶林为主;中碳储量广泛分布于大理西北部、丽江北部及怒江南部,以针阔混交林为主;低碳储量分布于丽江南部、大理西南部,受人类活动干扰强、植被覆盖偏低。
【讨论与结论总结】
传统静态分层难反映森林动态生长过程,而NDVI长时序变化能综合体现气候、自然扰动与人类活动影响。本研究以NDVI年际变化特征(mean、std、cv、slope等)聚类分层实质是对森林生长轨迹与稳定性模式的识别,具明确生态学含义(低/中/高覆盖对应退化—演替—成熟)。三种无监督聚类中SOM因可捕捉非线性模式与局部相关性、通过竞争学习自适应识别植被类型连续梯度与空间异质性,其SC(0.418)、DB(0.935)综合评价最优。经SOM分层后RF模型R2达0.90,较未分层显著提升,证明NDVI时序聚类分层可优化样本空间分布代表性、增强模型对复杂山地异质性识别能力,且在保证精度前提下可减少所需样本量。2025年碳储量空间格局与已有研究吻合,印证该方法适用于复杂地形区森林碳汇监测。研究局限含固定样地代表性有限、聚类参数敏感性及仅用光学遥感NDVI时序,未来建议多源样地交叉验证、自适应参数优化及融合激光雷达(Light Detection and Ranging, LiDAR)、合成孔径雷达(Synthetic Aperture Radar, SAR)与更多敏感植被指数(如EVI、近红外反射率植被指数Near-infrared Reflectance of Vegetation, NIRv)以提升特征维度与生态指示意义。
结论翻译:(1) 1997—2017年滇西北年均NDVI 2013年最高(0.71)、2010年最低(0.53),整体呈稳定上升趋势,平均增长率0.006/a。(2) 基于NDVI时序特征的样地聚类分层可得互不重叠分层;SOM算法mean、max、min、cv、range五项特征平均轮廓系数均高于其余算法,经PCA可视化K-Means与SOM聚类效果优于GMM;SOM聚类结果SC=0.418、DB=0.935,两项指标均优于K-Means与GMM。(3) 随机森林模型中不同聚类分层数据均较未分层提升碳储量估算精度,其中SOM聚类分层数据所建模型精度最优,R2=0.90、RMSE=3.19 t/hm2、rRMSE=34.69%、MAE=2.05 t/hm2
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号