《Smart Agricultural Technology》:An Integrated Spatiotemporal Modeling Approach for Forest Age Estimation Using Long-term Landsat Imagery and Repeated Survey Data
编辑推荐:
本研究针对当前森林林龄估算中存在的样本数据有限、单时相遥感依赖性高、以及建模过程中时空相关性考虑不足等问题,以思茅松(Pinus kesiya)为研究对象,创新性地整合了长达25年的重复样地调查数据和Landsat遥感影像,结合Boruta变量选择、INLA-SPDE(Integrated Nested Laplace Approximations - Stochastic Partial Differential Equations)和随机森林(Random Forest, RF)算法,构建了一套时空集成建模框架。研究发现,遥感影像纹理信息是林龄估算的关键变量,考虑数据的时空相关性可有效筛选变量并提高模型精度,最优方案下R2达0.8336,RMSE为6.5516年。该研究为基于长期重复调查数据的森林参数遥感反演提供了有效方法学支持,对区域森林资源动态监测与碳汇管理具有重要科学价值。
在郁郁葱葱的山林之间,一棵树的年龄不仅是它生命的刻度,更是衡量一片森林生态健康状况、评估其碳储存能力的关键标尺。森林年龄被定义为林分的平均年龄,它是影响生态系统碳储存的关键因素,不同年龄的林分在碳密度上存在显著差异,进而通过影响森林生态系统的碳循环在全球碳循环中扮演重要角色。精确估算区域森林年龄,对于可持续的森林管理,特别是在地形复杂的山区,至关重要。然而,获取大范围的森林年龄信息却是一个不小的挑战。传统方法,如树木年轮钻芯、测量胸径、查阅造林记录等,虽然可以提供精确信息,但费时费力,不适用于区域尺度的森林年龄制图。随着科技的发展,遥感技术为大尺度空间制图提供了可能。然而,目前大多数林龄估算研究往往基于有限的野外样地和单时相的遥感数据,未能充分利用长期重复调查数据,并且在建模过程中很少考虑数据的时空相关性,这限制了估算的精度和模型的普适性。为了填补这一空白,研究人员将目光投向了中国生物多样性最丰富的地区之一——云南省,并以当地常见的、也是主要造林树种之一的思茅松(Pinus kesiya)林为研究对象,展开了一项探索。
这篇发表在《Smart Agricultural Technology》上的研究,题为“An Integrated Spatiotemporal Modeling Approach for Forest Age Estimation Using Long-term Landsat Imagery and Repeated Survey Data”,旨在开发一种利用长期Landsat影像和重复野外调查数据估算森林年龄的有效方法,并特别关注数据时空相关性在建模过程中的作用。研究人员想知道,在估算森林年龄时,考虑遥感数据的时空关联性是否真的有必要?能否基于重复调查数据,为山区森林开发出一套更可靠的年龄估算方法?
为了回答这些问题,研究者们巧妙地整合了多项技术与数据。他们首先利用了来自国家森林资源连续清查的永久固定样地数据,这些数据覆盖了云南省普洱市的思茅松林,调查以5年为间隔持续进行,时间跨度从1992年到2017年,构成了一个珍贵的长期重复观测数据集。在遥感数据方面,研究通过谷歌地球引擎获取了与样地调查年份对应的、云量低于10%的Landsat Level-2 Tier 1影像,并进行了云掩膜和年际中值合成等预处理。在此基础上,他们提取了光谱波段、植被指数、主成分、缨帽变换以及多种窗口尺寸下的灰度共生矩阵纹理特征等五大类遥感变量。同时,还引入了地形、气候和土壤等多源环境数据集,所有数据统一至30米空间分辨率。在方法学上,研究采用了三步走的策略:首先,运用Boruta算法从海量的开放获取Landsat和环境数据集中筛选出对林龄估算重要的预测变量;然后,为了充分考虑数据的时空相关性,利用INLA-SPDE方法对这些变量进行精炼;最后,分别采用能够处理时空结构的INLA-SPDE模型和经典的随机森林模型来构建思茅松林的林龄估算模型,并通过十折交叉验证评估模型精度。
研究得出了一系列富有启发的结论,具体体现在以下几个方面:
3.1. 森林年龄估算的特征提取
研究表明,用于林龄估算的特征变量数量与所采用调查数据的时间跨度密切相关。当使用涵盖1992年至2017年共六期调查数据的方案时,筛选出的变量数量最多。其中,Landsat变量是思茅松林龄估算最重要的预测因子,且以灰度共生矩阵纹理度量为主。气候因子中,最干月降水量和反映气候变异性的变量占主导。地形变量主要是海拔和地形湿度指数。土壤变量则包括表层土壤的有效水容量、碳氮比以及亚表层土壤的粗碎屑含量和铝饱和度等。值得注意的是,通过INLA-SPDE算法进一步考虑时空相关性进行筛选后,变量数量显著减少,在六期数据方案中减少了56.25%,这说明时空关联性筛选能剔除那些在长期和空间尺度上不稳定的变量。
3.2. 森林年龄估算变量选择的异质性
通过比较不同变量组合方案下的模型精度,研究发现,对于所有三种变量组合方案,来自更长时间跨度的样本所衍生的变量都能带来更高的林龄估算模型精度。这表明长期重复调查提供的大样本数据能更好地捕捉森林年龄特征。在三种变量选择方法中,考虑了遥感因子时空相关性的变量所构建的模型拟合精度最高,其次是仅基于重要性筛选的变量,而考虑了所有估算因子时空相关性的模型精度最低。这说明在林龄估算中,应考虑遥感影像的时空相关性,但对于代表特定时期综合状况的环境数据集,显式建模其时空相关性反而可能降低模型性能。
3.3. 森林年龄估算模型的比较
模型对比结果显示,未考虑时空相关性的INLA-SPDE模型估算误差最大,超过15.67年。而考虑了时空相关性的INLA-SPDE方法则显著降低了林龄估算误差,在六期数据方案下,误差降低了49.21%。与此同时,基于多棵决策树的随机森林算法,在使用包含多期调查数据的大样本时,即使不考虑时空相关性,也能实现高精度的林龄估算。在最优方案下,结合了INLA-SPDE和随机森林算法的方案取得了最佳拟合结果,R2为0.8336,RMSE为6.5516年。无论是考虑了时空相关性的INLA-SPDE模型还是随机森林模型,在使用长期Landsat影像和环境数据集时,对20-40年林龄的思茅松林都能提供相对准确的估计,但对低于20年的林分倾向于高估,对高于40年的林木则更容易低估。
基于上述最优方案,研究绘制了2017年普洱市思茅松林龄分布图,并选择镇沅县进行了历史重建和未来情景预测分析,动态展示了林龄结构的时空变化。
在讨论部分,作者进一步阐释了本研究的深度与意义。首先,调查时间跨度对林龄估算的影响被重点探讨。树木生长是一个漫长而缓慢的过程,短时间序列数据无法反映森林发育的这一特征。本研究发现,仅当样本时间跨度超过15年时,代表森林变化幅度的变量“mag”才会被识别为林龄估算的重要预测因子。此外,纹理信息在所有方案中至少占所选遥感变量的一半,它对冠层光谱反射率高度敏感,能捕捉林分的空间分布,从而弥补了多光谱数据在表征森林结构方面的不足。其次,关于长期数据时空相关性对林龄估算的影响,研究指出,连续森林清查涉及对固定样地的重复调查,数据表现出明显的时空相关性。在分析中考虑这些相关性有助于将固有的森林特征与短期变化分离开来,从而识别出那些在长期和不同地点对林龄估算都保持显著的变量。忽略这些相关性可能会导致预测中的I类错误增加,产生过于乐观的估计。INLA-SPDE算法通过使用集成嵌套拉普拉斯近似,将离散采样点表示为连续场,从而更准确地反映了森林内树木的生长和发育过程。同时,随机森林算法通过自助采样和特征选择捕捉数据中的非线性关系,其决策树投票机制减轻了数据相关性的影响,使其特别适合使用大样本对森林参数进行建模。
研究者还将本方法与同类研究进行了对比。例如,与Huang等人主要依赖LandTrendr算法探测森林变化来推演林龄的方法相比,本研究结合多时相Landsat影像与环境数据集,降低了对单一算法参数设置的依赖,但达到可比的估算精度需要至少五期重复调查数据,对数据要求较高。与Chen等人的研究结论一致,随机森林算法是估算针叶林林龄性能最佳的方法之一,而本研究进一步发现,在变量选择过程中通过INLA-SPDE算法纳入时空相关性考虑,不仅能减少预测变量数量,还能筛选出对林龄估算更有效的因子。
综合研究结论,本项工作成功开发并验证了一套基于长期重复调查数据的时空集成森林林龄遥感估算方法。核心结论可归纳为三点:第一,遥感变量,特别是纹理相关指标,是估算思茅松林林龄的主要预测因子。第二,多年份样本增强了林龄估算影响因素的捕获能力,而考虑长期调查数据中的时空相关性则进一步提高了变量选择的可靠性。第三,在模型构建中,考虑了时空相关性的随机森林和INLA-SPDE模型,其精度显著高于未考虑数据依赖性的INLA-SPDE模型。更重要的是,当包含多年份样本时,随机森林模型即使不考虑时空相关性也能实现高精度估算。这些发现不仅为利用长期、重复调查数据估算森林年龄提供了一条可行的新途径,其方法论框架还可扩展应用于不同区域的森林资源动态监测、碳汇精准管理与评估,从而为科学制定森林经营方案、提升森林资源利用效率以及实现智能化林业管理提供可靠的数据支撑。