融合Sentinel-2与Landsat多源遥感数据评估中国多尺度、多生态系统植物物种丰富度的高精度建模研究

《Ecology and Evolution》：Estimating Plant Species Richness With Sentinel and Landsat Data Across Ecosystems in China

【字体：大中小】 时间：2026年03月17日 来源：Ecology and Evolution 2.3

编辑推荐：

　　本文探讨了利用Sentinel-2和Landsat卫星遥感数据，通过多种光谱植被指数（如NDVI、EVI、GNDVI等）及其统计特征（均值、方差、变异系数），结合偏最小二乘回归（PLSR）等多种建模方法，构建高精度的植物物种丰富度（Species Richness）预测模型。研究评估了该模型在中国五种主要植被类型（针叶林、落叶阔叶林、常绿阔叶林、灌丛、草地）中的跨尺度、跨生态系统预测能力，为大规模、高效的生物多样性遥感监测提供了科学依据。

引言

植物作为生态系统中的初级生产者，其多样性对于维持生态平衡、保护生物多样性及确保生态系统服务至关重要。然而，在全球气候变化、频繁干扰和剧烈人类活动的多重压力下，植物多样性正面临严重威胁。传统的野外实地调查方法（field survey）虽然直观，但存在劳动密集、成本高昂、结果受调查方法和观察者主观性影响大，且难以在景观或区域尺度上捕捉物种分布动态变化等局限性。相比之下，遥感（remote sensing）技术凭借其覆盖范围广、成本效益高、可提供长期一致观测数据等优势，已成为大规模植物多样性评估与监测的潜在强大工具。本研究聚焦于利用遥感技术估算植物α多样性（alpha diversity）中的核心指标——物种丰富度（species richness, S）。

目前，利用遥感技术进行植物多样性研究主要围绕生境制图、物种制图、光谱多样性（spectral diversity）和功能多样性（functional diversity）四大方向。其中，光谱多样性（或光谱异质性，spectral heterogeneity）已成为评估植物多样性的重点领域，其核心理论是光谱变异假说（Spectral Variation Hypothesis, SVH）。该假说认为，遥感图像的光谱多样性反映了环境的空间异质性，而这种异质性与物种丰富度密切相关。简而言之，更高的光谱异质性通常意味着更高的植物多样性。在技术层面，遥感监测分为直接法和间接法，以及主动传感器（如激光雷达，LiDAR）和被动传感器（如多光谱、高光谱成像仪）。高光谱和激光雷达数据虽然预测潜力巨大，但其较高的获取成本限制了在大尺度多样性预测中的应用。因此，本研究旨在探索利用更容易获取的中分辨率多光谱卫星数据——特别是欧空局Sentinel-2和美国地质调查局Landsat系列数据——来构建高精度的植物物种丰富度预测模型。

Sentinel-2卫星具有高空间分辨率（10米）、高时间分辨率（5天重访周期）以及独有的三个红边波段，使其在监测植被方面优势显著。Landsat系列卫星则提供了长期、连续的观测记录，是地球观测和生物多样性研究的基石。本研究通过比较这两种数据源在不同生态系统和尺度下的预测性能，旨在明确光谱和空间分辨率在植物多样性估算中的关键作用。

材料与方法

研究区域与样地数据

本研究的样地分布于中国14个省（自治区），涵盖了丰富的植被类型，包括针叶林、落叶阔叶林、常绿阔叶林、云杉林、热带雨林、灌丛、荒漠、旱生灌丛区、草地等。样地调查隶属于中国生态系统研究网络（Chinese Ecosystem Research Network, CERN）及“国家保护区及毗邻区域”科研项目。森林和灌丛样地尺寸多为30米×30米，草地样地为1米×1米。最终的分层抽样方案包括253个针叶林样地、86个落叶阔叶林样地、19个常绿阔叶林样地、20个灌丛样地和60个草地样地。物种丰富度（S）数据于2019年至2020年间通过实地调查获取。

遥感影像数据

研究获取了云量低于10%的Sentinel-2 L2A级（大气校正后）影像和Landsat 8 OLI影像。影像预处理后，选取了每年6月至8月（北半球植被生长旺季）的数据，以提升植物多样性遥感估算的准确性。

特征提取与选择

研究从多光谱影像中提取了一系列常见的光谱植被指数（Vegetation Indices），并计算了每个指数以及各波段像元值的均值（mean）、方差（variance）和变异系数（coefficient of variation, CV）作为预测变量。所使用的植被指数包括归一化差异植被指数（Normalized Difference Vegetation Index, NDVI）、差值植被指数（Difference Vegetation Index, DVI）、增强型植被指数（Enhanced Vegetation Index, EVI）、全球环境监测植被指数（Global Environmental Monitoring Vegetation Index, GEMVI）、绿光归一化差异植被指数（Green Normalized Difference Vegetation Index, GNDVI）、光化学反射指数（Photochemical Reflectance Index, PRI）、植物衰老反射指数（Plant Senescence Reflectance Index, PSRI）等共15个指数及其统计量。

统计分析

研究采用了三种建模方法来评估预测变量在五种植被类型中的预测能力：

1.
简单线性回归（Simple Linear Regression）：对75%的测量数据与遥感数据进行Spearman相关性分析，根据显著性p值和决定系数（r²）筛选最优遥感指数，并用剩余25%的数据进行验证。
2.
多元逐步回归（Multiple Stepwise Regression）：基于多元线性回归，通过特定的变量选择策略（如前向和后向结合）构建最优回归模型，使用70%的数据建模，30%的数据进行精度反演。
3.
偏最小二乘回归（Partial Least Squares Regression, PLSR）：这是一种能够处理预测变量间多重共线性和大尺度数据问题的线性非参数回归模型。它通过提取对因变量解释力最强的综合变量，建立预测模型。PLSR已被成功应用于森林和草地生态系统性状研究中，是目前高精度反演建模方法之一。

此外，研究还通过随机森林（Random Forest）模型进一步确认了关键遥感参数的重要性。所有分析均在R软件（4.5版本）中完成。

结果

简单线性回归模型的精度

•
Sentinel-2数据：
- •
  对于针叶林，反演物种丰富度的最佳指数是PSRIsd（PSRI的标准差），在低丰富度梯度下表现出强显著性（R = -0.39）。
- •
  对于落叶阔叶林，NDVIca（NDVI的变异系数）整体反演效果最佳（r = 0.25）。
- •
  对于常绿阔叶林，band3mn（波段3的均值）反演精度最显著（R = -0.55）。
- •
  对于灌丛，PRIca（PRI的变异系数）反演精度最高（R = -0.65）。
- •
  对于草地，EVIsd（EVI的标准差）反演精度最高（R = -0.31）。
•
Landsat数据：
- •
  对于针叶林，最佳指数是GNDVImn（GNDVI的均值），在低和高丰富度梯度下均有较强显著性。
- •
  对于落叶阔叶林，GNDVImn也表现出较高的反演精度（R = 0.53）。
- •
  对于常绿阔叶林，最佳参数是EVI（R = 0.82）。
- •
  对于灌丛，DVIsd（DVI的标准差）能有效反演其丰富度指数（R = -0.54）。

总体而言，简单线性回归模型表明，单个遥感因子的应用在复杂的植被群落或高多样性环境中具有明显的局限性，模型的决定系数普遍较低（R²< 0.4），预测不确定性较大。

多元逐步回归模型的精度

该模型整合了多个光谱异质性指标。结果显示：

•
Landsat数据：模型整体上对五种植被类型的多样性反演效果不佳（R²< 0.2），但能较好地解释针叶林在中NDVI梯度下的测量多样性值（R²= 0.52）。
•
Sentinel-2数据：模型能较好地解释灌丛的整体测量多样性值（R²= 0.67），对低NDVI梯度下的针叶林（R²= 0.45）和低丰富度梯度下的落叶阔叶林（R²= 0.72）也有一定的解释能力。

偏最小二乘回归（PLSR）模型的精度

PLSR模型在整合多变量信息方面表现更优：

•
Landsat数据：模型能有效解释常绿阔叶林、灌丛和草地的整体测量多样性值，但对针叶林和落叶阔叶林的整体解释力较弱（R²< 0.2）。在低丰富度梯度下，对针叶林和落叶阔叶林的解释力有所提升。
•
Sentinel-2数据：模型能较好地解释落叶阔叶林、常绿阔叶林和灌丛的整体测量多样性值，对草地的解释力一般（R²= 0.43），但对针叶林的预测性能较差（R²= 0.15）。在低、中NDVI梯度下，对针叶林和落叶阔叶林的模型解释效果较好。

综合比较，三种模型中，PLSR模型整体表现最优，其次是多元逐步回归模型，简单线性回归模型表现最差。在众多光谱指数中，EVI、DVI、PSRI、NDVI、PRI、GNDVI和GEMVI被确定为预测植物物种丰富度的强效指标。此外，Sentinel-2数据的预测精度普遍高于Landsat数据，突显了光谱和空间分辨率在植物多样性估算中的关键作用。

讨论

本研究通过对比Sentinel-2和Landsat数据在反演植物多样性方面的性能差异，深入探讨了不同植被指数及其统计量的作用机制。研究发现，特定指数对特定植被类型有独特效果，例如PSRIsd和GNDVImn在针叶林反演中表现突出，NDVI在反映植被动态中作用基础，PRI在灌丛反演中潜力良好，而EVI则对常绿阔叶林和低覆盖度草地（如本研究中的草地）解释力较强。

然而，单因子线性模型普遍存在的低相关性表明，在复杂环境下仅依靠单一遥感因子进行预测具有很大不确定性。多元建模（逐步回归和PLSR）通过整合多个光谱异质性指标，在一定程度上提升了预测精度。特别是PLSR模型，因其能够处理变量间的多重共线性并有效提取系统信息，在多数植被类型的整体反演中表现出相对优势。尽管如此，模型性能仍因数据源和植被类型而异。Sentinel-2数据凭借其更高的光谱和空间分辨率，在多数情况下表现出比Landsat数据更好的预测能力，尤其是在灌丛、落叶阔叶林和常绿阔叶林中。然而，对于针叶林，两种数据的反演精度都相对较低，这可能与针叶林独特的光谱特性、复杂的林下环境或生长环境（如高海拔、寒冷地区）对光谱特征的干扰有关。

研究也明确指出了当前存在的局限性：1）预测变量探索不足，未充分考虑环境变量、图像纹理特征和植被生理指标等；2）仅分析了五种植被类型，生态系统覆盖不全；3）遥感数据采集和处理过程中可能存在辐射定标误差和空间分辨率限制；4）线性模型本身存在局限，且处理后的光谱指数仍可能存在冗余；5）未充分考虑稀疏植被区土壤背景的干扰；6）研究仅聚焦于生长季（6-8月）的一个时间窗口，未能体现生物多样性的全年动态变化。

结论与展望

本研究通过独立分析Sentinel-2和Landsat两种数据源，阐明了两者光谱多样性与物种丰富度的关系，并探讨了跨植被类型的卫星遥感植物多样性反演。主要结论是：在简单线性回归、多元逐步回归和偏最小二乘回归三种模型中，PLSR模型表现出最优性能。Sentinel-2数据相比Landsat数据具有更高的预测精度，凸显了光谱和空间分辨率在估算中的关键作用。EVI、DVI、PSRI、NDVI、PRI、GNDVI、GEMVI等光谱指数是预测植物物种丰富度的有力指标。

为未来进一步提高遥感模型对植物多样性的预测精度和普适性，研究提出以下展望：1）纳入更多易获取的影响因子指标，如衍生指标；2）优化光谱指数，测试更多样的光谱信息处理方法；3）采用更多样化的统计模型和深度学习算法以增强模型稳健性；4）将土壤背景等非生物因子和植被物候特征等生物因子全面纳入分析框架；5）扩大采样空间范围，收集更多与遥感影像空间分辨率匹配的地面真值数据；6）考虑使用空间分辨率更高（厘米级）的影像或光谱信息更丰富的高光谱数据，以提升功能多样性和功能性状的反演精度，从而更精准地估算植物多样性。

热点排行

新闻专题