气候变化和土地利用变化的综合影响对生态系统造成了越来越大的压力,因此植被监测成为可持续发展的关键优先事项(Wen等人,2025年)。植被指数(VIs)提供了植被健康状况、生物量和生产力的定量度量,是评估生态系统动态的重要工具(Kooistra等人,2024年)。植被指数源自多光谱卫星影像,广泛用于干旱评估、作物产量估算和土地退化分析(Ferchichi, Abbes, Barra, & Farah,2022年)。随着全球气候变率的增加,准确及时的VI预测对于可持续土地管理和粮食安全变得至关重要(Sishodia, Ray, & Singh,2020年;Zeng等人,2022年)。可靠的预测支持主动决策,优化资源分配,并加强增强生态系统韧性的适应策略。
在过去十年中,植被动态建模取得了显著进展,从传统的统计技术发展到现代深度学习(DL)框架(Liu等人,2024年)。早期的统计方法如自回归(AR)、ARIMA和季节性ARIMA模型(Fernández-Manso, Quintano, & Fernández-Manso,2011年;Mohanty, Behera, Panda, & Swetanisha,2025年)能够捕捉季节性趋势,但难以处理卫星衍生植被数据的非线性和非平稳行为(Mohanty等人,2025年)。机器学习(ML)算法如随机森林(RF)、支持向量机(SVM)和多层感知器(MLPs)后来引入了数据驱动的灵活性,提高了预测准确性(Ang等人,2022年;Khaki & Wang,2019年)。然而,这些模型通常将空间观测视为独立的,忽略了控制植被生长和退化的空间和时间依赖性(Balti, Abbes, Sang, Mellouli, & Farah,2023年;Wang等人,2025年)。
深度学习通过能够学习序列模式和复杂依赖性的架构进一步推进了植被建模。卷积神经网络(CNNs)、长短期记忆网络(LSTMs)和混合CNN–LSTM框架在捕捉时间和上下文动态方面表现出色(Gao等人,2023年;Reddy & Prasad,2018年)。然而,这些方法大多只预测单点或区域平均值,忽略了高分辨率映射所需的细尺度空间细节和连续性。
最近的研究开始转向基于地图的预测框架,这些框架预测全分辨率的VI地图而不是基于点的估计(Schwalbert等人,2018年)。ConvLSTM架构已经证明了建模时空依赖性和捕捉季节性NDVI变化的能力(Ahmad, Yang, Ettlin, Berger, & Rodríguez-Bocca,2023年;Kartal, Iban, & Sekertekin,2024年;Robin等人,2022年)。更先进的框架如Graph WaveNet、GWConvLSTM和ConvLSTM-SAC-NL结合了图结构或注意力机制,以改善空间关系的表示并提高计算效率(Beyer, Ahmad, Yang, & Rodríguez-Bocca,2023年;Cai等人,2024年;Xu等人,2024年)。然而,现有方法是在小型或空间均匀的数据集上开发的,对大型异质区域的泛化能力较差。这一限制突显了需要能够在保持时间连贯性的同时整合局部和全局空间信息的模型的需求。
图卷积网络(GCNs)和Transformer的最新进展为这些挑战提供了有希望的解决方案。GCNs通过将数据表示为图来建模空间依赖性,通过相邻节点传播特征以保持局部连贯性。这种方法在交通预测和遥感等应用中已被证明有效(Bhatti, Tang, Wu, Marjan, & Hussain,2023年;Jiang, Zhang, Lin, Tang, & Luo,2019年;Wu等人,2020年)。Transformer最初是为自然语言处理设计的(Vaswani等人,2017年),利用自注意力捕捉长距离依赖性,并已被用于土地覆盖制图和环境监测等视觉任务(Dosovitskiy,2020年;Tang, Li, Zhang, & Tang,2023年)。它们在环境建模中的整合在医学成像、土地覆盖制图和城市规划中显示出强大潜力(Chen等人,2021年)。GCNs的局部结构学习和Transformer的全局上下文推理的互补优势使其组合特别适合空间明确的植被预测(Dong, Long, Xu, & Xiao,2021年;Huo等人,2023年;?ajina, Ore?ki, & Iva?i?-Kos,2025年)。
当前的VI预测文献揭示了三个关键差距。首先,大多数研究仅预测单点或区域平均VI值,忽略了基于地图进行准确预测所需的空间模式和依赖性。其次,现有的基于地图的方法能够捕捉空间变异性,但在不同传感器或如森林、湿地和城市区域等异质景观中的泛化能力较弱。第三,研究主要集中在NDVI上,对其他植被指数如EVI或SAVI的关注有限,从而降低了模型在更广泛监测环境中的适应性。这些限制强调了需要一种能够使用大型异质卫星数据集共同建模时间、空间和多指数动态的架构。
本文介绍了一种用于高分辨率VI地图预测的ConvLSTM–GCN–Transformer架构。该模型处理历史VI时间序列数据,以在多样化景观中生成全分辨率的月度预测。ConvLSTM层捕捉时间演变,GCN模块通过像素邻接图确保空间一致性,Transformer编码器提取长距离上下文模式。为了评估鲁棒性,进行了两项泛化实验:(i)使用Sentinel-2和MODIS影像的跨传感器评估;(ii)对EVI和SAVI的跨指数适应。
本研究的主要贡献总结如下:
•一种结合空间结构和时间动态的混合ConvLSTM–GCN–Transformer架构,用于VI地图预测。
•使用稀疏GCN操作的基于图的空间公式,高效地在大规模卫星数据上建模空间交互。
•该模型在涵盖森林、城市区域、水体和裸土的异质景观上进行了训练(1996–2025年),能够在多样化的环境条件下实现稳健的学习。
•通过严格的跨传感器泛化(Sentinel-2、MODIS)和跨指数泛化(EVI、SAVI)验证了该架构的适应性。
本文的其余部分结构如下:第2节回顾了植被指数预测的最新进展。第3节介绍了所提出的方法和模型架构。第4节描述了数据集和预处理程序。第5节展示了实验框架、结果、消融研究和泛化实验。第6节深入讨论了研究结果。第7节探讨了局限性并提出了未来的研究方向。最后,第8节总结了本文的主要贡献和发现。