综述:从时间序列生成和模型选择到迁移学习:大规模作物制图中基于像素级方法的综述与比较分析

《Computers and Electronics in Agriculture》:From time-series generation and model selection to transfer learning: A review and comparative analysis of pixel-wise approaches for large-scale crop mapping

【字体: 时间:2026年03月17日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  像素级大规模作物分类工作流要素综述与实验分析,提出基于样本量和领域偏移的流程选择方法,验证7天线性插值结合Transformer模型最优,并开源代码。

  
Judy Long|Tao Liu|Sean Alexander Woznicki|Miljana Markovi?|Oskar Marko|Molly Sears
密歇根理工大学森林资源与环境科学学院,1400 Townsend Drive, Houghton, 49931, 美国

摘要

准确且及时的大规模作物制图对于作物管理和粮食安全至关重要。在过去的十年中,出现了多种基于像素的作物分类方法,涵盖了图像预处理、采样方法、特征选择、模型架构和迁移学习策略等工作流程要素。为了指导用户构建稳健的工作流程,我们回顾了基于监督学习和迁移学习的工作流程要素,并提出根据目标地点的样本数量以及与样本丰富来源地点的领域差异来选择作物制图工作流程的方法。为了全面评估这些方法,我们系统地分析了不同的时间序列构建策略、训练样本大小、变量集、模型架构和迁移学习方法对大规模作物分类性能的影响。
文献回顾和比较分析得出了三个关键发现。首先,在我们的多地点实验中,结合Transformer模型的7天线性重采样方法在完全监督和迁移学习工作流程中始终获得了最高的准确性,而随机森林方法虽然准确性也相当,但训练速度明显更快。其次,迁移学习提高了工作流程的适应性:对于同质作物类别,无监督的领域适应效果较好;而在多样化的迁移场景中,微调方法更为稳健。第三,工作流程的选择在很大程度上取决于标记样本的可用性:当标记样本数量低于某个阈值时,迁移学习工作流程更适合可靠的作物制图;而当有足够的标记数据时,完全监督的工作流程更为优选。为了保证透明度和可重复性,我们在一个开放的GitHub仓库中提供了所有代码、配置和结果:《大规模作物制图的基于像素的方法综述》。

引言

作物制图涉及使用空间数据(主要来自遥感图像)来识别和分类作物类型。最初,农田调查依赖于人工实地检查,这很难标准化和规模化。自20世纪70年代以来,诸如Landsat(1972年)、SPOT(1986年)、MODIS(1999年)、Worldview(2007年)、Gaofen(2013年)和Sentinel(2014年)等地球观测任务提供了广泛的全球遥感数据集,使得大规模环境监测(Lenton等人,2024年;Chen等人,2022年;Thi Huyen等人,2022年)、农业产量估算(Khaki等人,2021年)和灾害管理(Diwate等人,2025年;Hakkenberg等人,2024年)成为可能。高分辨率卫星图像的引入促进了地面调查与专家解释的结合(Luo等人,2023年;Lillesand等人,2015年),从而建立了适合大规模农田分类的工作流程。
机器学习(ML)和深度学习(DL)的最新进展使得作物制图变得可扩展和自动化,显著提高了作物监测的效率。先进的监督学习技术结合密集的实地调查,支持及时进行年度甚至季节内的作物制图(Konduri等人,2020年),这在美国(Boryan等人,2011年)和加拿大(Fisette等人,2013年)的实际项目中得到了验证。这些进展加速了数据驱动的决策制定和精准农业的采用。同时,迁移学习的出现提供了一种有前景的方法,通过重用在相关任务上训练的模型来减少对大量训练数据的依赖(Chen等人,2025年;Nowakowski等人,2021年),从而使得数据稀缺地区的应用成为可能。
其他作物制图工作流程组件的改进,如采样方法、图像处理、数据融合和特征选择,也有助于提高效率(Joshi等人,2023年)。Google Scholar上关于“遥感”和“作物制图”的年度出版物数量稳定增长了20%。而“遥感”和“作物制图”以及“迁移学习”相结合的搜索结果显示,迁移学习在作物制图应用方面的年增长率高达81%(图1)。在作物制图研究中,基于像素的作物分类方法具有最广泛的全球应用,时间序列数据是最常用的输入类型,这使其成为现代作物制图发展的代表。
典型的基于时间序列数据的作物分类工作流程包括时间序列生成、标记样本准备、特征选择、监督模型训练和评估以及地图预测(图2)。迁移学习研究通常基于传统的作物制图工作流程,并整合了迁移策略以在目标领域进行可靠预测。研究文章通常专注于单个工作流程组件,而不是从每个模块中选择最佳方法来创建最优工作流程。由于缺乏对每个组件方法的全面评估,因此这些有效方法可能未被充分认可或广泛应用。此外,如何在完全监督的作物制图和可迁移的工作流程之间做出选择仍然是一个未解决的问题。为了解决这些差距,需要对基于像素的作物制图工作流程要素的方法进行深入的回顾。
本文分为三个主要部分。首先,我们回顾并比较了不同的作物制图工作流程要素方法(第2节)。除了传统的回顾之外,我们还对每个工作流程组件的广泛使用方法进行了全面的、受控制的比较分析(第3-6节)。最后,我们综合实验结果和现有文献,提出了实用且基于证据的推荐意见,以帮助研究人员和实践者选择最佳方法,并为大规模基于像素的作物制图提供可操作的指导(第7-9节)。

章节片段

时间序列图像生成方法

时间序列数据通常从遥感图像中提取,因为它们能够捕捉季节性动态,相比单日期观测具有优势,并且是区分作物类型的关键基础。在本研究中,预处理指的是从二级(地表反射率)或一级(大气顶层反射率)产品重建时间序列,以生成一致的、无云的图像序列用于样本生成。表1总结了

比较实验设计

实验设计包括一系列模块化的比较实验,如图4中的流程图所示。我们主要使用了Landsat 8数据,因为它具有丰富的历史档案和一致的操作。在比较分析中开发的技术也适用于其他卫星图像产品,包括其他Landsat产品和Sentinel-2。输入的默认配置是光学波段,以及每个地点的最大样本大小,除非样本大小另有规定

研究区域

本研究重点关注美国大豆带和塞尔维亚伏伊伏丁纳地区的主要农业区域(图5)。我们选择了五个研究地点,以代表具有不同气象条件、田地结构和种植系统的广大耕作区域。
地点A-D对应于美国主要玉米-大豆生产州的四个Landsat 8覆盖区域。地点A-C位于北部玉米和大豆带,包括明尼苏达州、爱荷华州和南达科他州的部分地区

卫星图像预处理方法

以原始图像为基准,我们应用了五种广泛使用的方法来重建时间序列,同时确保时间上的规律性并最小化噪声。这些方法包括基于原始路径和行的复合方法(基于原始数据的方法),以及所有可用的基于像素的方法(基于线性重采样的方法)。图6总结了特定地点的有效像素分布(预处理前)和处理后时间序列的统一时间长度。图7展示了

时间序列重建方法分析

对地点A中所有样本的六波段时间序列进行视觉比较,这些样本属于三个类别(玉米、大豆和“其他”),区分了未处理的时间序列和处理后的时间序列(图10)。原始生长季节波段值保留了完整的光谱细节,但显示出显著的噪声,表现为极端的反射值和时间序列的高变异性(图10a)。原始序列还显示出玉米和大豆之间的区分度较差,仅有两个波段的DTW值具有跨类别的差异

最优的监督学习和通用作物制图工作流程

本研究表明,更细粒度(7天)的方法优于原始的、粗粒度(30天)的时间聚合方法,这与先前的研究结果一致,即较短的间隔复合图像能够更好地捕捉关键的时间信息(Griffiths等人,2019年)。7天线性重采样方法也被证明是最稳健的预处理技术,在监督学习和迁移学习工作流程中始终表现出强劲的性能

未来方向

虽然本研究对基于像素的作物分类工作流程进行了全面评估,但仍有一些新兴的研究方向和技术挑战需要关注,以推动遥感和作物制图领域的发展。
首先,随着高分辨率和高频地球观测产品(如Sentinel、HLS、PlanetScope以及商业光学和SAR产品)的日益普及,未来的作物制图研究应考虑与传感器相匹配的数据选择框架

结论

本研究综合了基于像素的大规模作物制图工作流程中使用的各种方法,包括时间序列重建、样本大小和特征选择、模型选择以及迁移学习。我们将这一回顾与在五个不同农业地点进行的比较实验相结合,以评估在不同样本大小和领域差异下的工作流程选择。对于完全监督的工作流程,7天线性重采样始终产生了最准确和最可迁移的结果

术语表

  • AtBi-GRU:注意力双GRU
  • AtBi-LSTM:注意力双LSTM
  • AtBi-RNN:注意力双RNN
  • Bi-GRU:双向GRU
  • Bi-LSTM:双向LSTM
  • Bi-RNN:双向RNN
  • CDL:农田数据层
  • CNN:卷积神经网络
  • DANN:领域对抗神经网络
  • DL:深度学习
  • DT:决策树
  • DTW:动态时间弯曲
  • EVI:增强植被指数
  • FSL:小样本学习
  • GCVI:绿色叶绿素植被指数
  • GEE:谷歌地球引擎
  • GRD:地面范围检测
  • GRU:门控循环单元
  • HLS:Harmonized(谐波化)

CRediT作者贡献声明

Judy Long:撰写——原始草稿、可视化、软件、方法论、调查、正式分析、概念化。Tao Liu:撰写——审阅与编辑、监督、资源管理、项目管理、方法论、资金获取、正式分析。Sean Alexander Woznicki:撰写——审阅与编辑、资源管理、项目管理、正式分析。Miljana Markovi?:撰写——审阅与编辑、验证。Oskar Marko:撰写——审阅与编辑、验证。Molly Sears:撰写

代码可用性

GitHub仓库“A Review of Pixel-wise Approaches for Large-scale Crop Mapping 包含了逐步实验代码、扩展的方法论细节和总结的实验结果。完整的工作流程和评估流程被组织成与我们的大规模作物分类研究相对应的清晰结构化模块。

资金来源

本研究得到了NASA Land Cover and Land Use Change项目的支持

写作过程中生成式AI和AI辅助技术的声明

在准备本工作时,作者使用了ChatGPT来帮助提高写作的清晰度和可读性。作者审阅并编辑了内容,并对出版物的内容负全责。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。

致谢

我们感谢BioSense研究所、诺维萨德大学的合作、支持以及在整个研究过程中分享的数据和知识。本研究使用了密歇根理工大学DeepBlizzard高性能计算集群的资源,该集群是通过NSF拨款MRI获得的,用于研究、培训和推广。我们感谢Denise Heikinen博士和Andrew J. Burton博士在英语撰写方面的帮助。我们也感谢编辑们
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号