一种用于农业和作物地块划分的层次化基础模型框架，具备良好的泛化能力

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computers and Electronics in Agriculture》：A hierarchical foundation model framework for generalizable agricultural and crop parcel delineation

【字体：大中小】 时间：2026年02月10日 来源：Computers and Electronics in Agriculture 8.9

编辑推荐：

　　农业地块多尺度智能分割方法研究：提出PT-PEFT SAM框架，通过前缀调优与正交多低秩适配协同优化SAM模型，结合光谱适配模块和域不变特征学习，构建AP语义标注与CP零样本分割的分层体系，实现欧洲与中国区域的高精度边界（F1>0.92）与几何精度（GTC<0.065），验证跨地理适应的有效性。

朱宇|潘耀中|胡唐高|刘尧|王印达

中国北京师范大学地理科学学院遥感科学国家重点实验室，北京100875

摘要

对农业景观进行精确的多尺度制图——从面向管理的农业地块（APs）到细粒度的作物地块（CPs）——对于土地管理和精准农业至关重要。然而，由于现有方法的精度限制和泛化能力较差，自动化划分仍然具有挑战性。尽管Segment Anything Model（SAM）提供了强大的零样本分割能力，但其直接应用受到语义意识的缺乏、与遥感图像的领域差异以及全面微调的高成本的限制。为了解决这些限制，本研究提出了PT-PEFT SAM，这是一个能够高效适应农业制图的新框架。该框架采用了一种“引导-然后专门化”的顺序适应策略，利用前缀调优（PT）将SAM的表示与遥感领域对齐，然后通过提出的正交化多低秩适应（Ortho-Multi-LoRA）高效注入任务特定的语义。该框架还通过一个可学习的光谱适应模块增强了多波段兼容性，并通过一个领域不变的特征学习模块提高了内在的泛化能力。此外，引入了一个分层架构：微调模型执行语义AP划分，而完全自动化的流程利用预训练的SAM 2进行地块内的CP分割，利用其卓越的零样本能力。在欧洲和中国数据集上的评估表明，我们的方法达到了最先进的精度（AP的边界F1分数>0.92；CP的几何误差[GTC]<0.065），并表现出出色的迁移学习性能。这项研究为将基础模型适应于专门的地理空间任务建立了一个原则性、可扩展的范式，使得关键农业数据的快速准确生成成为可能。

引言

农业地块（APs）是农业管理和统计的基本单位，由田埂、路径或沟渠等物理特征定义（Persello等人，2019年；Yan和Roy，2014年）。准确划分APs对于多尺度应用至关重要。在国家层面上，监测AP动态有助于通过识别退化或废弃情况来支持土地保护政策（Alemu，2016年）。在管理方面，将APs与所有权记录关联起来可以提高地籍的准确性（Zhu等人，2024b年）。在田间层面，精确的AP数据能够实现精准农业并优化资源分配（Yan和Roy，2014年）。

作物地块（CPs）代表了一个更细致和动态的数据层（图1(c)）。与APs不同，CPs是由作物同质性而非物理边界定义的种植单元。这种细节水平对于特定作物的生长监测和产量预测至关重要。然而，由于作物轮作，获取这种细粒度的数据极其复杂且时间敏感。因此，大规模、高精度和最新的CP数据集仍然稀缺，需要强大的自动化划分方法。

最初的划分方法依赖于传统的图像技术，例如边缘运算符和流域分割等方法来提取边界信息或分割耕作区域（Hong等人，2021年；Marvaniya等人，2021年；Watkins和van Niekerk，2019年）。然而，这些方法往往由于缺乏语义上下文而难以区分真正的地块边界和田间纹理。此外，它们对手动参数调整的依赖进一步限制了其适用性（Zhu等人，2024a年）。

深度学习（DL）的出现标志着一个范式的转变。早期的基于区域的网络专注于语义分割，以区分耕地和非耕地（Zhang等人，2020年，2023年）。尽管这些模型在绘制耕地范围方面取得了成功，但它们忽略了定义单个地块的复杂内部边界。后续的基于边界的模型旨在改进边缘检测；然而，鉴于田界的语义复杂性，这些模型（例如RCF、各种U-Net变体）经常缺乏区分田界和其他非农业线性特征所需的语义上下文（Fetai等人，2021年；Taravat等人，2021年；Zhang等人，2021年）。因此，当前最先进的方法采用多任务学习（MTL）框架，同时预测地块区域和边界，利用问题的双重性来提高性能。代表性模型包括ResUNet-a（Waldner等人，2021年；Waldner和Diakogiannis，2020年）、BSiNet（Long等人，2022年）、SEANet（Li等人，2023年）和HBGNet（Zhao等人，2025年）。尽管取得了这些进展，许多MTL模型仍然存在架构上的限制，通常优先考虑区域精度而非边界精度。更严重的是，它们对大量高质量标注数据的依赖仍然是开发适用于多样化农业景观的强大、通用模型的主要障碍。

Segment Anything Model（SAM）（Kirillov等人，2023年）的出现标志着计算机视觉领域的一场革命。SAM在超过11亿个掩码上进行了训练，表现出强大的零样本分割能力和广泛的泛化能力。其后续版本SAM2（Ravi等人，2025年）进一步完善了这些属性。这些基础的分割先验在数据受限的遥感任务中表现出有效性，特别是在变化检测方面。例如，Zhang等人（2024a年）将SAM与权重分解的低秩适配器结合使用，以实现高效的特征学习，而Gao等人（2025年）提出了Meta-CD框架，结合了轻量级CNN适配器和FastSAM，在样本有限的情况下实现了强大的性能。然而，将这些模型直接应用于地块划分受到三个基本挑战的限制。首先，SAM缺乏对特定类别（如“农业地块”）的内在语义意识。其次，用于训练SAM的自然图像与多波段、俯视视角的遥感图像之间存在显著的领域差异。第三，这些模型的巨大规模使得全面微调在计算上不可行。尽管提出了一些适应策略——从使用辅助网络或基于查询的嵌入的外部提示生成器（Chen等人，2024年；X. Zhang等人，2024年）到通过瓶颈适配器进行轻量级微调（Pu等人，2024年；Zhang等人，2025年）——但这些限制仍然存在。这些方法通常会遭受误差传播或表示能力受限的问题，无法充分发挥基础模型在精准地理空间任务中的潜力。

为了弥合这些差距，我们提出了一个分层框架，将SAM适应于AP和CP的划分。我们根据任务的特异性分解了这个过程：APs通过语义微调的SAM提取，而CPs则通过基于SAM 2的分割流程解决。具体来说，本研究做出了以下贡献：

1.
一种专门的SAM适应框架用于AP划分。我们提出了一个新颖的PT-PEFT框架，用于专门化SAM以适应AP任务。其创新包括：(i) 使用前缀调优进行RS领域对齐的顺序“引导-然后专门化”策略；(ii) 用于多波段兼容性的可学习光谱适应模块；(iii) 用于泛化的领域不变学习机制；以及(iv) 确保语义和几何一致性的双任务解码器。广泛的实验证实了其优于现有的多任务模型和SAM适配器。
2.
一种用于细粒度CP分割的新工作流程。我们设计了一个自动化流程，将APs划分为高保真的CPs。通过将CP提取定义为受AP约束的分割任务，我们利用SAM 2的零样本能力来划分向量化作物单元，而无需训练监督。这为这些经常被忽视的、动态变化的、最精细的农业单元的划分提供了一个稳健的解决方案。
3.
一种可扩展的“全局训练，局部微调”范式。我们展示了一种适用于大规模制图的实用策略，并通过在中国安徽省的高精度AP和CP地图得到了验证。我们表明，在开放欧洲数据上预训练的模型可以快速适应新大陆，只需最少的本地监督，为样本稀缺地区生成关键地块数据提供了可扩展的途径。

部分摘录

总体框架：分层方法进行地块划分

所提出的框架实现了一个两阶段的、从粗到细的分层架构，用于多级别地块划分（图2）。

阶段1：农业地块（AP）划分。多光谱遥感图像通过经过微调的PT-PEFT SAM模型进行处理。该模型专门用于AP划分的语义任务，同时预测地块区域和边界。随后的后处理将原始预测转换为最终的AP结果。

阶段2：作物地块（CP）分割。

研究区域和数据集

本研究采用双数据集策略，结合了用于稳健预训练的大规模数据集和用于针对性验证的本地化区域数据集。这种配置有助于在多种条件下进行全面的压力测试，并评估在最少监督下的跨地理适应能力。数据集的详细信息见表1、表2和表3。

泛欧数据集。泛欧数据集是训练的基础

在不同景观中的主要划分性能

所提出的PT-PEFT SAM框架在不同景观中划分农业地块时表现出强大的性能。如表4所示，定量评估表明，在欧洲和安徽的验证站点，农业地块（AP）划分和更细粒度的作物地块（CP）分割的准确性始终很高。

关于微调优于提示的理由

采用参数高效的微调而非基于提示的范式是一种核心设计策略。这一选择解决了将提示机制应用于空间连续农业划分时的固有局限性。

基于提示的方法的主要限制是由于语义和几何处理解耦而产生的误差传播。例如Prompt-SAM（Zhang等人，2024b）等级联框架依赖于辅助网络进行初始提示。

结论

本研究解决了自动化、大规模农业地块制图的核心挑战。开发的PT-PEFT SAM框架通过四个关键创新对Segment Anything Model进行了改进。首先，顺序的PT-PEFT策略结合了前缀调优用于领域对齐和提出的Ortho-Multi-LoRA用于任务专门化。这种设计在保留基础先验的同时，注入了强大且非冗余的任务特定语义。其次，一个可学习的光谱适应模块

CRediT作者贡献声明

朱宇：撰写——审阅与编辑，撰写——原始草稿，可视化，验证，软件，项目管理，方法论，调查，形式分析，数据管理，概念化。潘耀中：监督，资源获取，概念化。胡唐高：资源，概念化。刘尧：可视化，方法论，调查。王印达：方法论。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

致谢

本工作得到了中国国家重点研发计划（项目编号2023YFB3906201）和遥感科学国家重点实验室及全球土地遥感产品工程研究中心开放基金（项目编号OF202401）的支持。

联系信箱：

粤ICP备09063491号

摘要

引言