基于视觉基础模型的边界增强遥感变化检测网络

《Pattern Recognition Letters》:Boundary-Enhanced Remote Sensing Change Detection Network Based on a Vision Foundation Model

【字体: 时间:2026年02月17日 来源:Pattern Recognition Letters 3.3

编辑推荐:

  针对遥感变化检测中边界界定不精准和噪声干扰问题,本文提出基于EdgeSAM的边界优化检测网络,通过整合时空特征对齐模块(SFAM)、边缘增强模块(EEM)和边缘增强解码头(EEDH),动态交互与自适应对齐双时相特征,抑制无关噪声干扰,并强化边缘响应以提升边界精度。实验表明,该方法在WHU-CD和MSRS-CD数据集上F1分数分别达到92.06%和79.24%,优于九种主流模型。

  
黄禾|刘申波|谭颖|赵东雪|唐丽君
长沙理工大学物理与电子科学学院,中国长沙410114

摘要

变化检测是分析地理特征变化的重要方法。然而,现有的遥感变化检测方法受到特征提取和边界划分能力的限制,难以在局部细节和全局语义之间取得平衡。这通常会导致细粒度信息的丢失,不仅会产生虚假变化,还会导致变化边界不完整。为了解决这些问题,本文提出了一种基于视觉基础模型EdgeSAM的边界优化变化检测网络。该网络利用EdgeSAM的图像编码器,并将其与设计的时空特征对齐模块(SFAM)集成在一起,从而在特征提取阶段实现双时相特征的动态交互和自适应对齐,减少无关噪声因素对准确变化检测的干扰。同时,为了增强模型划分变化边界的能力,引入了边缘增强模块(EEM)和边缘增强解码器头(EEDH),以加强边缘区域的特征响应并突出边界细节。在WHU-CD和MSRS-CD数据集上进行的对比实验表明,所提出的模型分别获得了92.06%和79.24%的最高F1分数,实现了高精度的变化检测。

引言

遥感变化检测(RSCD)作为分析地球表面时空动态演化的核心技术,通过对比分析多时相遥感图像(RSI)[1],能够准确识别土地覆盖类型转换和空间形态变化。它在精细土地资源管理、生态环境动态监测、城市扩张规划、自然灾害应急响应和农业生产调控等关键领域发挥着不可替代的作用[2]。
近年来,深度学习技术在RSCD领域取得了显著进展。其中,基于卷积神经网络(CNN)和视觉Transformer[3]的方法被广泛采用。基于CNN的方法通常使用权重共享网络来聚合多时相图像中的语义变化信息[4],而基于Transformer的方法则利用其全局感知能力[5]通过编码器捕捉图像中的长距离依赖关系。此外,结合CNN和Transformer的混合方法可以更有效地建模时空上下文信息[6]。尽管这些方法可以获得有效的遥感变化检测结果,但它们在复杂和动态变化的环境中适应性有限,容易产生虚假变化。这对该模型的特征提取和适应能力提出了更高的要求。
自2023年以来,随着Segment Anything Model(SAM)[7]等视觉基础模型的发展,研究人员开始探索它们在RSCD中的应用,并取得了有希望的结果。视觉基础模型在大型、多样化的数据集上预训练,以获得强大的视觉识别能力,即使在标注数据有限的情况下也能保持强劲的性能。RSBuilding[8]将视觉基础模型与多尺度特征增强器和跨注意力解码器集成在一起,实现了出色的跨场景泛化和优秀的零样本性能。BAN[9]使用冻结的基础模型提取通用特征,并通过桥接模块改进选择、对齐和注入过程,从而提高了变化检测方法的性能。SFCD-Net进一步将SAM与特征交互模块[10]结合,提高了遥感变化检测的准确性。然而,由于SAM的图像编码器基于具有大量参数的深度网络架构Vision Transformer(ViT),其较高的计算成本限制了其在大规模遥感变化检测任务中的实际应用。深度学习变化检测需要在训练样本和计算基础设施方面克服这些限制[11]。因此,本研究采用了轻量级的视觉基础模型EdgeSAM[12]进行RSCD。EdgeSAM在保持强大图像理解能力的同时,通过网络架构优化显著减少了模型参数和计算开销,使其非常适合大规模遥感数据集。
虽然EdgeSAM具有高效处理遥感图像的能力,但遥感图像中地面对象类型的多样性和复杂的环境因素可能导致检测结果中的边界不完美[13]。这种与实际轮廓的不对齐会导致边缘不规则和轮廓扭曲等问题,妨碍变化区域的精确识别和分割,最终降低变化检测的整体性能。因此,本文将时空特征对齐模块(SFAM)集成到EdgeSAM的图像编码器中,以实现双时相特征的交互和对齐,从而减少虚假变化的影响。此外,设计了边缘增强解码器头(EEDH),以引导模型在解码过程中关注边缘细节,实现更精确和清晰的边界提取。本文的主要贡献可以总结如下。
  • 1.
    设计了一个时空特征对齐模块(SFAM)。通过双时相特征的动态交互和补偿,有效抑制了由光照、阴影分布和传感器类型差异等无关因素引起的噪声干扰,从而提高了模型的双时相特征提取质量。
  • 2.
    设计了一个边缘增强模块(EEM),专注于变化边缘并进行加权增强。它对变化区域的边缘赋予更高的关注权重,从而细化了获得的边界信息。此外,我们提出了一个边缘增强解码器头(EEDH),以锐化变化区域的边界并提高变化边界的分割性能。
  • 部分代码片段

    整体结构

    图1展示了Edge-CD的整体网络结构,并指出了每层的输出维度。对于输入的双时相遥感图像T1和T2,模型首先使用共享权重的EdgeSAM图像编码器提取特征,捕获基本的语义和空间信息。同时,通过将SFAM嵌入配备SE注意力模块[14]的RepvitBlock中,实现了动态交互和自适应

    实验设置

    所提出的Edge-CD模型使用PyTorch实现,并在NVIDIA Tesla L40平台上进行训练。EdgeSAM的图像编码器作为骨干,初始化为预训练的EdgeSAM-10x模型[12]。我们采用AdamW优化器,初始学习率为2×10?3,结合余弦退火学习率调度和线性热身。训练运行300个周期,批量大小为8。实验在两个开源RSCD数据集WHU-CD[18]和MSRS-CD[19]上进行。

    与其他VFMs的兼容性

    为了验证我们的方法与其他视觉基础模型的兼容性,我们使用SAM和SAM-HQ [28]实现了相同的变化检测框架,并在MSRS-CD数据集上评估了它们的性能。结果显示,所提出的方法在两种视觉基础模型上都实现了轻微的性能提升,但提升幅度低于基于EdgeSAM的版本。核心差异在于

    结论

    本文提出了一种基于EdgeSAM的边界增强遥感变化检测网络。它使用EdgeSAM的图像编码器作为骨干,并集成SFAM以更好地捕捉真实变化并抑制虚假检测。进一步引入了EEM和EEDH,以使检测到的边界与实际变化区域对齐。在WHU-CD和MSRS-CD上的实验表明,Edge-CD在多个评估指标上始终优于现有的主流方法,实现了最佳的整体性能

    CRediT作者贡献声明

    黄禾:撰写 – 审稿与编辑,撰写 – 原稿,软件,方法论,概念化。刘申波:方法论,数据管理。谭颖:数据管理。赵东雪:软件。唐丽君:方法论。

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

    致谢

    本工作得到了湖南省水资源科学技术计划(项目编号XSKJ2025056-32)的支持
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号