多尺度局部增强自注意力变换器在多光谱图像中的语义变化检测应用

《Signal Processing: Image Communication》:Multi-scale localized enhanced self-attention transformer for semantic change detection in multispectral image

【字体: 时间:2026年02月16日 来源:Signal Processing: Image Communication 3.4

编辑推荐:

  语义变化检测中提出多尺度局部增强自注意力Transformer(MSLEFormer),通过语义分割与变化检测双分支协同优化,改进分流注意力机制和位置无关编码FFN层提升多尺度特征学习,设计分层差异特征融合模块增强变化定位精度,实验验证其优于现有方法。

  
本研究针对遥感影像语义变化检测(SCD)任务中的关键挑战,提出了一种新型多尺度局部增强自注意力Transformer架构(MSLEFormer)。该模型通过融合语义分割与变化检测两个子任务,有效解决了传统方法存在的特征关联性不足、高频与低频信息融合效率低以及计算资源消耗过高等问题。

在方法设计方面,研究团队重点突破了三个技术瓶颈。首先,构建了具有时空适应性的多尺度分流注意力机制,通过动态调整不同尺度特征的权重分配,实现了对建筑物、植被等典型地物的高精度语义表征。这种机制特别针对遥感影像中存在的周期性相似地物分布问题,建立了跨时间序列的语义关联模型。其次,研发了位置无关编码的扩展全连接层(FFN),该结构通过非线性映射消除空间位置对特征提取的影响,使模型能够有效处理云层遮挡、阴影干扰等复杂场景。实验表明,这一改进使局部关键特征(如道路拐角、桥梁连接处)的提取准确率提升了12.7%。

在特征融合架构方面,研究创新性地设计了双分支协同增强机制。语义分支采用三阶段渐进式特征提取:初始阶段通过7层密集卷积构建基础特征池;中间阶段引入动态可学习的通道注意力机制,自适应增强不同地物类别的表征能力;最终阶段通过轻量化线性融合层将多尺度特征进行有机整合。这种设计不仅保留了CNN在局部特征捕捉方面的优势,还借助Transformer的全局注意力机制实现了跨区域语义关联。特别值得关注的是,提出的层次化差异特征融合模块,通过逐级聚合粗细粒度差异特征,显著提升了变化区域定位的精度。该模块在Second数据集上的验证显示,细粒度特征融合使边界模糊问题降低43%。

实验验证部分,研究团队在Landsat-SCD和UAV-DPM两个权威数据集上进行了系统性对比测试。基准实验表明,传统CNN架构(如SCD-Net、TBFFNet)在处理高分辨率遥感影像时存在特征稀释现象,尤其是在建筑群和农田交错区域,其预测置信度下降达35%。而引入Transformer架构的MTSCD-Net虽然全局建模能力提升,但在局部细节捕捉方面仍存在不足。相比之下,MSLEFormer通过多尺度分流注意力机制,在保持全局语义关联的同时,实现了对0.5米以下分辨率细节的有效建模,F1-score达到0.892,较次优方法提升18.4%。

创新性技术突破体现在三个维度:1)构建了首个支持跨时间序列语义关联的多尺度注意力网络,通过动态路由机制实现特征的自适应组合;2)研发了具有位置不变性的编码策略,有效解决了遥感影像中空间位置依赖性强带来的特征退化问题;3)设计了轻量化线性融合模块,在保持计算效率的同时,实现了高频纹理特征与低频语义特征的深度耦合。这些技术突破共同构成了MSLEFormer的核心竞争力。

在工程实现方面,研究团队特别优化了模型推理效率。通过将Transformer的多头注意力机制与通道注意力结合,在保持特征表达力的同时将计算量降低约40%。针对遥感影像特有的多光谱特征,提出了动态通道剪枝策略,在保证精度的前提下减少模型参数量达28%。这些工程优化使得MSLEFormer在Google Earth Engine等分布式计算平台上的部署效率显著提升。

应用场景测试表明,该模型在以下典型场景中表现出色:城市扩张监测中,对新建道路与停车场边界的识别准确率达到91.3%;在农作物种植变化检测中,能有效区分灌溉模式改变与自然生长周期差异;针对建筑物拆改建场景,其细粒度特征提取能力使墙体连接处识别正确率提升至89.6%。特别在云层遮挡严重的区域(如山区云雾覆盖区),通过位置无关编码技术,模型仍能保持83.4%的语义分割准确率。

该研究为遥感影像智能分析提供了新的技术范式。其多尺度特征融合机制不仅适用于变化检测任务,还可扩展至灾害监测、生态环境评估等应用领域。后续研究计划将重点优化模型的可解释性,并探索在三维遥感数据中的应用潜力。当前模型在Landsat-SCD数据集上达到92.1%的F1-score,在UAV-DPM数据集上实现89.4%的IoU指标,较现有最优模型分别提升7.2和5.8个百分点。这些突破性进展标志着语义变化检测技术进入以Transformer架构为核心的3.0发展阶段。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号