D2Mamba:一种基于Mamba算法的多光谱卫星图像洪水道障碍物分割方法

《Journal of Hydrology》:D2Mamba: A mamba-based method for floodway obstructions segmentation from multispectral satellite imagery

【字体: 时间:2026年02月01日 来源:Journal of Hydrology 6.3

编辑推荐:

  洪水道障碍物提取需克服高分辨率影像的复杂环境干扰及边界精确定位难题。本文提出D2Mamba框架,通过双域Mamba块提取关键特征,自适应特征融合模块增强上下文表达,双域损失函数协同优化空间频率特征,构建MFOD多光谱数据集验证其优于15种SOTA方法,F1、IoU、OA指标分别提升0.14–14.25%、3.05–24.47%、0.05–14.78%。

  
傅士阳|顾珠军|王月斌|张立强|顾海燕|吴家胜|廖光辉
中国地质大学(北京)地球科学与技术学院,北京100083,中国

摘要

河道障碍物是加剧洪水风险的重要人为因素,在防洪和生态保护中起着关键作用。现有的障碍物提取方法面临两个主要限制。首先,高分辨率可见光图像对光照和地形非常敏感,这限制了其在复杂水文环境中的适用性。其次,大多数方法无法准确捕捉障碍物的边界,无法满足河道管理的精细要求。为了解决这些问题,我们提出了D2Mamba自动化障碍物提取框架。该方法首先使用双域Mamba块(DDMB)提取关键障碍物特征,然后采用自适应特征融合模块(AFFM),该模块利用注意力机制在同一层次上融合编码器特征,从而增强表示能力。为了平衡双域特征学习,我们设计了双域损失函数(DLoss)来约束空间域和频率域特征的联合优化。为了评估所提出的D2Mamba的有效性,我们构建了一个多光谱河道障碍物数据集(MFOD),包含8301张图像及其对应的掩膜。综合实验表明,D2Mamba在MFOD上的性能优于15种最先进的方法(SOTA),F1分数、IoU和OA分别提高了0.14–14.25%、3.05–24.47%和0.05–14.78%。此外,该方法在 Datengxia 地区的大规模障碍物提取中也表现出强大的适应性。

引言

洪水是全球最频繁和影响范围最广的自然灾害之一,常常造成灾难性后果,包括人员伤亡和财产损失(Zarei等人,2025年)。这些后果严重阻碍了经济发展和社会进步(Garg等人,2024年;Tellman等人,2021年;Zhao等人,2024年;Khodaei等人,2025年)。在导致洪水的因素中,河道障碍物已成为一个关键的人为因素。这些障碍物是指任何改变水流方向、阻碍水流或减少河道横截面积的活动,包括水坝、桥梁、鱼塘、采砂场、码头、建筑物、森林等地(Horn和Brown,2017年)。通过破坏河道的自然形态,障碍物显著增加了淹没风险,并引发生态后果,如生物多样性丧失(Grill等人,2019年;Sofi等人,2020年;Sun等人,2024年)、水文连通性变化(He等人,2025年;Hübinger等人,2024年;Sun等人,2024年)以及河流破碎化(Hübinger等人,2024年;Wu等人,2025年)。因此,迫切需要开发一种准确高效的大规模障碍物提取方法。
近年来,地球观测技术的迅速发展推动了卫星遥感数据的爆炸性增长,这支持了河道障碍物的大规模测绘(Belward和Sk?ien,2015年;Zhu等人,2017年;Zhu和Qiu,2022年)。关于河道障碍物的研究大致可以分为两类:利用可见光图像的研究(He等人,2025年;Sun等人,2024年;Wu等人,2025年)和基于合成孔径雷达(SAR)图像的研究(Hübinger等人,2024年;Jaramillo等人,2018年;Liu等人,2020年)。SAR数据在部分遮挡区域具有显著优势,主要是因为其能够穿透云层和植被。然而,其有限的空间分辨率通常会降低提取的准确性和全面性。可见光图像提供了连续的高分辨率空间信息,但对光照和复杂背景非常敏感,在复杂水文环境中的表现不佳。值得注意的是,多项研究证实了近红外光谱对水体、植被和建筑物的反射特性,使其在水环境监测中非常宝贵(Babaeian等人,2016年;Shastry等人,2023年;Zhao等人,2024年)。因此,结合高分辨率可见光和近红外图像的大规模障碍物提取方法显示出巨大潜力。
早期的障碍物提取主要依赖于人工实地调查(Jones等人,2019年;Sun等人,2020年)和半自动化的人机交互解释(Atkinson等人,2018年;Yang等人,2022年)。实地调查可以精确收集障碍物的属性(如形状、大小、坐标),但河流生态系统的复杂性和障碍物的分散分布使得大规模实地工作极具挑战性。半自动化解释结合了遥感图像和地理信息系统(GIS),在一定程度上优化了数据处理流程。然而,解释的准确性很大程度上取决于操作人员的经验和专业知识,难以避免主观误差。虽然这些传统方法在早期研究中实现了初步监测,但其固有的局限性,如效率低和主观性强,无法满足大规模、高效河道监测的实际需求。
深度学习的快速发展为解决上述挑战提供了一种新方法。凭借其强大的特征提取和模式识别能力,深度学习已广泛应用于水环境领域。它已成功应用于多种任务,如海洋油膜检测(Jiao等人,2024年;Li等人,2023年)、洪水监测(Garg等人,2024年;Saleh等人,2024年;Wan等人,2025年)和水产养殖池塘(Han等人,2023年;Qi等人,2025年;Wang等人,2023年)。此外,一些研究人员还探索了深度学习在研究河道障碍物中的应用。当前的方法主要可以分为两类:基于目标检测的(Sun等人,2024年;Wu等人,2025年)和基于图像分类的(He等人,2025年)。分类方法可以识别输入图像中的障碍物类别,而目标检测方法同时提供分类和定位功能。与传统方法相比,深度学习技术实现了障碍物的自动化提取,显著提高了大规模调查的效率和可扩展性。然而,在复杂水文环境中准确划分精细结构仍然是一个挑战。值得注意的是,最近提出的Mamba模型利用其SSM机制,可以在保持线性计算复杂性的同时,有效地整合全局上下文信息。这使它在捕捉河道中空间分散和跨度较大的障碍物特征方面具有传统CNN或Transformer无法比拟的优势。
然而,现有的通用Mamba变体,如Mamba-UNet(Wang等人,2023年)和SegMamba(Xing等人,2024年),通常仅依赖单域空间建模。因此,它们在复杂水文场景中难以有效抑制环境噪声,在处理模糊边界时容易失败。除了这些架构限制外,现有的障碍物提取方法还面临数据适应性和精度方面的挑战。首先,高分辨率可见光图像对光照和地形背景非常敏感,限制了其在复杂水文环境中的鲁棒性。其次,大多数现有方法无法准确捕捉障碍物的精细边界。这种细节缺失阻碍了障碍物区域的全面和准确表示,从而无法满足河道治理中精确决策的关键要求。
为了解决这些问题,我们提出了D2Mamba,这是一个结合Mamba模型的河道障碍物分割框架。首先,使用DDMB从复杂水文环境中提取障碍物的关键特征。其次,使用AFFM有效融合来自编码器的上下文特征,以实现自适应特征整合,从而增强表示能力。最后,设计DLoss,一个结合空间域和频率域损失项的联合优化目标函数,对双域特征学习施加协同约束,提高模型的泛化能力和鲁棒性。本研究的主要贡献如下:
  • 1)
    我们通过整合可见光和近红外光谱图像开发了MFOD,涵盖了多样的地貌环境和多源传感器数据。
  • 2)
    D2Mamba网络是专门为障碍物提取设计的,包含三个关键组件。DDMB用于从复杂水文环境中提取障碍物的关键特征。AFFM用于增强特征表达。DLoss用于约束空间域和频率域的双域学习。这些组件协同工作,以实现河道障碍物的准确识别。
  • 3)
    在MFOD上进行了涉及15种最先进方法(SOTA)的比较实验,以验证所提出方法的优越性。进行了消融研究,以量化每个模块的单独贡献,同时使用大规模河道障碍物调查来验证模型的泛化能力。
  • 本文的其余部分结构如下。第2节回顾相关工作。第3节详细介绍研究区域和数据预处理程序。第4节介绍所提出的D2Mamba的设计和技术实现。第5节展示实验设计、结果和深入讨论。第6节总结本文和未来的工作。

    部分摘录

    河道障碍物研究

    河道障碍物的大小和形状各不相同,是洪水灾害形成的关键人为因素,影响水流动态和洪水演变过程。早期研究主要集中在基本地理信息的收集上。像GRanD(Lehner等人,2011年)、AMBER(Belletti等人,2020年)、GROD(Yang等人,2022年)和GDAT(Zhang和Gu,2023年)这样的数据集主要记录了特定类型障碍物的地理坐标和基本属性,限制了

    研究区域和数据集

    在本节中,我们首先介绍研究区域概述,然后详细阐述从多光谱遥感图像构建数据集的整个过程,包括数据预处理、标签生成和质量控制,以提供高质量的数据支持,用于训练和评估障碍物提取网络。

    方法论

    河道障碍物具有两个显著特征:1)形态多样性广泛且结构复杂;2)通常发生在复杂的水文环境中,难以与周围区域区分。
    为了克服上述挑战,我们提出了D2Mamba,这是一个结合空间-频率双域技术的自动化提取框架。如图3所示,DDMB通过双分支协作实现特征互补。

    实施细节

    为了评估所提出模型的性能,我们将数据集分为8:2的训练-测试比例。这确保了模型在训练、优化和评估过程中获得足够的有效数据。在接下来的第5.4节中,我们讨论了不同训练和测试集比例对网络性能的影响。
    为了确保公平比较,D2Mamba和所有15种最先进模型(SOTA)都在配备了16个Intel(R) Xeon(R) Gold的高性能计算平台上进行了评估

    结论

    从遥感图像中准确高效地识别河道障碍物及其边界对于河道管理决策非常重要。然而,现有方法往往忽略了障碍物边界的细节和光谱特征。为了解决上述问题,我们提出了D2Mamba,这是一种从多光谱图像中自动提取障碍物的新方法。具体来说,D2Mamba创新性地整合了空间域和频率域的特征表示,包括

    CRediT作者贡献声明

    傅士阳:撰写——原始草稿、可视化、验证、软件、资源、项目管理、方法论、调查、正式分析、数据管理、概念化。顾珠军:撰写——原始草稿、验证、软件、资源、方法论、调查、正式分析、数据管理。王月斌:撰写——审阅与编辑、撰写——原始草稿、验证、监督、项目管理、调查、资金获取、数据管理,

    利益冲突声明

    作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。

    致谢

    本工作得到了中国国家自然科学基金(项目编号42171388)的支持。此外,本工作还得到了中国地质大学北京高性能计算平台的支持。
    感谢专家审稿人的建设性评论,这些评论改进了本工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号