DSB-net:一种用于水下声纳目标检测的有效动态稀疏贝叶斯网络

【字体: 时间:2026年03月13日 来源:Neurocomputing 6.5

编辑推荐:

  水下声呐图像目标检测存在单次推理不稳定和召回率低的问题,本文提出DSB-Net框架,集成动态稀疏Transformer与贝叶斯融合策略。通过轻量级卷积层预测采样偏移和注意力权重,实现动态稀疏建模以增强对模糊目标的感知能力;同时设计贝叶斯后验融合机制,通过概率建模迭代优化检测结果,抑制噪声干扰。实验表明,DSB-Net在公开和自建数据集上召回率提升9.3%,显著优于现有方法,尤其在复杂水下环境中表现出更强的鲁棒性和适应性。

  
唐胜宇|钱一恒|郭世杰|刘玉云|沈宏伟|于长春
中国海洋大学信息科学与工程学院,青岛266000,中国

摘要

近年来,基于卷积神经网络(CNN)的深度学习方法在目标检测方面展现出了显著的潜力。然而,现有的方法在单次推理性能和声纳图像检测任务的召回率方面仍然存在不足。为了解决这些问题,本文提出了一种高效的检测框架DSB-Net,该框架将动态稀疏Transformer与贝叶斯融合技术相结合,用于对风险敏感的水下声纳图像进行识别。具体而言,我们在主干网络中引入了一个动态稀疏可变形注意力模块。轻量级卷积层用于预测采样偏移量和注意力权重。这种设计使得模型能够自适应地关注关键区域,同时提高了空间感知能力和计算效率。此外,我们还开发了一种贝叶斯融合策略,通过概率建模和迭代来整合多个检测结果。为了验证所提出的框架,我们在真实海洋环境中部署了一艘配备声纳仪器的遥控水下机器人(ROV)进行数据收集和性能评估。在公开数据集和自构建数据集上的实验结果表明,该方法在召回率上提高了9.3%,并且在含糊不清的水下环境中对小目标的识别能力得到了增强。这项工作为视觉检测模型的稳定性和不确定性建模提供了一种新的解决方案,也为风险敏感的水下声纳图像识别和检测任务提供了宝贵的见解。

引言

由于光线和电磁波在深渊环境中的强烈吸收和散射,传统的基于视觉的成像方法效果不佳[36] [60]。相比之下,声波在水中的衰减相对较慢,因此可以实现远距离传输、大面积覆盖和全天候操作。因此,声纳非常适合用于水下感知。目前,声纳成像技术已广泛应用于海底矿物勘探和海洋生物识别等领域[35] [45] [56]。主流的声纳系统包括前视声纳(FLS)、侧扫声纳(SSS)和合成孔径声纳(SAS)。侧扫声纳和多波束回声测深仪通常逐帧获取一维数据,然后根据车辆位置的变化将这些数据拼接起来生成声纳图像或点云。而前视声纳通过实时扫描提供更理想的图像,具有体积小、实时性能高和成本效益高的显著优势。随着水下任务的多样化,水下目标检测已成为一个关键的研究方向。然而,水下环境复杂多变,存在严重的背景噪声干扰和信号衰减失真。因此,在声纳图像中进行目标检测被认为是计算机视觉领域最具挑战性的应用研究方向之一。
声纳图像中的目标检测主要分为两类:传统的机器学习方法和深度学习方法。基于机器学习的方法通常依赖手动设计的特征来捕捉声纳图像中的纹理、形状和强度信息,然后将其输入到传统的目标检测和分类算法中[19] [22] [41]。然而,这些方法存在固有的局限性。特征设计高度依赖于人类专业知识。FLS图像往往分辨率低、噪声大且数据稀疏,这使得特征提取变得困难,并降低了识别性能[30]。此外,这些方法需要大量的参数调整,在复杂的水下环境中鲁棒性有限。
随着深度学习(DL)的发展,卷积神经网络(CNN)在计算机视觉领域取得了重大进展[16] [23] [57]。近年来,YOLO和Faster R-CNN等检测框架在自然图像检测任务中取得了有希望的结果[27] [37],并逐渐被应用于声纳图像[8] [28] [58]。在某些水下场景中,声纳图像的识别准确率已接近人类识别水平[26]。然而,声纳图像是基于声学特性而非视觉特性形成的。声波仅在几何突变位置产生显著回声,因此图像仅包含轮廓而缺乏内部细节。高噪声水平和模糊的轮廓也给传统视觉模型带来了巨大挑战[52]。此外,CNN的局部感受野限制了它们对远距离依赖关系的建模能力[50]。这使得它们在信噪比较低且目标分布稀疏的水下声纳图像检测任务中容易产生误检测和漏检。
由于Transformer架构在自然语言处理任务中的注意力机制方面的优越性,它逐渐被引入到目标检测任务中[15] [17]。基于Transformer架构的DETR利用自注意力机制全局建模特征依赖关系,实现了端到端的检测框架[7]。Deformable DETR通过引入可变形注意力机制大大提高了对稀疏目标的感知能力[65]。RT-DETR进一步优化了推理效率,以满足实时检测的需求[64]。在水下声纳场景中,面对目标的不规则形状、模糊边界和复杂的背景噪声,Transformer的全局建模能力可以突出潜在目标的特征。这表明该架构在声纳图像检测任务中具有巨大潜力。
此外,水下声纳环境中的噪声和混响常常导致预测结果不稳定[63]。在许多实际应用中,如水下矿物勘探,漏检通常比误报更为严重,因此单次推理不足以实现可靠的检测[47]。在这种情况下,贝叶斯推理为在不确定性下的检测提供了一种有效的建模方法[13]。通过概率融合多个推理结果,贝叶斯方法可以抑制偶发的噪声干扰,减轻单次预测的不稳定性,从而提高声纳图像目标检测的可靠性和鲁棒性[31]。
受上述启发,我们提出了一种结合动态稀疏Transformer机制和贝叶斯后验融合策略的声纳图像目标检测方法。首先,我们构建了一个基于动态稀疏Transformer架构的检测网络,其中包含了可变形注意力机制。轻量级卷积层用于预测采样偏移量和注意力权重,实现了动态采样和多尺度可变形注意力,同时降低了计算复杂度。这种设计使模型能够专注于潜在目标区域,同时抑制声纳图像中的噪声干扰。其次,引入了贝叶斯机制以支持不确定性感知。在检测阶段,通过贝叶斯后验更新融合多个预测结果,以获得更可靠的目标位置和置信度估计。在不同的决策场景下进一步评估了不同的不确定性建模概率函数。最后,我们构建并标注了一个自构建的声纳图像数据集,并在复杂的水下场景中进行了广泛实验,验证了所提出方法的有效性。
总体而言,本工作的主要创新点如下:
  • 我们构建了一个基于动态稀疏Transformer架构的检测框架。通过利用可变形注意力和稀疏采样,该方法能够自适应地关注模糊的水下目标,并增强特征表示。
  • 设计了一种贝叶斯后验更新机制来融合多轮推理结果。该机制在极端恶劣条件下提高了检测的可靠性,并增强了模型的鲁棒性。
  • 构建了一个真实世界的水下声纳图像数据集,并进行了仔细的标注,为水下目标检测研究提供了可靠的基准。
  • 在公开和真实世界声纳数据集上的广泛评估表明,所提出的DSB-Net达到了先进的性能水平,在泛化场景中的检测准确性显著提高。
  • 本文的其余部分组织如下:第2节介绍相关工作,第3节介绍DSB-Net的网络结构,第4节描述实验设置并展示全面的实验结果,第5节给出结论。

    相关研究

    相关工作

    本节回顾了水下声纳图像目标检测领域的代表性研究。我们首先总结了为声纳图像开发的传统和基于深度学习的检测方法,然后回顾了基于Transformer的目标检测框架的最新进展,最后讨论了在噪声条件下进行鲁棒检测的不确定性建模和概率方法。

    提出的方法

    本文提出了一种用于复杂水下声纳图像目标检测的动态稀疏随机贝叶斯网络(称为DSB-Net)。其整体架构如图1所示。它主要由一个主干特征提取模块、一个动态稀疏Transformer编码模块、解码模块、一个随机头部模块和一个贝叶斯后验融合模块组成。通过结合动态稀疏建模和贝叶斯置信度更新,该网络在各种条件下实现了稳定和高精度的检测

    实验

    本节首先介绍了构建的水下声纳数据集UFSD及其数据采集过程。然后,我们在公开可用的UATD数据集和我们的自收集数据集上评估了模型性能,并将其与几种最先进的方法进行了比较。最后进行了稳定性分析,强调了在召回率方面的改进。

    结论

    在这项工作中,我们提出了一种名为DSB-Net的有效检测框架,用于水下声纳目标检测。首先,我们提出了一种动态稀疏Transformer机制。通过动态采样和可变形注意力机制,我们减少了计算开销,同时提高了模型对稀疏目标的适应能力。在推理阶段,我们构建了一个贝叶斯后验更新机制,通过概率建模迭代更新结果,以提高稳定性

    CRediT作者贡献声明

    唐胜宇:撰写 – 审稿与编辑,撰写 – 原稿,资源管理,方法论研究,资金获取,形式分析,数据管理,概念化
    钱一恒:撰写 – 审稿与编辑,撰写 – 原稿,可视化,软件开发,资源管理,方法论研究,形式分析,数据管理,概念化
    郭世杰:撰写 – 审稿与编辑,撰写 – 原稿,可视化,验证,软件开发,方法论研究,

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    本工作部分得到了国家自然科学基金(62501553)的支持,部分得到了声学科学技术实验室的稳定支持基金(项目编号JCKYS2025SSJS003)的支持,部分得到了辽宁省自然科学基金(项目编号2025-BS-0231)的支持,以及部分得到了中央高校基本科研业务费(项目编号202413037)的支持。
    唐胜宇于2023年在中国哈尔滨工程大学获得水下声学工程博士学位。他目前是中国青岛海洋大学的助理教授,主要从事水下目标检测与识别研究。
    相关新闻
    生物通微信公众号
    微信
    新浪微博

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号