UF-SIENet：基于频率选择的图像增强技术，用于水下物体检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月13日 来源：Computer Vision and Image Understanding 3.5

编辑推荐：

　　水下图像增强与目标检测统一框架提出基于物理模型的增强方法，融合频率增强模块FELKA、背景光注意力模块UBAM及模糊引导数据增强BGDA，有效修复水下图像模糊与色偏问题，显著提升YOLOV10-S在DUO数据集的mAP至3.1%。

王浩宇|李金龙|季卫东|林正|张傲东

哈尔滨师范大学计算机科学与信息工程学院，中国哈尔滨，150025

摘要

水下物体检测（UOD）在海洋生态监测、设施检查和资源探索中发挥着重要作用。然而，水下图像通常存在模糊、噪声和颜色失真等问题，严重降低了检测性能。传统的增强方法更注重视觉美观，而忽略了检测模型的需求。为了解决这一矛盾，我们提出了UF-SIENet，这是一个专门用于水下检测的增强网络。我们方法的核心是频率增强低级知识聚合（FELKA）模块，该模块通过使用可学习的低通滤波器将特征分解为高频和低频成分来估计传输图，然后自适应地融合这些成分以提高结构和语义的一致性，在具有挑战性的水下条件下改善细节保留。为了估计背景光，我们整合了水下背景注意力模块（UBAM），该模块同时应用通道注意力和空间注意力，使网络能够专注于信息丰富的区域，同时抑制背景干扰。这种基于注意力的机制提高了光照不均匀场景中的估计鲁棒性。我们还提出了模糊引导的数据增强（BGDA）方法，该方法利用模糊区域的先验来引导检测模型关注模糊区域，从而提高对各种视觉退化的鲁棒性。在DUO和TrashCan数据集上的广泛实验表明，UF-SIENet在各种模型上都能持续提高检测精度，在YOLOV10-S上最高可提升3.1%的AP值。

引言

海洋覆盖了地球表面的71%，是重要的栖息地和资源储备（Siyuan Wang等人，2023年）。深入研究海洋环境不仅有助于理解全球气候变化，还在环境保护和新资源开发中发挥着关键作用（Chen等人，2022年）。海洋探索主要依赖于无人机器人，如自主水下航行器（AUV）和遥控潜水器（ROV）。这些机器人通常配备有水下相机，用于检测和监测水下环境（Zocco等人，2023年）。由于水下环境的复杂性——例如光照不足和悬浮颗粒的干扰——视觉感知已成为水下机器人导航和物体识别的核心技术。与声纳成像相比，水下光学成像提供了更丰富的细节，并且更容易获取。因此，高质量的水下图像对于智能感知至关重要。然而，水下环境的复杂性给图像采集和分析带来了重大挑战（Dai等人，2024年）。

水下成像受到光的选择性吸收和散射的限制，导致常见的退化问题，如颜色失真、对比度降低和模糊（Li等人，2021年），这些问题严重影响了下游任务，如水下物体检测。在复杂的水下环境中，物体可能会与背景融为一体，边缘不清晰，甚至完全不可见。因此，有效去除水下图像退化同时提高物体检测能力是一个亟待解决的问题。提高水下图像质量是增强水下物体检测性能的直接途径（Yudong Wang等人，2023年）。现有的研究（Li等人，2021年；Dong等人，2022年）主要采用水下图像增强技术，如颜色校正和对比度增强，来提高图像质量。尽管这些方法改善了视觉质量，使图像更适合人类观察，但它们并不一定能提高物体检测性能。它们甚至可能引入伪影或噪声，导致检测结果下降（Xu等人，2023年）。此外，水下图像增强通常与物体检测分开进行。在特定数据集上训练的增强模型直接应用于物体检测任务；然而，由于数据分布的差异，它们的泛化能力有限。最近的研究尝试通过联合训练框架整合水下图像增强和物体检测，旨在通过以任务为导向的方式提高图像质量来改善检测性能（Cheng等人，2023年；Liu等人，2023年）。尽管这些方法很有前景，但它们通常依赖于成对的清晰-模糊图像数据集，而在真实的水下环境中很难收集到这样的数据集。相比之下，基于物理模型的方法（Zhuoyan Liu等人，2024年；Kar等人，2021年；Fu等人，2022年）提供了更实用的解决方案。它们避免了额外成对数据集的需求，并具有更好的理论可解释性。此外，最近的研究探索了损失级引导策略，共同优化增强和检测。在这些方法中，增强模型使用检测性能作为监督进行训练，从而实现无监督学习，提高了其在现实世界中的适用性。

为此，我们提出了UF-SIENet，这是一个基于Koschmieder物理模型（Jaffe，1990年）的水下图像增强和检测统一框架。与采用通用架构的先前工作不同，UF-SIENet明确结合了频率感知设计和任务导向的先验。为了解决模糊空间细节和频域能量不平衡的耦合退化问题，UF-SIENet融合了空间域和频域特征。它在空间域捕获目标的局部纹理和边缘，在频域修复高频边缘衰减和低频颜色偏差，并通过动态筛选机制保留对检测最关键的特征成分。它引入了针对传输图和背景光估计的目标模块，使网络结构与水下退化的物理语义保持一致。这种设计在无监督的联合优化方案下实现了更准确的恢复和更好的检测性能。本文的主要贡献如下：

1.
我们提出了一个即插即用的水下图像增强网络UF-SIENet，通过估计传输图和背景光来恢复水下图像。该网络在无监督损失下与检测任务一起进行联合优化，无需成对训练数据。
2.
我们引入了FELKA，这是一个在空间域和频域都运行的混合特征提取模块，用于传输图估计。它利用动态频率选择模块（DFSM）自适应地分离特征并增强最具信息量的成分以进行恢复。
3.
我们设计了一个轻量级的背景光估计网络，该网络结合了空间注意力，通过关注全局背景区域有效抑制来自海洋生物和前景物体的干扰。
4.
我们提出了模糊引导的数据增强（BGDA）策略，该策略专注于强调退化区域。它通过快速引导过滤生成基于高斯的模糊图，选择性地增强模糊区域并提高模型的鲁棒性。

部分摘录

水下物体检测

由于复杂的环境因素，包括光衰减、悬浮颗粒的干扰以及物体规模的变化，获取高质量的水下图像是一项具有挑战性的任务。因此，水下物体检测比传统的物体检测更为复杂。近年来，深度学习的进步显著推动了水下物体检测的发展。现有的方法主要基于CNN或Transformer

总体框架

所提出的方法包括三个主要部分：（1）用于恢复退化图像的水下图像增强网络；（2）专注于图像模糊区域的数据增强方法；（3）用于水下物体检测的通用物体检测器。总体框架如图1所示。

在水下图像增强网络UF-SIENet中，输入的水下图像由两个分支网络处理。传输图估计分支使用FELKA模块来结合

数据集

我们在两个具有挑战性的水下物体检测数据集上进行了实验，以评估所提出方法的性能。

DUO（Liu等人，2021年）是一个为机器人抓取设计的水下物体检测数据集，检测对象包括四种常见的水下生物：海参、海胆、扇贝和海星。该数据集包含7782张图像和741,545个注释，其中训练集有6671张图像，测试集有1111张图像。

结论

在本文中，我们提出了UF-SIENet，这是一个基于频率选择的水下图像增强网络，它将物理启发的恢复模型与深度学习相结合，以增强水下物体检测。UF-SIENet引入了FELKA模块，该模块将动态频域过滤与大核空间注意力相结合，以提高传输图的准确性。对于背景光估计，采用了增强UBAM的深度网络，从而提高了图像质量

CRediT作者贡献声明

王浩宇：撰写 – 审稿与编辑，撰写 – 原稿，可视化，验证，监督，软件，资源，项目管理，方法论，调查，资金获取。李金龙：撰写 – 审稿与编辑，撰写 – 原稿，可视化，验证，监督，软件，资源，项目管理，方法论，调查，资金获取。季卫东：软件，资源，项目管理，调查，资金获取。林

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了2024年黑龙江省自然科学基金的支持。[资助编号 PL2024F007]

本工作得到了2025年哈尔滨师范大学研究生创新计划的支持。[资助编号 HSDSSCX2025-52]

联系信箱：

粤ICP备09063491号

摘要

引言

部分摘录

水下物体检测

总体框架

数据集

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行