FoggySea:在海洋物体检测中结合合成真实感与低对比度鲁棒性

【字体: 时间:2026年03月13日 来源:Ocean Engineering 5.5

编辑推荐:

  雾天环境下海事自主导航感知研究提出数据与模型双重解决方案:基于物理的大气散射模型与单目深度估计融合生成高真实雾数据集FoggySea,并改进YOLOv11的注意力机制和可学习上采样模块以提升低对比度小目标检测性能。

  
杨子涵|徐天|叶倩|赵亮|白勇|朴哲基

摘要

可靠的海上感知对于安全的自主导航至关重要,然而恶劣的天气,尤其是雾天,会显著降低可见图像的质量并减少检测性能。现有的合成雾数据集也存在照片真实感不足的问题,这在合成环境和真实海洋环境之间造成了明显的差距。因此,仅基于这些数据集训练的感知模型往往会对合成特征过度拟合,无法在真实的海上环境中泛化。为了解决这些问题,我们提出了一种以数据和模型为中心的双重解决方案。首先,我们开发了一个基于物理的雾生成流程,将单目深度估计与大气散射模型相结合,以合成真实的雾效果。利用这一流程,我们构建了FoggySea,这是一个涵盖多种雾密度和不同目标规模的海上基准数据集。通过使用无参考的真实感评估指标AuthESI(Authenticity Evaluator for Synthetic Foggy/Hazy Images),验证了数据集的真实感,证实其与真实雾图像高度一致。其次,我们对YOLOv11基线模型进行了两项感知增强:一种对比度感知注意力模块(SAB),用于在能见度低的情况下提高特征提取能力;另一种结构感知可学习上采样模块(SCEU),用于更好地恢复高分辨率特征和识别小目标。包括混合浓度训练和消融研究在内的全面评估表明,增强后的模型在浓雾条件下表现出一致的性能提升,并且在保持合理计算开销的同时提高了对小目标的召回率。总体而言,这项工作提供了一个真实的雾数据集和一个强大的感知框架,有助于在恶劣天气条件下实现更安全的自主海上操作。

引言

可靠的环境感知是自主海上导航的基础(Wang, 2023, 2024)。为了支持常规操作、海上交通监控和应急响应,船载系统必须能够在动态的海况下持续检测和跟踪周围的目标(Shao, 2025; Zhao et al., 2025)。海上平台通常具有有限的计算和能源预算,因此需要实时且稳健的感知算法(Z. Sun et al., 2021a)。此外,高度变化的海上气象条件加上分布稀疏的小目标给自主感知带来了巨大挑战(Miao, 2025; Wu, 2025)。因此,在各种天气条件下实现可靠和高效的检测对于自主水面船舶的安全和运营可行性至关重要。
大多数现有的海上感知系统依赖于可见光谱图像,因为它们具有高分辨率、低成本和操作便利性(Ma et al., 2025)。然而,在大雾中,大气散射和光衰减会严重降低场景对比度并引入噪声(S. Sun et al., 2025; Zhou et al., 2025)。海上目标通常距离较远、尺度不平衡且分布稀疏,这进一步复杂化了特征提取和多尺度融合任务,最终降低了召回率和精度,尤其是对于小目标(Meng et al., 2023; Qiu et al., 2023)。因此,在恶劣天气条件下实现稳定和准确的船舶及海上障碍物视觉检测仍然是一个未解决的研究挑战。
针对雾天视觉退化的研究主要分为两个方向。第一个方向是图像去雾技术,旨在从退化的观测中重建高对比度图像(Agrawal and Jalal, 2022a)。传统方法依赖于手工制作的先验和参数调整,包括区域对比度增强(Gao et al., 2020)或基于超像素的非线性变换来抑制过度增强和光环伪影(Agrawal and Jalal, 2022b)。基于深度学习的去雾技术减少了人工干预并提高了图像保真度,通常结合了通道-空间注意力机制(Liu et al., 2022)或嵌入大气散射先验(An et al., 2021)。虽然去雾技术可以提高下游检测效果,但它也会改变图像统计信息和空间梯度。
第二个方向强调直接在雾天图像上进行检测(Hu et al., 2023; Li et al., 2023; Zhang and Hu, 2023)。陆地场景的进展包括多模态融合和模型架构的改进。RGB和深度特征的多模态对齐提高了鲁棒性(Chen et al., 2018),而对轻量级检测器的架构修改扩展了感受野并增强了多尺度表示(Meng et al., 2023)。随着大规模真实世界雾数据集的发展,陆地基准和评估协议也变得越来越标准化。
在海上环境中,研究主要集中在改进深度检测器架构上,偶尔辅以去雾模块。多尺度特征融合已被证明对于低能见度下的无人水面车辆(USV)检测有效(X. Sun et al., 2021),自适应通道-注意力机制提高了多分支网络的特征质量(Chen et al., 2025)。结合去雾和分割的框架也减轻了对比度退化和边界不确定性(Sun et al., 2022)。然而,由于缺乏海上雾数据集,进展仍然有限。
合成雾生成越来越多地被用来解决这一限制(Abbasi et al., 2023; Wang et al., 2024)。基于大气散射的合成方法(Zhang et al., 2017)是基础性的,但依赖于手动深度估计。后续工作引入了使用启发式结构假设的深度约束(Yang et al., 2024),而生成方法将散射机制嵌入神经生成器中以提高真实感(Ai et al., 2024)。尽管大气散射对于物理真实性仍然至关重要,但深度表示已经从粗糙的手动指导发展为隐式的生成建模,提高了真实感和真实性评估。
大多数海上检测方法采用两阶段或一阶段范式(Z. Sun et al., 2021b, 2025)。两阶段检测器(例如Faster R-CNN)在分类和回归之前生成区域提案,因此通常能够实现高精度(Chen et al., 2022; Zhang et al., 2019; T. Zhao et al., 2024)。最近的变体利用了自我监督、注意力机制和传感器感知先验(Jian et al., 2022; Xu et al., 2023)。特征金字塔网络在解决尺度不平衡问题上仍然处于中心地位(Wang et al., 2019)。
由于快速推理和硬件兼容性,一阶段检测器(例如YOLO、SSD)越来越受到海上应用的首选(Khanam and Hussain, 2024; Yang et al., 2025; Zang et al., 2025)。最近的改进集中在多尺度融合、自适应加权、动态卷积和噪声抑制注意力上(He et al., 2025; Wu et al., 2025; Xu et al., 2025; B. Zhao et al., 2024)。视觉-Transformer架构,包括基于DETR的混合模型,引入了全局关系建模和更强的跨模态迁移能力(Yu and Shin, 2025; Zhang and Huang, 2025),但通常会增加计算复杂性。
尽管取得了进展,但仍然存在两个关键挑战。首先,用于海上感知的恶劣天气数据集仍然稀缺。去雾预处理器会改变像素分布,可能破坏空间一致性,从而影响检测效果(Agrawal and Jalal, 2022b; Liu et al., 2022)。现有的合成雾数据集通常依赖于简化的深度或光学建模,与真实雾图像之间存在明显的差距(Yang et al., 2025; Zhang et al., 2017)。这削弱了训练效果和评估的有效性。
其次,当前的模型改进往往在鲁棒性和实时性能之间做出牺牲。两阶段方法提高了精度,但计算成本较高(Jian et al., 2022; Xu et al., 2023),而一阶段检测器在低对比度条件下表现较差,尤其是对于小目标(Wu et al., 2025; B. Zhao et al., 2024)。基于Transformer的混合模型提高了精度,但引入了延迟和部署挑战(Yu and Shin, 2025; Zhang and Huang, 2025)。
为了解决这些限制,本研究做出了以下关键贡献:
  • (1)
    基于物理的雾生成流程:一个结合单目深度估计和大气散射的雾生成框架,能够产生可控且符合物理规律的雾分布。
  • (2)
    FoggySea基准数据集:引入了一个多密度、多尺度的海上数据集,并使用AuthESI指标进行验证,以确保其照片真实感和可重复用于训练和评估。
  • (3)
    轻量级YOLOv11增强:对比度感知注意力模块(SAB)和结构感知可学习上采样模块(SCEU)在几乎不增加计算开销的情况下提高了特征提取和小目标区分能力,支持在USV上的部署。
  • (4)
    混合雾训练和鲁棒性评估:实验和消融研究证实了在浓雾条件下以及对小目标的检测效果提升,展示了强大的泛化能力和实际应用性。
  • 本文的其余部分组织如下。第2节描述了雾生成框架和模型改进。第3节进行了实验评估和分析。第4节总结了工作并概述了未来的研究方向。

    部分摘录

    基于物理的雾生成和雾感知对象检测框架

    本研究采用深度估计驱动的大气散射模型来模拟公开可用的海上船舶图像数据集中的雾况。通过在多个能见度级别生成合成图像,该方法旨在提高在恶劣天气下运行的基于深度学习的感知系统的韧性。由此产生的雾退化图像有效地捕捉了真实海上环境中不同雾密度引起的视觉退化,使得

    数据集

    雾生成和对象检测实验使用了公开可用的SeaShips数据集(Shao et al., 2018)。基于该数据集,构建了一个名为FoggySea的增强版本。
    原始数据集包含大约7000张高清晰度船舶图像,分辨率为1920 × 1080,由部署在珠海横琴新区沿海水域的多个监控摄像头拍摄。它涵盖了多样的海上条件和成像场景,包括

    结论

    本研究解决了在低能见度条件下海上对象检测中的两个持续挑战:(1)现有合成雾数据集的光照真实感不足和实用性有限;(2)检测模型对低对比度图像和小目标或远距离目标的鲁棒性降低。我们开发了一个以数据和模型为中心的双重框架来缓解这些挑战。在数据方面,一个基于物理的雾生成流程结合了MiDaS单目深度估计与

    CRediT作者贡献声明

    杨子涵:撰写——原始草稿,资源整理。徐天:撰写——原始草稿,数据整理。叶倩:方法论,概念化。赵亮:调查,资金获取。白勇:监督,资金获取。朴哲基:撰写——审稿与编辑,监督。

    利益冲突声明

    作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号