可靠的环境感知是自主海上导航的基础(Wang, 2023, 2024)。为了支持常规操作、海上交通监控和应急响应,船载系统必须能够在动态的海况下持续检测和跟踪周围的目标(Shao, 2025; Zhao et al., 2025)。海上平台通常具有有限的计算和能源预算,因此需要实时且稳健的感知算法(Z. Sun et al., 2021a)。此外,高度变化的海上气象条件加上分布稀疏的小目标给自主感知带来了巨大挑战(Miao, 2025; Wu, 2025)。因此,在各种天气条件下实现可靠和高效的检测对于自主水面船舶的安全和运营可行性至关重要。
大多数现有的海上感知系统依赖于可见光谱图像,因为它们具有高分辨率、低成本和操作便利性(Ma et al., 2025)。然而,在大雾中,大气散射和光衰减会严重降低场景对比度并引入噪声(S. Sun et al., 2025; Zhou et al., 2025)。海上目标通常距离较远、尺度不平衡且分布稀疏,这进一步复杂化了特征提取和多尺度融合任务,最终降低了召回率和精度,尤其是对于小目标(Meng et al., 2023; Qiu et al., 2023)。因此,在恶劣天气条件下实现稳定和准确的船舶及海上障碍物视觉检测仍然是一个未解决的研究挑战。
针对雾天视觉退化的研究主要分为两个方向。第一个方向是图像去雾技术,旨在从退化的观测中重建高对比度图像(Agrawal and Jalal, 2022a)。传统方法依赖于手工制作的先验和参数调整,包括区域对比度增强(Gao et al., 2020)或基于超像素的非线性变换来抑制过度增强和光环伪影(Agrawal and Jalal, 2022b)。基于深度学习的去雾技术减少了人工干预并提高了图像保真度,通常结合了通道-空间注意力机制(Liu et al., 2022)或嵌入大气散射先验(An et al., 2021)。虽然去雾技术可以提高下游检测效果,但它也会改变图像统计信息和空间梯度。
第二个方向强调直接在雾天图像上进行检测(Hu et al., 2023; Li et al., 2023; Zhang and Hu, 2023)。陆地场景的进展包括多模态融合和模型架构的改进。RGB和深度特征的多模态对齐提高了鲁棒性(Chen et al., 2018),而对轻量级检测器的架构修改扩展了感受野并增强了多尺度表示(Meng et al., 2023)。随着大规模真实世界雾数据集的发展,陆地基准和评估协议也变得越来越标准化。
在海上环境中,研究主要集中在改进深度检测器架构上,偶尔辅以去雾模块。多尺度特征融合已被证明对于低能见度下的无人水面车辆(USV)检测有效(X. Sun et al., 2021),自适应通道-注意力机制提高了多分支网络的特征质量(Chen et al., 2025)。结合去雾和分割的框架也减轻了对比度退化和边界不确定性(Sun et al., 2022)。然而,由于缺乏海上雾数据集,进展仍然有限。
合成雾生成越来越多地被用来解决这一限制(Abbasi et al., 2023; Wang et al., 2024)。基于大气散射的合成方法(Zhang et al., 2017)是基础性的,但依赖于手动深度估计。后续工作引入了使用启发式结构假设的深度约束(Yang et al., 2024),而生成方法将散射机制嵌入神经生成器中以提高真实感(Ai et al., 2024)。尽管大气散射对于物理真实性仍然至关重要,但深度表示已经从粗糙的手动指导发展为隐式的生成建模,提高了真实感和真实性评估。
大多数海上检测方法采用两阶段或一阶段范式(Z. Sun et al., 2021b, 2025)。两阶段检测器(例如Faster R-CNN)在分类和回归之前生成区域提案,因此通常能够实现高精度(Chen et al., 2022; Zhang et al., 2019; T. Zhao et al., 2024)。最近的变体利用了自我监督、注意力机制和传感器感知先验(Jian et al., 2022; Xu et al., 2023)。特征金字塔网络在解决尺度不平衡问题上仍然处于中心地位(Wang et al., 2019)。
由于快速推理和硬件兼容性,一阶段检测器(例如YOLO、SSD)越来越受到海上应用的首选(Khanam and Hussain, 2024; Yang et al., 2025; Zang et al., 2025)。最近的改进集中在多尺度融合、自适应加权、动态卷积和噪声抑制注意力上(He et al., 2025; Wu et al., 2025; Xu et al., 2025; B. Zhao et al., 2024)。视觉-Transformer架构,包括基于DETR的混合模型,引入了全局关系建模和更强的跨模态迁移能力(Yu and Shin, 2025; Zhang and Huang, 2025),但通常会增加计算复杂性。
尽管取得了进展,但仍然存在两个关键挑战。首先,用于海上感知的恶劣天气数据集仍然稀缺。去雾预处理器会改变像素分布,可能破坏空间一致性,从而影响检测效果(Agrawal and Jalal, 2022b; Liu et al., 2022)。现有的合成雾数据集通常依赖于简化的深度或光学建模,与真实雾图像之间存在明显的差距(Yang et al., 2025; Zhang et al., 2017)。这削弱了训练效果和评估的有效性。
其次,当前的模型改进往往在鲁棒性和实时性能之间做出牺牲。两阶段方法提高了精度,但计算成本较高(Jian et al., 2022; Xu et al., 2023),而一阶段检测器在低对比度条件下表现较差,尤其是对于小目标(Wu et al., 2025; B. Zhao et al., 2024)。基于Transformer的混合模型提高了精度,但引入了延迟和部署挑战(Yu and Shin, 2025; Zhang and Huang, 2025)。
为了解决这些限制,本研究做出了以下关键贡献:
(1)基于物理的雾生成流程:一个结合单目深度估计和大气散射的雾生成框架,能够产生可控且符合物理规律的雾分布。
(2)FoggySea基准数据集:引入了一个多密度、多尺度的海上数据集,并使用AuthESI指标进行验证,以确保其照片真实感和可重复用于训练和评估。
(3)轻量级YOLOv11增强:对比度感知注意力模块(SAB)和结构感知可学习上采样模块(SCEU)在几乎不增加计算开销的情况下提高了特征提取和小目标区分能力,支持在USV上的部署。
(4)混合雾训练和鲁棒性评估:实验和消融研究证实了在浓雾条件下以及对小目标的检测效果提升,展示了强大的泛化能力和实际应用性。
本文的其余部分组织如下。第2节描述了雾生成框架和模型改进。第3节进行了实验评估和分析。第4节总结了工作并概述了未来的研究方向。