《Ocean Engineering》:A geometry-aware perspective image enhancer toward underwater 3D reconstruction
编辑推荐:
水下图像增强与三维重建优化研究。针对传统LUT方法在复杂散射环境下背景增强过度、结构细节损失的问题,提出几何感知自适应LUT框架GA-LUT,通过语义引导区间学习动态分配采样能力,结合边缘一致性和角保真度约束增强几何特征,实验验证其显著提升3D重建密度与鲁棒性。
周宇|刘一辉|陈静|朱光宇|范国东
山东技术商务大学计算机科学与技术学院,烟台,264003,中国
摘要
水下3D重建需要稳定的局部特征和清晰的几何结构,但吸收和散射会严重降低水下图像的质量,导致色彩偏移、对比度低和模糊。这些退化现象会干扰特征检测和匹配,通常产生稀疏且不连续的SfM/MVS重建结果。虽然现有的增强方法可以改善视觉效果,但它们并未针对需要保留几何关键信息的下游任务进行优化,例如边缘、角点以及特征匹配性。在实践中,增强处理可能会过度平滑高频特征(如边缘和角点),或者由于背景主导的影响而未能充分增强关键物体区域,从而限制了重建的可靠性。为了解决这些问题,我们提出了基于几何感知的自适应LUT的网络(GA-LUT),这是一个适合水下环境的增强框架。我们引入了基于语义引导的区间学习(SGIL)技术,并通过重要性驱动的采样来优先处理关键区域,以恢复纹理和结构细节;同时结合几何一致性监督(边缘一致性和角点真实性),以保持高频结构的稳定性并提高匹配的鲁棒性。广泛的实验表明,GA-LUT在标准增强指标和视觉质量上都有显著提升,而额外的3D重建研究也证明了其能够生成更密集、更完整的重建结果。
引言
水下图像增强(UIE)旨在减轻介质中的吸收和散射引起的色彩偏移和模糊效应,这是海洋工程和水下视觉应用的基础组件(Anwar和Li,2020;Serikawa和Lu,2014;Zhang等人,2022)。高质量的增强结果不仅提高了人类视觉检查的清晰度和可区分性,还为自主导航、生态监测和水下测绘等下游任务提供了更可靠的视觉输入(Anwar和Li,2020;Eustice等人,2005;Ju等人,2024b;Teixeira等人,2019;Yuan等人,2025;Zhou等人,2025a)。在实际系统中,UIE通常作为前端预处理模块使用,其输出质量直接影响后续算法对场景纹理、结构和物体外观的理解和利用(Anwar和Li,2020;Teixeira等人,2019)。特别是对于依赖特征检测和多视图对应的3D重建流程来说,结构线索(如边缘/角点)的可见性和局部特征的稳定性至关重要;因此,评估UIE时不仅应考虑其视觉质量,还应考虑其作为下游重建的几何友好输入的实用性(Johnson-Roberson等人,2010;Schonberger和Frahm,2016)。
近年来,基于深度学习的UIE方法在色彩恢复和对比度增强方面取得了显著进展(Cheng等人,2025;Fan等人,2025a, 2025b, 2025c;Islam等人,2020a;Park等人,2022)。得益于强大的表示能力,这些方法能够在复杂的退化条件下生成更自然的视觉效果;然而,这些方法通常依赖于庞大的网络架构,因此推理成本较高(Gharbi等人,2017;Park等人,2018)。相比之下,轻量级的映射增强方法(例如查找表式变换)提供了更高效的推理流程(Zeng等人,2020),并已被引入水下增强应用中以实现高效处理(Anwar和Li,2020;Islam等人,2020a)。尽管这些方法在速度和整体视觉质量上有优势,但它们主要针对全局外观进行了优化;当UIE作为3D重建的前端输入时,针对水下内容分布和结构保持的专门调整仍然不足(Anwar和Li,2020;Zeng等人,2020)。
具体而言,当UIE用作3D重建的预处理阶段时,还存在两个关键瓶颈。首先,容量分配偏差。大多数LUT方法使用固定且全局统一的离散格子来建模颜色空间(Zeng等人,2020)。水下图像通常具有大面积的均匀水背景和相对较小的物体区域,这可能导致增强能力偏向于背景变化,而忽视了物体区域中的纹理和结构线索,从而限制了细节恢复和色彩校正(Anwar和Li,2020;Serikawa和Lu,2014;Zeng等人,2020)。其次,缺乏足够的结构保持约束。现有的方法通常优化全局外观和像素级重建(Zeng等人,2020),虽然可以改善亮度、对比度和色彩一致性,但缺乏对高频几何元素(如边缘和角点)的明确约束。因此,在严重散射和噪声条件下,结构细节的保持可能不够稳定,这会影响特征检测和匹配的可靠性(Damblon等人,2025;Lowe,2004;Rublee等人,2011;Song等人,2021)。
为了解决上述问题,本文提出了一种基于几何感知的自适应3D LUT的水下图像增强方法。与传统方法将采样格子视为固定均匀网格不同,我们将LUT采样策略建模为一个适应内容的过程。如图1左侧所示,均匀采样会在均匀背景上浪费容量,并对关键物体区域采样不足,从而削弱细节和结构的表现。因此,我们引入了SGIL,该技术通过预测重建重要性热图来集中采样间隔在与物体相关的颜色范围内,实现以物体为中心、背景稀疏的容量分配。同时,为了在增强过程中进一步稳定高频结构的保持,我们在传统重建目标的基础上加入了几何一致性监督(边缘一致性和角点真实性)。这种设计使得边缘更加清晰,细节更加稳定;如图1右侧所示,它提高了特征质量的可靠性和重建结果的密度。
我们的主要贡献总结如下:
- •
我们提出了一种适用于3D重建的几何友好型水下图像增强框架,其中SGIL通过重要性驱动的分配将增强能力分配给关键物体区域。
- •
在重建损失的基础上,我们引入了两个几何一致性约束(边缘一致性和角点真实性),以明确加强高频结构线索的稳定保持,使增强结果更有利于特征检测和匹配。
- •
广泛的实验表明,GA-LUT在主流增强指标和定性比较中均取得了持续改进,产生了更自然的色彩、更清晰的细节,以及更加稳定和可靠的特征点,在3D重建结果上也获得了额外提升。
部分摘录
基于深度学习的水下图像增强
UIE的发展已经从传统的基于物理模型的方法(例如暗通道先验(He等人,2010)转向了数据驱动的深度学习范式(Hou等人,2023;Ju等人,2024a;Li等人,2019;Ma等人,2025;Zhou等人,2025b)。早期的基于CNN的方法,如WaterNet(Li等人,2019),采用了门控融合架构来混合白平衡和伽马校正后的输入。最近,复杂的设计如U形Transformer(Gu和Dao,2024;Zhang等人)也被引入。
概述
我们的目标是增强水下图像,以实现可靠的多视图几何信息,即生成视觉上更优质的图像,同时为下游的SfM/MVS重建提供稳定的输入。水下退化(色彩偏移、模糊、对比度低)不仅降低了感知质量,还严重削弱了特征检测器和匹配器用于相机姿态估计和三角测量的可重复局部特征和结构线索。因此,UIE的评估不仅应考虑视觉质量,还应考虑其作为下游重建的几何友好输入的实用性(Johnson-Roberson等人,2010;Schonberger和Frahm,2016)。
在最近几年,基于深度学习的UIE方法在色彩恢复和对比度增强方面取得了显著进展(Cheng等人,2025;Fan等人,2025a, 2025b, 2025c;Islam等人,2020a;Park等人,2022)。这些方法得益于强大的表示能力,能够在复杂的退化条件下生成更自然的视觉效果;然而,它们通常依赖于庞大的网络架构,因此推理成本较高(Gharbi等人,2017;Park等人,2018)。相比之下,轻量级的映射增强方法(例如查找表式变换)提供了更高效的推理流程(Zeng等人,2020),并已被应用于水下增强中(Anwar和Li,2020;Islam等人,2020a)。尽管这些方法在速度和整体视觉质量上有优势,但它们主要针对全局外观进行了优化;当UIE作为3D重建的前端输入时,针对水下内容分布和结构保持的专门调整仍然不足(Anwar和Li,2020;Zeng等人,2020)。
具体来说,当UIE用作3D重建的预处理阶段时,还存在两个关键瓶颈。首先,容量分配偏差。大多数LUT方法使用固定且全局统一的离散格子来建模颜色空间(Zeng等人,2020)。水下图像通常具有大面积的均匀水背景和相对较小的物体区域,这可能导致增强能力偏向于背景变化,而忽视了物体区域中的纹理和结构线索,从而限制了细节恢复和色彩校正(Anwar和Li,2020;Serikawa和Lu,2014;Zeng等人,2020)。其次,结构保持约束不足。现有方法通常优化全局外观和像素级重建(Zeng等人,2020),虽然可以改善亮度、对比度和色彩一致性,但缺乏对高频几何元素(如边缘和角点)的明确约束。因此,在严重散射和噪声条件下,结构细节的保持可能不够稳定,这会影响特征检测和匹配的可靠性(Damblon等人,2025;Lowe,2004;Rublee等人,2011;Song等人,2021)。
为了解决这些问题,本文提出了一种基于几何感知的自适应3D LUT的水下图像增强方法。与将采样格子视为固定均匀网格的传统方法不同,我们将LUT采样策略建模为一个适应内容的过程。如图1左侧所示,均匀采样会在均匀背景上浪费容量,并对关键物体区域采样不足,从而削弱细节和结构的表现。因此,我们引入了SGIL,该技术通过预测重建重要性热图来集中采样间隔在与物体相关的颜色范围内,实现以物体为中心、背景稀疏的容量分配。同时,为了在增强过程中进一步稳定高频结构的保持,我们在传统重建目标的基础上加入了几何一致性监督(边缘一致性和角点真实性)。这种设计使得边缘更加清晰,细节更加稳定;如图1右侧所示,它提高了特征质量的可靠性和重建结果的密度。
我们的主要贡献总结如下:
•我们提出了一种适用于3D重建的几何友好型水下图像增强框架,其中SGIL通过重要性驱动的分配将增强能力分配给关键物体区域。
•在重建损失的基础上,我们引入了两个几何一致性约束(边缘一致性和角点真实性),以明确加强高频结构线索的稳定保持,使增强结果更有利于特征检测和匹配。
•广泛的实验表明,GA-LUT在主流增强指标和定性比较中均取得了持续改进,产生了更自然的色彩、更清晰的细节,以及更加稳定和可靠的特征点,在3D重建结果上也获得了额外提升。
数据集和评估指标
为了全面评估GA-LUT的性能,我们在两个公共基准测试数据集上进行了实验:UIEB(Li等人,2019)和EUVP(Islam等人,2020b)。我们的评估遵循了基于数据集的两种不同协议。我们分别在UIEB和EUVP数据集上训练了790对训练图像和1985对训练图像,并使用了完整的参考指标,如峰值信噪比(PSNR)和结构相似性指数(SSIM)来评估100对和200对图像。
结论
为了解决“有效增强能力的不合理分配”和“结构细节减弱”等问题,本文提出了一种用于几何保真的自适应3D LUT框架GA-LUT。在方法层面,我们设计了SGIL模块,通过重要性驱动的统计聚合和区间预测来动态地将有限的LUT表示能力集中在物体区域。
CRediT作者贡献声明
周宇:撰写——原始草稿,概念构思。刘一辉:资源获取,数据管理。陈静:形式化分析。朱光宇:监督,资源协调。范国东:撰写——审稿与编辑,资金筹集。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(项目编号:U24A20219、62272281、62576193、62202268、62301105)的支持;以及山东省泰山学者计划(项目编号:tsqn202306274和tsqn202507240)的专项基金;山东省自然科学基金(项目编号:ZR2025QC712、ZR2024QF305和ZR2025MS985)的支持。