DiffPUIR:一种基于双扩散模型先验约束的即插即用水下图像恢复模型

《Expert Systems with Applications》:DiffPUIR: A plug-and-play underwater image restoration model with dual diffusion model prior constraints

【字体: 时间:2026年03月24日 来源:Expert Systems with Applications 7.5

编辑推荐:

  水下图像修复模型DiffPUIR融合物理模型与扩散模型,通过PnP框架实现双隐式正则约束,设计亮度限制项解决过曝问题,实验表明其优于现有方法在UIEB和LSUI数据集上的表现。

  
王亚珍|尚万清
新乡师范学院数学与统计学院,中国新乡464000

摘要

由于散射和吸收效应,水下图像常常出现模糊和色彩偏移等退化现象。为了解决扩散模型无法有效结合网络模型和物理模型的问题,我们提出了一种新的水下图像恢复(UIR)模型——DiffPUIR,该模型采用了双重扩散模型先验约束。首先,我们使用即插即用(PnP)方法将水下图像形成模型与网络先验相结合,提出了一个新的双重扩散模型先验约束UIR模型,该模型有效地整合了数学模型的可解释性和网络的深度表示能力。首先,通过考虑水下噪声和湍流的干扰,构建了一个新的水下图像形成模型。其次,我们在扩散模型中引入了确定性回归和随机采样作为隐式先验,以实现高保真度的图像恢复并保持良好的感知质量。最后,我们给出了求解所提模型的详细步骤和算法过程。在不同数据集上的实验结果表明,DiffPUIR模型在主观视觉和客观指标评估方面均优于现有方法,对各种类型图像的应用分析实验也验证了该方法的有效性。

引言

作为海洋认知和探索的核心手段之一,水下成像对于提升国家海洋实力具有重要意义(Liu等人,2025-08-14(11))。然而,由于光在传播过程中受到吸收和散射的影响,水下图像常常出现色彩失真、对比度低和细节丢失等问题。因此,水下图像恢复(UIR)任务受到了广泛关注。传统UIR方法大致可以分为两类:一类是像素级处理方案,如水下暗通道先验(UDCP)(Drews等人,2013)、红色通道先验(RCP)(Galdran等人,2015)和小波基视觉感知融合(WWPF)(Zhang等人,2023)方法;另一类是基于水下图像形成模型(UIFM)的方法,例如图像模糊和光吸收(IBLA)(Peng和Cosman,2017)以及水下归一化总变分(Xie等人,2021)方法。尽管这些方法能够在一定程度上改善水下图像的退化,但其实际应用受到计算复杂度过高和模型参数依赖性过强的限制。
近年来,数据驱动的方法受到众多研究者的青睐,主要包括基于卷积神经网络(CNN)(Zheng等人,2024)的方法和基于生成对抗网络(GAN)的方法(Zhao等人,2025)。典型的CNN架构包括用于水下图像增强的比较学习框架(CLUIE-Net)(Li等人,2022);深度Inception和通道级注意力模块(DICAM)(Tolie等人,2024);以及用于水下图像增强的Segment Anything模型(Wang等人,2025)。代表性的GAN方法包括水下GAN(UGAN)(Fabbri等人,2018);快速水下图像增强GAN(FUnIE-GAN)(Islam等人,2020);以及隐式神经引导的循环GAN(Li等人,2025)。尽管这些方法可以有效提高水下图像的质量,但由于网络架构的特性,它们也存在固有的局限性。具体来说,基于CNN的方法对数据的依赖性强,且在复杂退化场景下的泛化能力较差;而基于GAN的方法则存在训练不稳定的问题。
为了解决上述问题,研究人员越来越多地将扩散模型引入水下图像处理任务中。扩散模型在UIR中的核心思想是通过前向过程逐渐向水下图像添加噪声,然后通过反向过程从含噪图像中恢复清晰水下图像的噪声分布。例如,Tang等人(Tang等人,2023)通过非均匀跳跃采样策略减少了扩散模型的迭代次数,并提出了一种轻量级的基于变压器的去噪网络。Du等人(Du等人,2025)将预训练的扩散模型(捕获自然图像先验)与现有算法相结合,提出了一种有效的带扩散先验的UIR方法。Zhu等人(Zhu等人,2025)提出了一种基于傅里叶变换的双通道扩散网络,该网络利用频域信息和扩散模型的特性实现高质量恢复。尽管基于扩散的UIR方法在性能上有所提升,但这些方法仍然缺乏来自水下物理成像模型的有效约束,并且在模型训练过程中计算成本较高。
从上述分析来看,传统UIR方法在处理不同程度退化的水下图像时难以保留细节和随机视觉感知特征。同时,数据驱动的方法缺乏来自确定性物理成像过程的约束,导致恢复的图像与真实水下图像特征不一致,且计算复杂度较高,存在过拟合风险。
为了使UIR方法在物理保真度和视觉感知自然性之间达到理想的平衡,并受到双重扩散模型(RDMD)(Wang等人,2025)的启发,我们将扩散模型与UIFM结合以提升恢复性能。具体来说,RDMD是一种用于零样本图像恢复的基于扩散的算法,其示意图如图1所示。其核心创新在于双路径设计,它结合了反向扩散过程中的随机采样灵活性和确定性回归的稳定性。图2展示了一个明确的对比实验,可以看出RDMD在UIR中的性能不如所提出的方法。这归因于我们方法中UIFM的引导作用,确保了恢复的图像更符合水下场景的固有视觉特性。此外,我们采用PnP框架在双重扩散模型先验下构建了一个通用的UIR模型(INR),通过加入数据项和亮度约束项。所提出的模型可以有效协调水下图像的物理失真校正和感知细节保留,从而增强了其在不同场景类型中的适用性。本文的主要贡献如下:
(1) 首次提出了一种新的UIR模型,该模型通过PnP框架将水下图像形成模型与扩散模型相结合,并引入了双重INR约束。
(2) 设计了亮度约束项以避免恢复图像过曝,同时通过扩散模型引入确定性回归和随机采样作为UIR模型的隐式正则化项。
(3) 在不同的水下图像数据集上的综合实验和不同场景下的应用测试实验表明,我们的方法优于现有的竞争方法。

小节片段

用于图像恢复的去噪扩散模型

去噪扩散概率模型(DDPM)(Ho等人,2020;Wang等人,2024;Shi等人,2024)是一种生成模型,它将各向同性高斯分布转换为数据分布。它主要由前向噪声添加过程和反向去噪过程组成。DDPM的前向过程是一个马尔可夫链,逐渐向数据x0
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号