利用广义非凸总变分正则化和切比雪夫加速的ADMM算法实现高效图像修复
《Computers & Mathematics with Applications》:Efficient image restoration using generalized non-convex total variation regularization and Chebyshev-accelerated ADMM
【字体:
大
中
小
】
时间:2026年05月11日
来源:Computers & Mathematics with Applications 2.5
编辑推荐:
纳伦德拉·库马尔 | 穆努·桑卡尔 | 高拉夫·巴特纳加尔
印度焦特普尔印度理工学院数学系
**摘要**
本文介绍了一种高效的图像去模糊模型,该模型将广义非凸总变分(TV)正则化与超拉普拉斯梯度先验相结合。所提出的方法旨在增强边缘保留和稀疏性,同时保持自然图像的统计
纳伦德拉·库马尔 | 穆努·桑卡尔 | 高拉夫·巴特纳加尔
印度焦特普尔印度理工学院数学系
**摘要**
本文介绍了一种高效的图像去模糊模型,该模型将广义非凸总变分(TV)正则化与超拉普拉斯梯度先验相结合。所提出的方法旨在增强边缘保留和稀疏性,同时保持自然图像的统计特性。开发了一种高效的非线性乘子交替方向法(ADMM)算法,利用切比雪夫方法求解lp最小化问题,实现快速收敛。本文还提供了所提算法的理论收敛性分析。在各种真实测试图像上的广泛实验表明,所提方法在定性和定量指标上都优于现有技术。其峰值信噪比(PSNR)介于37 dB到42.1 dB之间,结构相似性指数(SSIM)在0.95到1之间,特征相似性指数(FSIM)接近完美,特别是在p值介于0.45到0.7的范围内时,性能提升显著。所提出的方法在保留边缘细节方面表现出色,最多只需30次迭代即可收敛,并且证明优于现有最先进的方法。该算法的实现代码可通过https://github.com/nadr123/Image_Restoration获取。
**引言**
在成像科学中[1]、[2]、[3],由于相机运动、光学反射和噪声等因素导致图像质量下降,图像去模糊至关重要。成像系统通常捕获一个尺寸为M×N的原始图像,记为v,并生成一个相应的退化版本,尺寸同样为M×N,记为f。本文重点讨论了一种广泛认可的图像退化模型,其数学表达式为:
★f(x,y) = k(x,y)★v(x,y) + n(x,y),
其中符号★表示标准的二维卷积。在离散形式下,定义为:
f(x,y) = ∑_i=1^M ∑_j=1^N k(i,j)v(x?i,y?j) + n(x,y)。
在上述方程中,(x, y) ∈ {1, 2, ???, M} × {1, 2, ???, N},v(x, y)表示原始图像的像素强度,k(x, y)表示点扩散函数,n(x, y)表示服从正态分布N(0,σ^2)的加性高斯噪声。在此背景下,f、v和n分别表示退化图像、原始图像和噪声的离散版本。模糊矩阵K基于离散的点扩散函数k构建。假设离散图像包含MN个元素,退化模型(1)的矩阵-向量表示形式可写为:
f = Kv + n,
其中f、v、n ∈ R^(M×N),K ∈ R^(M×N)。由于模型(2)涉及卷积,仅凭f定义的域内的值无法确定v的解,因此需要关于边界外数据的假设,这些假设称为边界条件。模糊矩阵K的结构取决于这些边界条件。例如,在狄利克雷边界条件下,K呈块状托普利茨-托普利茨-块状矩阵的形式。然而,狄利克雷条件计算成本较高,且如果真实图像在边界处不接近零,可能会在恢复的图像中引入人为的不连续性(称为振铃效应)。为了减轻这些问题,通常使用周期性边界条件,即将边界外的数据周期性扩展。这些条件使得模糊矩阵K具有块状-循环-块状结构。循环矩阵可以使用快速傅里叶变换(FFTs)高效地对角化。有关详细讨论,可参考[4]、[5]及其中的参考文献。本文假设使用周期性边界条件以增强图像恢复过程。
由于K的条件数很大,直接从f恢复v会导致病态问题,因此需要正则化。为此,定义成本函数E(v)为:
E(v) : R^(M×N) → R,
E(v) = ∑_x,y∈R^M×N P(Rv) + θ^2∥Kv?f∥^2
其中P(Rv)作为正则化项,∥·∥表示弗罗贝尼乌斯范数,θ > 0是一个平衡正则化和保真度之间的参数。正则化利用潜在函数P(x) : R → R对输入进行逐元素处理,R是已知的线性算子(如梯度算子[6]或小波算子[7]),以促进Rv的稀疏性。非负性约束v ≥ 0确保重建图像中的所有像素保持正值。潜在函数对于保留关键图像特征(如锐利边缘和平滑区域)至关重要[8]。在这种情况下,稀疏性先验通常用l0范数[9]表示,即∥Rv∥_0,它计算Rv中非零元素的数量。然而,由于优化l0范数是NP难问题,通常采用凸和非凸替代函数来应对这一挑战。
近年来,基于稀疏性的正则化技术在压缩感知[10]、图像处理[11]、统计学[11]和机器学习[12]等各个领域受到广泛关注。这些依赖于潜在函数的正则化方法通常分为两类:(a) 使用凸潜在函数的模型;(b) 使用非凸潜在函数的模型。鲁丁等人[6]提出的一种著名凸正则化方法是总变分(TV)范数。该方法以其边缘保持能力而闻名,是∥Rv∥_0范数的一个稳健替代方案。当R对应于梯度算子D且潜在函数为P(x) = |x|时,图像v的恢复通过解决以下优化问题实现:
min_v ∈ R^(M×N) ∥Dv∥_TV + θ^2∥Kv?f∥^2
其中∥Dv∥_TV = ∑_(x,y)(Dhv)^2(x,y) + (Dvv)^2(x,y),Dv = (Dhv,Dvv)′ ∈ R^(2×M),Dhv(x,y) = (Dhv(x,y), Dvv(x,y))′表示离散设置中的梯度。算子Dh和Dv分别对应于水平和垂直的一阶有限差分算子。
凸TV先验因其在图像中保持边缘的能力而被广泛使用。然而,TV正则化中使用的l1范数可能会导致偏差,特别是对于较大的系数,这限制了其实现“预言器”属性的能力[13]。TV先验的性能局限包括对比度损失、阶梯效应以及过度平滑的重建结果[14]。在这类正则化方法中,以及相应的算法方面,已有大量文献进行了探索[15]、[16]、[17]、[18]、[19]、[20]、[21]、[22]、[23]。为了解决凸TV正则化引入的伪影问题,研究人员探索了非凸潜在函数[24],这些函数在重建图像中提供了更稀疏的解和更好的边缘保留效果。非凸潜在函数比l1范数更接近l0范数的实际表示。已经提出了几种非凸潜在函数,包括最小-最大凹惩罚(MCP)[25]、有上限的l1惩罚[26]、变换l1惩罚[27]、平滑剪辑绝对偏差(SCAD)[28]、柯西惩罚[29]和对数范数惩罚[30]。然而,为这些最小化问题设计算法尤其具有挑战性,尤其是在处理非利普希茨潜在函数(如lp拟范数0 < p ≤ 1[31]、[32])时。非凸优化问题往往缺乏唯一解,并且可能涉及复杂的数值计算。已经提出了各种模型和相应的优化方法[33]、[34]、[35]、[36]、[37]、[38]、[39]、[40]、[41]、[42]来解决这些正则化问题,推动了该领域的进展。其中,交替方向乘子法(ADMM)已成为处理凸和非凸变分优化问题的常用技术。其吸引力在于它解决某些类型问题时比其他方法更快,尤其是因为它不需要目标函数光滑即可实现快速收敛。这种效率使得ADMM成为处理大规模优化挑战的日益优选方法。更多深入理解可在相关文献[43]中找到。
同时,基于学习的方法[44]、[45]、[46]、[47]因通过在模糊图像和清晰图像配对数据集上训练深度神经网络来恢复清晰图像的能力而受到广泛关注。这些模型在控制良好的条件下通常能取得优异结果。然而,它们的性能高度依赖于训练期间高质量真值数据的可用性。虽然它们能有效处理某些类型的模糊或噪声,但现实世界场景中模糊情况的多样性使得单个模型难以泛化到所有模糊类型或强度。
在基于稀疏性的建模中,先验通常使用?0范数表示,它计算非零元素的数量[9]。然而,直接最小化?0范数是NP难问题,使其实际实现具有挑战性。为了解决这个问题,广泛采用了凸和非凸替代函数。例如,杨等人[15]使用各向同性TV范数作为正则化器,并通过半二次分割方案恢复清晰图像。由于TV范数的不可微性,陶和杨[16]后来引入了基于增强拉格朗日框架的交替方向方法,其中拉格朗日乘子提高了数值稳定性并防止惩罚参数的无界增长。尽管这些方法计算效率高且稳定,但凸模型往往会导致对比度损失、阶梯效应和重建图像的过度平滑。
其他非凸正则化方法也被研究用于克服这些限制。娄等人[48]提出了加权各向异性和各向同性TV范数的差值,表示为L1?αL2(α ∈ [0, 1]),并使用差分凸算法求解。他们的结果表明,L1?0.5L2比L1?L2产生更稀疏的解。为了减少一阶TV模型中的阶梯效应,亚当等人[49]引入了结合二阶TV的混合非凸模型。由于单独的高阶正则化可能引入斑点伪影,因此将其与重叠的组稀疏项结合使用以平衡平滑性和边缘保留。最近,张等人[42]开发了一种非凸对数TV模型,并使用ADMM框架解决了相应的优化问题。
在非凸先验中,超拉普拉斯梯度先验[50]在各种图像处理任务(包括去模糊[51]、[52]、[53]和去噪[52])中表现出高效。例如,在[51]、[52]中引入的迭代加权最小二乘(IRLS)方法使用共轭梯度算法解决图像重建问题。然而,这种方法计算成本较高,需要约100次迭代,且对于简单的lp最小化问题(如min_v ∈ R |v|_p + θ^2|v?y|2,0 < p < 1)也常常无法全局收敛。2009年,Krishnan和Fergus[31]引入了查找表(LUT)方法,用于p ∈ (0, 1)的有效非盲目图像去模糊。该方法结合交替最小化方法和牛顿-拉夫森方案。LUT方法将解存储在对应于变量v和正则化参数θ的不同值的表格中。然而,当v和θ不受约束且p动态变化时,构建和维护查找表需要大量的计算资源和内存。邹等人[32]提出了广义迭代收缩算法(GISA)来处理这些问题。它基于半二次分割方法,适用于任何p值。此外,在[41]、[53]中,为p=12和23推导出了闭合形式的阈值公式,有助于图像去模糊解,但相应算法缺乏全面的收敛性分析。如[31]、[32]、[53]所述,增加惩罚参数会引入显著的数值挑战,导致许多现有方法收敛缓慢。
尽管取得了显著进展,现有的基于梯度的模型仍面临几个根本性挑战。凸方法倾向于过度平滑重要的图像细节,而非凸方法往往对参数选择敏感或理论保证有限。此外,许多算法计算强度大,限制了它们在大规模或实时场景中的适用性。为了解决这些问题并改善收敛率和整体性能,我们提出了一种广义的非凸TV-?p(0 < p < 1)正则化模型。该模型将超拉普拉斯图像先验结合到正则化框架中,有效捕获自然图像的统计特性。我们引入了ADMM作为高效方法,类似于高斯-赛德尔方法,它将最小化问题分解为更小、更易管理的子问题。通过使用拉格朗日乘子,ADMM确保惩罚参数保持有界,从而实现显著的收敛特性。为了解决ADMM中?p最小化问题中出现的非线性方程,采用了高效的切比雪夫方法,该方法最多在一次迭代中即可收敛到精确根。此外,在某些假设下,我们提供了所提方法的理论收敛性分析。在具有不同分辨率的各种真实测试图像上进行了广泛实验,以评估所提模型的性能。研究结果表明,所提出的方法在定性和定量上都优于现有的方法。文章的结构如下:第2节介绍了所提出的模型及其相关的数值算法;第3节对算法的收敛性进行了理论分析;第4节通过各种真实测试图像的实验展示了所提方法的有效性;最后,第5节总结了研究结果并据此得出结论。总的来说,我们在图1中提供了所提方法的整体结构框架。
由于所提出的变分模型是非凸的,因此不同的数值方法和初始条件可能会产生不同的解决方案。在本节中,我们提出了ADMM算法来解决这个最小化问题,该算法旨在改善被模糊和噪声扭曲的图像。
让我们深入探讨选择lp-拟范数和变换域作为梯度的动机。我们在图2(a)和(b)中分别绘制了不同p值的等高线。图2(a)展示了…
收敛性分析
设(v*, w*, λ*)是满足约束优化问题(8)的一阶最优性条件的静止点:
0 = θKT(Kv* ? f) + DTλ*
0 ∈ ?∥w*∥p
p ? λ*
0 = Dv* ? w*
根据以上内容,我们可以得出以下关系:
0 ∈ θKT(Kv* ? f) + DT(?∥Dv*∥p)
这表示所提模型(7)关于静止点的一阶最优性条件。同样地,根据所提出的算法1,子问题v、w和λ的每个迭代步骤如下:
0 = θKT(Kvl+1 ? f) + δDT(Dvl+1 ? wl) + DT…
实验结果
本节评估了所提出的算法1的性能,以评估其有效性和鲁棒性。评估通过以下五个关键方面进行:(i) 定性评估;(ii) 数值收敛性分析;(iii) 边缘恢复和失真评估;(iv) 定量分析;(v) 性能基准测试。
本文提出了一种高效的图像去模糊模型,该模型结合了非凸的非光滑势函数和Hyper-Laplacian梯度先验,以提高边缘保留和稀疏性,从而保持自然图像的统计特性。为了解决所提出的模型,开发了一种强大的ADMM算法,该算法将最小化问题分解为三个具有封闭形式解的子问题。值得注意的是,ADMM中的lp最小化采用了Chebyshev方法,实现了…
CRediT作者贡献声明
Narendra Kumar:撰写 - 原始稿、审稿与编辑、资金获取、数据管理、软件开发、形式分析、可视化、概念化。
Munnu Sonkar:撰写 - 审稿与编辑、调查、形式分析、概念化。
Gaurav Bhatnagar:调查、验证、形式分析、资金获取、撰写 - 审稿与编辑、指导、资源协调。
利益冲突
作者声明没有需要报告的利益冲突。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号