《IEEE Aerospace and Electronic Systems Magazine》:Accelerating Diffusion-Based Denoising Model With Optimized Time Steps
编辑推荐:
本文针对扩散模型在图像去噪任务中采样速度慢、计算成本高的问题,提出了一种无需重新训练的后处理时间步优化方法。研究人员通过最小化扩散ODE的离散化误差,为非均匀最优调度序列建立理论框架,并在多种去噪模型上验证了该方法的有效性。实验表明,优化调度能在显著减少函数评估次数(NFE)的同时,保持甚至提升图像复原质量。这项研究为扩散模型在实时图像处理等领域的实际应用提供了可行的加速方案。
扩散概率模型(DDPM)在图像生成和修复领域取得了突破性进展,尤其是在图像去噪、去模糊和天气退化去除等任务中表现出色。然而,其迭代采样过程通常需要数百甚至上千次顺序函数评估,导致计算成本高昂,严重限制了在智能手机、视频处理和医学影像等实时应用场景中的实用性。传统的加速方法如DDIM虽然减少了采样步数,但通常采用均匀的时间步调度,未能充分考虑去噪过程中不同阶段动态特性的差异。早期阶段主要恢复图像的低频结构,而后期阶段则专注于高频细节的重建,均匀调度在步数有限时无法高效分配计算资源。因此,开发一种能够自适应分配计算预算的优化调度方法,成为提升扩散去噪模型实际应用价值的关键挑战。
为了解决这一问题,研究人员开展了一项针对预训练扩散去噪模型的加速研究。他们引入了一种名为StepOptim的训练免费优化算法,通过最小化扩散过程对应的概率流常微分方程(ODE)的全局离散化误差上界,为非均匀时间步序列的构建提供理论依据。该方法将连续时间区间离散化为有限序列,并利用数据预测网络逼近ODE的解,通过优化时间步的位置来降低累积误差。与依赖局部误差估计的自适应步长采样器或基于外部指标优化的学习型调度器不同,StepOptim直接最小化内部解析误差界,可在短时间内完成预计算。优化后的调度能够将有限的函数评估次数(NFE)集中分配在去噪轨迹的关键阶段,从而在保持复原质量的前提下实现显著加速。
在技术方法上,该研究主要依托几个关键环节:首先,基于扩散SDE向确定性ODE的转换,建立反向去噪过程的数学框架;其次,采用高阶ODE求解器(如UniPC)结合Lagrange插值多项式进行数值近似;第三,通过误差上界分析将调度问题转化为约束优化问题;第四,将连续时间最优解离散化为整数序列以适应预训练模型;最后,在多个图像去噪任务上验证优化调度的泛化能力。
研究结果通过系统实验验证了优化调度的有效性。在高斯去噪任务中,DDRM模型在CBSD68数据集上的结果表明,优化调度在NFE=12时达到28.51 dB的PSNR,较均匀调度提升近2 dB。同时,优化调度仅需8步即可超越均匀调度16步的性能水平,实现40-50%的加速效果。在WeatherDiffusion模型上的天气退化去除实验中,优化调度在NFE=4时即可匹配基线NFE=10的复原质量,且在低NFE条件下优势更为显著。针对DMID模型的感知-失真权衡分析显示,优化调度能在减少44.9%采样步数的同时保持感知质量(LPIPS)。这些结果一致表明,优化调度通过重新分配计算预算,有效提升了扩散去噪模型的效率-性能曲线。
在模型适应性方面,研究证实了优化方法对多种架构的兼容性。无论是处理高斯噪声的DDRM、复杂天气退化的WeatherDiffusion,还是基于特定起始步长的DMID,优化调度均表现出稳定的加速效果。这一特性使其能够快速部署于现有模型,无需针对不同任务重新设计调度策略。
通过理论分析和实验验证,该研究得出明确结论:基于误差最小化的时间步优化是一种有效的扩散去噪模型加速手段。该方法不仅能够保持复原质量,还能在多种任务中实现显著的加速比,最高可达80%的NFE减少。其训练免费的特性使得现有模型能够快速获得性能提升,为扩散模型在资源受限环境中的实际应用奠定了基础。这项发表于《IEEE Aerospace and Electronic Systems Magazine》的工作,为扩散模型在图像复原领域的实用化发展提供了重要技术支撑,开辟了基于数值优化原理改进生成模型的新方向。