《Digital Signal Processing》:Discriminative-Constrained High-Frequency Diffusion Prior Modeling for Cerebral MRI Super-Resolution
编辑推荐:
本文提出一种结合生成与判别模型的MRI超分辨率方法,通过小波变换分离高低频信息,利用潜在扩散模型生成高频细节并受低频约束,最终通过判别解码器融合处理实现高保真重建,实验表明该方法在多个指标上优于现有SOTA方法且架构更轻量。
Jianheng Guan|Luyan Zhang|Qingshan Long|Hucong Liang|Liqing Du|Jin Zhang
中国广东省中山火炬开发区人民医院,神经外科
摘要
磁共振成像(MRI)的超分辨率(SR)重建在医学成像中发挥着关键作用,它通过增强细微解剖结构的可见性来推动技术进步。近年来,生成模型在SR任务中展示了显著的能力,能够合成更加真实的高频信息。然而,生成模型通常具有较大的随机性,这使得确保结果的稳定性和一致性变得具有挑战性。为了解决这个问题,我们提出了一种新的MRI SR方法,该方法不仅结合了生成模型和判别模型的优点,还能够高保真地重建高频细节。具体来说,我们首先通过小波分解将高频和低频信号分离。高频成分使用潜在扩散模型(LDT)进行建模,而来自低分辨率(LR)图像的低频信息作为条件约束来指导高频细节的生成。最后,通过判别解码器将LR特征和重建的高频特征融合在一起,生成最终的SR图像。定量实验结果表明,我们的方法在多个指标上优于现有的最先进MRI SR方法,同时保持了更轻量级的架构。此外,可视化结果进一步验证了我们在重建高频细节方面的优越性。
引言
磁共振成像(MRI)是一种用于诊断和研究神经系统疾病的非侵入性技术。多对比度MRI能够捕捉不同的组织对比度,但其有限的空间分辨率阻碍了对小病变或细微异常的检测[1]。超分辨率(SR)方法通过提高LR图像的分辨率来增强细节表现。基于深度学习的SR技术已经取得了进展,但端到端的监督模型由于像素级别的损失往往会产生过度平滑的结果[2]。生成模型,如GAN和扩散模型[3],可以合成真实的纹理和结构。潜在扩散模型(LDMs [4])能够在潜在空间中有效建模复杂特征,但强条件约束限制了先验建模,而弱约束则引入了随机性,这对医学成像所需的稳定性构成了挑战。
MRI图像中,简单的、定义明确的低频内容与复杂的、容易被忽略的高频细节之间存在明显的对比。SR的关键在于在准确重建高频成分的同时保持低频的一致性。判别模型能够保持结构一致性,但会产生过度平滑的结果;而生成模型可以生成真实的纹理,但在精确恢复细节方面存在困难。为了解决这个问题,我们将频率处理分开:扩散模型生成真实的高频细节,而判别模型则保持整体结构的完整性。
具体而言,我们首先对低分辨率(LR)和高分辨率(HR)MRI图像应用小波变换,将它们分解为频域表示,以分离低频和高频成分,并进行空间下采样。频率自编码器将HR高频特征压缩到一个紧凑的潜在空间中,而条件扩散模型则根据LR低频信息学习生成HR高频细节。然后解码这些高频成分,并与LR低频成分融合,以重建高保真的HR图像。如图1(c)所示,我们的方法结合了生成模型来处理细节,以及判别模型来保持结构一致性,从而实现了更好的MRI SR性能。我们的主要贡献总结如下:
- •
一种结合了小波技术的判别和生成建模的频域SR框架。
- •
基于LR的约束,以实现稳定和忠实的高频生成。
- •
具有优越解剖细节重建能力的最先进性能。
方法部分
判别模型的范式
端到端的监督方法通常设计分层特征提取和上采样模块(例如SRCNN [5]、EDSR [6]、RCAN [7]),使用L1/L2损失将LR图像映射到HR图像。该领域已经从浅层残差网络发展到深层残差网络[8],从局部感知发展到全局注意力机制,以及从单尺度融合发展到多尺度融合。在医学成像中,SR显示出特别的价值。Pham等人[9]引入了多尺度训练来解决各向异性分辨率问题,并验证了多模态SR的效果。方法
本文提出了一种新的MRI SR方法,其整体框架如图2所示。该方法包括四个主要模块:小波变换(W(?·?))、频域编码器-解码器(E(?·?)和D(?·?))、潜在扩散变换器(LDT)[17]以及逆小波变换(). 给定一个HR图像Ihr和一个LR图像Ilr,整个流程分为预训练阶段和推理(测试)阶段。
预训练阶段:
数据集和评估指标
为了更好地建模高频先验,我们使用了两个公开可用的数据集和一个临床数据集,共计10,000张训练图像。所使用的公共数据集包括IXI2和FastMRI [26]:
IXI:包含600张健康成年人的脑部MRI扫描图像,具有多种序列(T1-、T2-、PD加权)。根据DisC-Dif [25]的方法,578张图像被分为500/6/70用于训练/验证/测试。
FastMRI:从训练子集中选取了3,500张图像用于
扩散超参数
我们评估了扩散步长和噪声调度对重建性能的影响(表2)。使用1000个步长和余弦调度(ID 4)可以获得最佳的性能-效率平衡,实现35.73 dB的PSNR和适中的推理时间(47毫秒)。增加步长超过1000(ID 5–6)虽然能带来微小的提升(≤0.02 dB),但计算成本显著增加(推理时间长达89%)。余弦调度在性能上始终比线性调度高出约0.4 dB
结论
我们提出了一种结合生成和判别建模的多对比度MRI SR框架。输入通过小波变换分解为低频和高频成分,其中LDT在低频线索的指导下合成真实的高频细节,随后进行逆小波重建。这种设计在感知质量和结构保真度之间取得了平衡。在多个基准测试中的实验表明,与现有的最先进MRI SR方法相比,我们的方法有明显的改进。
作者声明
作者贡献:Jianheng Guan:概念构思、方法论、研究、写作——原始草稿。Luyan Zhang:方法论、数据管理、形式分析、写作——原始草稿。Qingshan Long:软件开发、验证、可视化。Hucong Liang:研究、资源支持。Liqing Du:项目管理、监督。Jin Zhang:概念构思、监督、资金获取、写作——审阅与编辑。? Jianheng Guan和Luyan Zhang对这项工作做出了同等贡献。
利益冲突声明
作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:Jin Zhang报告称,设备、药物或供应品、统计分析以及旅行费用由斯德哥尔摩大学提供。如果还有其他作者,他们声明没有已知的财务利益或个人关系可能影响本文所述的工作。