扩散模型正则化的隐式神经表征用于CT金属伪影减少

《Quantitative Biology》:Diffusion model-regularized implicit neural representation for computed tomography metal artifact reduction

【字体: 时间:2026年01月12日 来源:Quantitative Biology 1.4

编辑推荐:

  本文提出了一种创新的无监督深度学习框架INR-DR,通过结合隐式神经表征(INR)的物理约束能力和扩散模型(DM)的先验知识正则化,有效解决了CT金属伪影减少(MAR)这一逆问题。该方法利用INR将CT图像表示为连续函数,通过精确的CT前向投影模型确保数据一致性,同时借助预训练DM提供的图像分布先验避免了解空间的不合理性。实验表明,该方法在合成数据和临床牙科CT数据上均优于现有方法,尤其在大尺寸金属植入物和跨部位泛化场景下展现显著优势。

  
引言:CT金属伪影的挑战与现有方法局限
计算机断层扫描(CT)在医学诊断中广泛应用,但金属植入物引起的射束硬化效应会导致正弦图数据严重缺失,使金属伪影减少(MAR)成为典型的不适定逆问题。传统线性插值法和基于先验图像的方法存在正弦图不连续性问题,而监督学习方法受限于配对数据稀缺和分布外泛化能力不足。当前双域网络虽能融合正弦图与图像域信息,但物理成像约束的整合仍不充分。
INR-DR方法框架:双域约束与先验正则化的协同
本研究提出的INR-DR框架包含两个核心组件:隐式神经表征(INR)模块负责通过多层感知机(MLP)和哈希编码层将CT图像建模为坐标到像素值的连续映射函数,从而实现精确的CT前向投影计算,其损失函数直接约束金属痕迹外区域的数据一致性。扩散模型(DM)模块则通过Tweedie公式实现单步去噪,将INR生成的图像向真实CT分布对齐。具体流程中,INR网络每训练1000轮后,会对当前表征图像添加高斯噪声至扩散步长t,再通过预训练DDPM去噪生成先验图像,最后通过L2损失将先验知识注入INR参数更新。
实验结果:跨尺寸金属与临床场景的卓越性能
在合成DeepLesion数据集上,INR-DR在五组不同尺寸金属植入物(2061至35像素)的测试中均表现优异。对于大尺寸金属,其PSNR(38.28 dB)和SSIM(0.9789)显著超过监督方法InDuDoNet+(0.54 dB提升)和扩散方法DuDoDp(2.89 dB提升)。在临床牙科CT数据中,该方法在多重金属植入物场景下有效避免过抑制现象,完全保持牙齿结构完整性,而对比方法则出现明显的次级伪影。
消融实验:组件贡献与编码策略验证
去除DM先验时,INR在金属封闭区域无法重建胸椎等关键结构,PSNR下降2.12 dB;仅使用DM进行正弦图修复会导致拼接不连续,引发暗条纹伪影,PSNR降低6.2 dB。哈希编码与傅里叶编码对比实验表明,采用2层64神经元MLP配合哈希编码即可实现细节保留,而同等参数下的傅里叶编码结果出现显著模糊。时间步长采样间隔实验发现,间隔50步时能在性能与计算成本间取得最佳平衡(97.52秒推理时间)。
讨论与结论:无缝合重建与强泛化能力
INR-DR的创新性在于通过连续函数表征避免正弦图拼接,从根本上消除次级伪影生成路径。其无监督特性使其对金属形状、扫描协议变化具有天然适应性,在训练数据未覆盖的牙科CT场景仍保持稳定性能。该方法为MAR领域提供了物理约束与数据驱动先验相结合的新范式,具有临床推广潜力。
方法细节与参数配置
INR网络采用16级分辨率哈希编码,每级特征维度8,哈希表大小219。DM使用DDPM框架,在927,802张无伪影CT图像上预训练。优化过程中,扩散步长t从1000开始每50步递减,当t<200时减少INR训练轮数以加速收敛。所有实验在NVIDIA RTX 4090显卡上完成,单例推理时间约1.5分钟。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号