扩散模型正则化的隐式神经表征用于CT金属伪影减少

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Quantitative Biology》：Diffusion model-regularized implicit neural representation for computed tomography metal artifact reduction

【字体：大中小】 时间：2026年01月12日 来源：Quantitative Biology 1.4

编辑推荐：

　　本文提出了一种创新的无监督深度学习框架INR-DR，通过结合隐式神经表征（INR）的物理约束能力和扩散模型（DM）的先验知识正则化，有效解决了CT金属伪影减少（MAR）这一逆问题。该方法利用INR将CT图像表示为连续函数，通过精确的CT前向投影模型确保数据一致性，同时借助预训练DM提供的图像分布先验避免了解空间的不合理性。实验表明，该方法在合成数据和临床牙科CT数据上均优于现有方法，尤其在大尺寸金属植入物和跨部位泛化场景下展现显著优势。

引言：CT金属伪影的挑战与现有方法局限

计算机断层扫描（CT）在医学诊断中广泛应用，但金属植入物引起的射束硬化效应会导致正弦图数据严重缺失，使金属伪影减少（MAR）成为典型的不适定逆问题。传统线性插值法和基于先验图像的方法存在正弦图不连续性问题，而监督学习方法受限于配对数据稀缺和分布外泛化能力不足。当前双域网络虽能融合正弦图与图像域信息，但物理成像约束的整合仍不充分。

INR-DR方法框架：双域约束与先验正则化的协同

本研究提出的INR-DR框架包含两个核心组件：隐式神经表征（INR）模块负责通过多层感知机（MLP）和哈希编码层将CT图像建模为坐标到像素值的连续映射函数，从而实现精确的CT前向投影计算，其损失函数直接约束金属痕迹外区域的数据一致性。扩散模型（DM）模块则通过Tweedie公式实现单步去噪，将INR生成的图像向真实CT分布对齐。具体流程中，INR网络每训练1000轮后，会对当前表征图像添加高斯噪声至扩散步长t，再通过预训练DDPM去噪生成先验图像，最后通过L2损失将先验知识注入INR参数更新。

实验结果：跨尺寸金属与临床场景的卓越性能

在合成DeepLesion数据集上，INR-DR在五组不同尺寸金属植入物（2061至35像素）的测试中均表现优异。对于大尺寸金属，其PSNR（38.28 dB）和SSIM（0.9789）显著超过监督方法InDuDoNet+（0.54 dB提升）和扩散方法DuDoDp（2.89 dB提升）。在临床牙科CT数据中，该方法在多重金属植入物场景下有效避免过抑制现象，完全保持牙齿结构完整性，而对比方法则出现明显的次级伪影。

消融实验：组件贡献与编码策略验证

去除DM先验时，INR在金属封闭区域无法重建胸椎等关键结构，PSNR下降2.12 dB；仅使用DM进行正弦图修复会导致拼接不连续，引发暗条纹伪影，PSNR降低6.2 dB。哈希编码与傅里叶编码对比实验表明，采用2层64神经元MLP配合哈希编码即可实现细节保留，而同等参数下的傅里叶编码结果出现显著模糊。时间步长采样间隔实验发现，间隔50步时能在性能与计算成本间取得最佳平衡（97.52秒推理时间）。

讨论与结论：无缝合重建与强泛化能力

INR-DR的创新性在于通过连续函数表征避免正弦图拼接，从根本上消除次级伪影生成路径。其无监督特性使其对金属形状、扫描协议变化具有天然适应性，在训练数据未覆盖的牙科CT场景仍保持稳定性能。该方法为MAR领域提供了物理约束与数据驱动先验相结合的新范式，具有临床推广潜力。

方法细节与参数配置

INR网络采用16级分辨率哈希编码，每级特征维度8，哈希表大小2¹⁹。DM使用DDPM框架，在927,802张无伪影CT图像上预训练。优化过程中，扩散步长t从1000开始每50步递减，当t<200时减少INR训练轮数以加速收敛。所有实验在NVIDIA RTX 4090显卡上完成，单例推理时间约1.5分钟。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号