ClinReadNet:一个基于临床阅片经验的低剂量腹部CT图像质量评估网络

《Neural Networks》:ClinReadNet: A clinical reading-inspired network for low-dose abdominal CT image quality assessment

【字体: 时间:2026年01月02日 来源:Neural Networks 6.3

编辑推荐:

  本文提出ClinReadNet深度学习框架,针对腹部低剂量CT图像质量评估问题,通过Sobel有序质量网络提取边缘特征与全局质量分布,结合多尺度温度多头自注意力机制模拟 radiologist的观察逻辑,并设计分层排名概率得分损失函数优化评估精度。实验表明其PLCC达0.9507,SROCC 0.9554,KROCC 0.8629,综合性能优于现有方法。

  
Xianye Xiao | Yulong Zou | Yujie Luo | Taihui Yu | Cun-Jing Zheng | Yuan-ming Geng | Shuihua Wang | Yudong Zhang | Jin Hong
南昌大学数学与计算机科学学院,中国330031

摘要

在腹部CT成像中,优化辐射剂量与图像质量之间的平衡至关重要,而首要的前提是准确的图像质量评估。临床实践中通常以医生的主观判断作为金标准,但这既耗时又成本高昂;因此,开发一种低剂量、无参考的图像质量评估(No-reference IQA)模型,该模型能够模拟医生的阅读习惯来评估CT图像质量,具有重要的实际价值。本文提出了一种基于深度学习的新型框架ClinReadNet,其设计符合放射科医生的临床阅读逻辑:首先,引入了Sobel序数质量网络(SOQN)模块,该模块能够同时关注与图像质量高度相关的边缘细节和整个图像的质量分布模式,准确匹配医生“兼顾局部细节和整体背景”的阅读习惯;其次,该框架集成了(移位)窗口多尺度温度多头自注意力((S)W-MTMSA)模块,进一步再现了放射科医生从整体扫描到局部聚焦的阅读过程,并通过多锐度注意力准确锁定感兴趣区域;第三,设计了分层排序概率得分(HRPS)损失函数,该函数结合了粗略分类和精细分类的双重逻辑,同时考虑了分级标签之间的距离信息,有效提升了图像质量评估的性能。在LDCTIQAG2023数据集上进行的实验表明,所提出的方法达到了当前的最先进(SOTA)性能:皮尔逊线性相关系数(PLCC)、斯皮尔曼等级相关系数(SROCC)和肯德尔等级相关系数(KROCC)分别达到了0.9507、0.9554和0.8629,它们的绝对值之和(Score)为2.7690,优于现有方法。

引言

CT扫描依赖于X射线成像,而X射线是一种电离辐射,这一特性导致了CT应用中“辐射剂量与图像质量”之间的核心矛盾(Sadia等人,2024年)。一方面,高辐射剂量的CT扫描可能会增加受检者长期患癌症的风险;对于需要多次随访扫描的患者来说,这种累积辐射暴露的健康危害尤为突出(Sodickson等人,2009年)。另一方面,如果过度降低X射线输出以减少辐射剂量,会导致CT图像中的噪声和伪影显著增加(Slaney和Kak,1988年)。这反过来可能会掩盖细微的病变或使病变边界模糊,干扰医生对病变性质的判断,最终影响临床诊断的准确性。
因此,在CT成像过程中,必须在确保CT图像满足准确临床诊断要求的同时,尽可能最小化辐射剂量。这使得医学成像领域越来越重视图像质量,使用有效的图像质量评估(IQA)方法来评估CT图像变得至关重要。
对于IQA,临床实践仍然将医生的主观判断视为金标准(Chow等人,2016年)。然而,基于医生的评估既耗时又成本高昂(Chow和Paramesran,2016年)。在这种背景下,提出了一系列IQA方法。这些方法通常分为三类:全参考(FR)、降级参考(RR)和无参考(NR)方法(Wang和Bovik,2006年)。其中,两种广泛使用的图像质量评估(IQA)性能指标——峰值信噪比(PSNR)和结构相似性指数(SSIM)(Wang等人,2004年)——常用于量化FR-IQ方法的性能。FR-IQA和RR-IQA方法都依赖于参考图像来进行评估。然而,在现实世界的临床场景中,获取相应的参考图像往往具有挑战性。因此,NR-IQA方法已成为临床设置中最合适的选择(Chow和Paramesran,2016年)。
根据技术原理的不同,主流的NR-IQA方法可以分为两大类:传统的非深度学习方法和基于深度学习的方法。传统的非深度学习方法的典型例子包括自然图像质量评估器(NIQE)(Mittal等人,2012年)和盲/无参考图像空间质量评估器(BRISQUE)(Mittal等人,2012年)。这些方法基于自然图像的统计规律设计。然而,医学图像在解剖结构和噪声特性方面与自然图像有显著差异,导致预定义的统计模型无法准确匹配医学图像的质量退化特征,从而经常导致评估结果的偏差(Lee等人,2022年;Mason等人,2019年)。基于深度学习的方法在医学图像分析领域展现了巨大潜力(Liu等人,2026年;Cheng等人,2026年;Wan等人,2024年;Gao等人,2024年),并在腹部CT图像质量评估方面也取得了进展(Lee等人,2025年)。然而,它们仍存在局限性:首先,大多数方案仍然局限于借鉴图像分类任务的改进思路来提升质量分级性能;其次,大多数现有研究未能关注与图像质量高度相关的边缘特征,也未充分考虑医学图像分级的独特序数特性,没有围绕这一核心特征构建有针对性的模型架构;第三,相关研究尚未尝试从放射科医生的临床图像阅读逻辑中汲取设计灵感,导致模型的评估逻辑与实际临床解读习惯之间存在脱节,这可能阻碍这类模型在临床中的采用和医生的信任度。
为了解决上述问题,我们提出了一种名为ClinReadNet的新型腹部CT图像质量评估框架。我们的方法符合放射科医生的常规图像阅读逻辑:通过建立详细的和全局信息的协同学习机制,我们模拟了医生“首先从宏观角度把握整体质量,然后从微观角度检查局部细节”的观察过程;通过增强边缘特征的提取,我们符合医生对器官边界清晰度和组织层可区分性的关注;通过利用质量标签的渐进式梯度特性优化模型训练,我们匹配了医生“质量等级从优秀逐渐过渡到差”的主观判断逻辑。
具体来说,我们采用Swin Transformer作为模型的基本架构,首先将IQA任务视为分类任务,然后创新地在网络的浅层设计了Sobel序数质量网络(SOQN)模块:该模块通过Sobel算子增强边缘细节的准确提取,同时融合全局质量等级信息,实现了从两个维度(局部结构和宏观质量)协同提取特征,为后续的质量评估提供了坚实的特征基础。此外,考虑到腹部CT图像质量特征的多尺度特性,我们提出了(移位)窗口多尺度温度多头自注意力((S)W-MTMSA)模块,该模块可以分别捕捉粗略、中等和精细的质量特征。通过自适应权重调整机制,它保持了与医生“从宏观到微观”图像阅读逻辑的一致性。此外,为了优化模型训练过程,我们设计了分层排序概率得分(HRPS)损失函数:该损失函数采用“两层评估”结构,首先进行整体初步的图像质量评估,然后进行质量分数的精细校准,其逻辑与临床实践中的应用场景高度兼容。本文的贡献如下:
  • (i)
    我们提出了一种新型的腹部CT图像质量评估框架ClinReadNet,该框架通过协同整合SOQN、(S)W-MTMSA和HRPS模块,建立了受临床阅读启发的范式。这一范式明确模拟了放射科医生的工作流程——从全局背景把握到局部细节检查,从粗略筛选到精细评分——从而显著提升了模型的性能。
  • (ii)
    我们开发了SOQN模块,该模块通过联合处理边缘结构和序数质量分布,明确编码了“兼顾局部细节和整体背景”的逻辑。
  • (iii)
    我们构建了(S)W-MTMSA模块。该模块通过新颖的多温度注意力机制实现了“从宏观到微观”的阅读逻辑,实现了自适应的焦点切换,模仿了放射科医生的观察模式。
  • (iv)
    我们设计了分层排序概率得分(HRPS)损失函数,使其分层结构体现了“从粗略到精细”的诊断判断过程,确保模型的预测以临床上合理的方式尊重质量等级的序数特性。
  • (v)
    我们的框架在基准数据集上取得了优异的性能:在LDCTIQAG2023数据集上,它获得了当前最先进(SOTA)的皮尔逊线性相关系数(PLCC)0.9570、斯皮尔曼等级相关系数(SROCC)0.9554、肯德尔等级相关系数(KROCC)0.8629,以及所有相关系数的总和(Score)2.7690。

医学图像分级

近年来,医学图像分级领域发展迅速且深入。它不同于普通的图像分类任务——分级任务侧重于“层次化判断”,涵盖两个核心方向:疾病分级和图像质量评估。

在疾病分级研究中,多种技术方法为自动化分级提供了丰富的解决方案:对于糖尿病视网膜病变(DR)分级,Huang等人(Huang等人,2021年)提出了基于病变的自监督方法

ClinReadNet的总体架构

ClinReadNet的总体框架如图1所示,由三个主要组件组成:Sobel序数质量网络(SOQN)模块、(移位)窗口多尺度温度多头自注意力模块((S)W-MTMSA)和分层排序概率得分(HRPS)损失。对于输入的腹部CT图像,该网络采用结构化的处理流程,为高效完成图像质量评估任务提供技术支持。
Swin-T被用作

数据集

LDCTIQAG2023(Lee等人,2025年):LDCTIQAG2023数据集是专门为2023年低剂量计算机断层扫描(LDCT)大挑战赛设计的评估数据集,其核心价值在于高度模拟了真实的临床场景。该数据集包含1,500张增强对比度的腹部CT图像,所有图像的大小均为512×512像素。6位放射科医生根据统一的标准独立对每张图像进行评分(评分范围为0-4,其中0表示质量差,1表示较差

ClinReadNet的性能

本文提出了一种创新框架,该框架整合了SOQN模块、(S)W-MTMSA模块和HRPS损失。
如表2所示,我们对通用分类方法、挑战赛中的最先进(SOTA)方法以及本文提出的方法进行了比较实验。为了进一步直观和可解释地评估所提出的模型,我们采用了Grad-CAM方法为经典的基于神经网络的ResNet模型生成热图(He

结论

本研究提出了受临床图像阅读启发的ClinReadNet模型,该模型利用任务标签的有序特性进行设计。模型设计了SOQN模块,该模块采用双分支结构来关注与图像质量高度相关的边缘特征,利用标签的有序特性,并全面整合局部和全局信息以提高模型性能。(S)W-MTMSA模块的设计借鉴了临床图像阅读的思路,模仿了医生切换

CRediT作者贡献声明

Xianye Xiao:概念化;数据整理;形式分析;调查;方法论;软件;验证;可视化;撰写-原始草稿。 Yulong Zou:软件;调查;验证;可视化;撰写-审阅与编辑。 Yujie Luo:调查;验证;撰写-审阅与编辑。 Taihui Yu:调查;验证;撰写-审阅与编辑。 Cun-Jing Zheng:调查;验证;撰写-审阅与编辑。 Yuan-ming Geng:调查;验证;撰写-审阅与

CRediT作者贡献声明

Xianye Xiao:撰写 – 原始草稿,可视化,验证,软件,方法论,调查,形式分析,数据整理,概念化。 Yulong Zou:撰写 – 审阅与编辑,可视化,验证,软件,调查。 Yujie Luo:撰写 – 审阅与编辑,验证,调查。 Taihui Yu:撰写 – 审阅与编辑,验证,调查。 Cun-Jing Zheng:撰写 – 审阅与编辑,验证,调查。 Yuan-ming Geng:撰写 – 审阅与编辑,

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本研究部分得到了国家自然科学基金62466033)和江西省自然科学基金20242BAB20070)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号