基于AI辅助的膝侧位X光摆位评估:一项提升放射技师判读一致性及准确性的外部验证研究

《Radiography》:External validation of a pre-trained hybrid convolutional neural network in radiographers agreement of positioning in lateral knee radiographs

【字体: 时间:2026年02月23日 来源:Radiography 2.8

编辑推荐:

  本刊推荐:针对膝侧位X光摆位评估存在主观性、技师间一致性不足的问题,本研究通过外部验证预训练的混合卷积神经网络,为放射技师提供实时颜色编码的AI决策支持。结果显示,AI辅助轻微提升了判读准确性与特异性,并改善了技师间的一致性(ICC从0.52升至0.59),但并未取代专业判断。研究表明AI工具有助于标准化放射成像质量评估流程,同时维护技师的独立临床决策能力。

  
膝侧位X光检查是诊断膝关节损伤与退行性病变的基石,其图像质量直接影响诊断准确性。然而,技师对图像摆位(尤其是股骨髁对齐情况)的评估,高度依赖个人经验与主观判断,导致不同观察者之间存在显著差异。随着检查量的增加,技师工作压力增大,疲劳可能导致评估错误风险上升。传统上,这可能导致不必要的重拍,增加患者辐射暴露和医疗成本。尽管人工智能(AI)在医学影像分析领域展现出巨大潜力,但其作为决策支持工具,如何影响放射技师的批判性思维和临床判断,特别是能否在提升效率的同时保持专业自主性,仍是一个悬而未决的问题。为此,来自VIA大学学院的Simon Lysdahlgaard等研究者在《Radiography》上发表了一项研究,旨在外部验证一个用于评估膝侧位X光股骨髁对齐情况的预训练AI模型,并量化其作为决策支持工具对放射技师分类表现的影响。
为了回答上述问题,研究人员主要运用了以下关键技术方法:1)使用一个基于Xception架构、在4000张膝X光片上预训练的混合卷积神经网络(CNN)AI模型。2)构建一个新的数据集,包含从同一影像部门连续收集的400张负重膝侧位X光片,并由两位资深报告放射医师(分别有15年和8年经验)建立关于股骨髁理想摆位的“共识参考标准”。3)招募来自三家不同机构的9名临床诊断放射技师,使用定制软件,在无AI辅助和有AI辅助(提供颜色编码反馈:绿色为接受,红色为拒绝)两种条件下,独立对400张图像进行分类(接受或拒绝),两次评估间隔一个月以消除记忆偏倚。4)采用卡方检验、诊断准确性指标(敏感性、特异性)、固定效应荟萃分析和组内/组间相关系数(ICC)进行统计分析。
研究结果显示:
  • AI模型自身性能:与共识参考标准相比,AI单独判断的准确率为78.4%,敏感性为52.3%,特异性为85.8%。参考标准认为77.7%的图像可接受,AI的判断与之接近(77.2%)。
  • AI对放射技师分类的影响:总体而言,AI支持使图像被分类为“接受”的比例从73.4%显著增加至77.2%(P<0.001)。根据参考标准,图像被正确分类的比例从84.5%上升至89.8%(P<0.001)。具体而言,使用AI后,技师的敏感性(正确识别需重拍图像的能力)下降,而特异性(正确识别可接受图像的能力)上升。
  • 观察者间与观察者内一致性变化:无AI辅助时,所有9名观察者的组间一致性ICC为0.52,在获得AI评估结果后上升至0.59。然而,按医院分层分析时,一致性变化模式不同(例如,医院A的ICC从0.71降至0.53,而医院C则从0.49升至0.67)。观察者内一致性(ICC)在有AI和无AI支持下均处于中等至高度水平,但观察者6是个例外,其ICC值较低(0.22)。
  • 个体差异:临床经验最短(3年)的放射技师(观察者6)受AI工具影响最大。在没有AI支持时,其特异性表现近乎随机,而在AI辅助下提升至接近完美;但敏感性却呈现相反的变化趋势。
研究结论与讨论指出,这项研究表明AI决策支持可以适度提高放射技师对膝侧位X光摆位评估的准确性和特异性,并促进判断的一致性。然而,这种提升是以牺牲对次优摆位图像(可能需要重拍)的识别能力(敏感性下降)为代价的。这意味着,使用该特定AI工具可能导致更多诊断质量受损的图像被接受。一个关键发现是,AI并未凌驾于专业判断之上或导致对AI建议的盲从,经验丰富的临床从业者在获得实时反馈后仍保持了独立的决策能力。研究特别强调,临床经验最浅的技师对AI的依赖度最高,AI帮助其避免了大量不必要的重拍,但副作用是更不加批判地接受了更多AI的错误分类。这凸显了在临床实施AI前,不仅需告知其益处,还需明确其缺陷和潜在陷阱,这对于经验不足、对自身专业技能信心较低的技师尤为重要。传统的摆位评估具有主观性,而AI提供了一种标准化的途径。尽管有调查显示放射技师对AI持积极态度,但多数人未经过正式培训即开始使用,因此AI系统的直观性、易用性至关重要。本研究的局限性包括数据集规模有限、缺乏多样性,且图像拒绝率(基于严格的摆位标准)远高于临床常规报告的废片率,AI在更典型废片率(如5%)环境下的表现尚不明确。未来,实时反馈的AI系统,甚至能指导如何为患者或X射线管重新摆位,具有广阔前景。总之,AI工具的实施需要辅以针对性培训,让使用者充分了解其优势与短板,以确保其在提升放射成像质量评估一致性的同时,不损害临床判断的自主性。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号