《npj Digital Medicine》:Automated deep learning for real-time focal liver lesions detection in ultrasound videos a multicenter study
编辑推荐:
为解决超声检测局灶性肝脏病灶高度依赖操作者经验、诊断水平存在差异的问题,研究人员开展了“Auto-DFLLs”自动深度学习模型(基于ResNet和FPN架构)用于实时超声视频病灶检测的多中心研究。该模型在三家医院的5258份前瞻性采集视频上训练和验证,表现出高精度(AP50= 0.7772)与临床实用性,能显著提升低年资超声医师的诊断水平(AFROC-AUC提升至79.52),并对小病灶(<10 mm)显示出稳定检测能力,为资源有限地区提供了可靠的实时辅助筛查工具。
肝脏是人体内一个复杂而至关重要的器官,其健康状况与全身机能息息相关。在众多肝脏疾病中,局灶性肝脏病变(FLLs)的早期发现与准确诊断是临床实践中的关键环节,直接关系到后续治疗策略的选择与患者的预后。超声检查因其无辐射、便捷、实时和可重复性好等优点,成为FLLs筛查和诊断的首选影像学方法。然而,这一“首选”方法背后却存在一个长期且普遍的挑战:其诊断性能在很大程度上依赖于操作者——即超声医师的个人经验与技能水平。不同年资、不同经验的医师对同一幅超声图像,特别是那些边界模糊、回声特征不典型的小病灶,可能给出差异显著的解读。这种“操作者依赖性”的变异性,在医疗资源不均、尤其是高年资专家匮乏的地区,可能导致诊断延迟或漏诊,影响疾病的早期干预。为了攻克这一难题,将人工智能(AI)与医学影像相结合,开发能够辅助甚至部分替代人工判读的自动化工具,成为了一个极具前景的研究方向。
为了验证AI模型在真实临床场景中的效能,研究人员开展了一项扎实的多中心研究,并成功开发了名为“Auto-DFLLs”的自动化深度学习模型。该研究旨在回答的核心问题是:能否构建一个稳定、准确的AI模型,实现对超声视频中FLLs的实时、自动检测,并切实提升不同水平超声医师的临床诊断能力?这项研究成果最终发表在顶尖的数字化医疗期刊《npj Digital Medicine》上,为AI赋能超声诊断提供了有力的实证。
为了开展这项研究,团队主要运用了以下几项关键技术方法:首先,研究采用了基于残差网络(ResNet)和特征金字塔网络(FPN)架构的深度学习模型开发技术,构建了Auto-DFLLs模型的核心检测框架。其次,研究实施了严格的前瞻性、多中心数据收集策略,模型训练和验证所使用的5258份超声视频数据,均前瞻性地来自三家不同的医院,确保了数据的多样性和代表性。最后,研究采用了全面的模型性能评估与临床验证方案,包括在内部验证集上计算平均精度(AP50)、精确率(Pr70)等指标,并更为关键地,设计了针对不同年资(低年资与高年资)超声医师的辅助诊断测试,采用替代自由响应受试者工作特征曲线下面积(AFROC-AUC)等临床相关指标来量化模型带来的实际性能提升。
研究结果
Auto-DFLLs模型在内部验证中表现出高性能
研究人员首先在独立的内部验证数据集上对训练好的Auto-DFLLs模型进行了评估。模型展现了优异的检测能力,其核心评估指标平均精度(在交并比阈值为50%时,即AP50)达到了0.7772。同时,在召回率为70%的条件下,模型的精确率(Pr70)为0.7967,而此时的假阳性数量(FP70)被控制在平均每例3.4688个。这些数据表明,该模型能够以较高的准确性和可接受的假阳性率,从连续的超声视频帧中定位并识别出FLLs。
Auto-DFLLs显著提升了超声医师的病灶检测能力
为了评估模型的临床实用性,研究团队组织了一场涉及不同经验水平超声医师的阅读测试。结果表明,Auto-DFLLs的辅助作用非常显著。对于低年资超声医师,在使用模型辅助后,其病灶检测的综合性能(以AFROC-AUC衡量)从71.55提升至79.52,统计上有显著差异(P= 0.021)。令人欣喜的是,模型对高年资超声医师同样具有增益效果,其AFROC-AUC从74.57提升至78.64(P= 0.0366)。这证明Auto-DFLLs不仅能够弥补初学者经验的不足,还能作为“第二双眼睛”协助资深医师,减少因疲劳或疏忽可能造成的漏诊。
模型对不同特征病灶具有稳定的检测性能
研究的进一步分析揭示了Auto-DFLLs模型稳健的泛化能力。模型对不同大小的病灶均保持了良好的检测性能,尤其对于临床诊断难度更大的小病灶(直径小于10毫米),其提升作用依然显著(P= 0.034)。此外,无论病灶的回声特性(高回声、低回声、等回声)、在肝脏中的具体位置,亦或是采集视频所使用的超声设备来自不同生产厂商,Auto-DFLLs的检测表现都保持了稳定。这一特性对于模型在未来不同医院、不同设备环境下的推广应用至关重要。
研究结论与意义
本项多中心研究成功地开发并验证了Auto-DFLLs,一个用于超声视频中局灶性肝脏病变实时检测的自动化深度学习模型。该模型基于大规模、前瞻性收集的多中心临床数据进行训练与验证,不仅在技术指标上表现出高精度,更重要的是,在模拟真实诊断场景的临床阅读测试中,被证实能显著提升低年资和高年资超声医师的病灶检测水平,尤其对小病灶的检测改善明显。模型对不同病灶特征和超声设备展现出的稳定性能,增强了其临床应用的普适性和可靠性。
这项研究的意义深远。首先,它直接针对并有望缓解超声诊断中长期存在的“操作者依赖性”变异问题,通过提供客观、一致的AI辅助,有助于减少因个人经验差异导致的诊断不一致性。其次,Auto-DFLLs作为一个实时检测工具,能在检查过程中即时提示可疑病灶,可能改变超声检查的工作流程,实现“扫查即诊断”的潜力,提高诊断效率。最后,也是最具社会价值的一点,该技术为医疗资源,特别是高水平超声诊断医生资源有限的地区,提供了一种强大、可靠的辅助筛查工具。它能够帮助当地医生更有效地进行肝脏疾病早期筛查,促进医疗资源的公平可及,对提升整体公共卫生水平具有积极的推动作用。这项研究为人工智能在实时医学影像分析,特别是超声领域的临床转化,树立了一个标杆。