《International Journal of Computer Assisted Radiology and Surgery》:Dynamic uncertainty-level assessment framework for real-time needle tracking in CT-guided surgical environments
编辑推荐:
目的:准确的针追踪对于计算机断层扫描(computed tomography, CT)引导的介入手术的成功至关重要,即使微小的偏差也可能危及手术安全性和临床结果。然而,现有的图像引导追踪系统通常缺乏量化并实时传达其预测可靠性的机制,使得临床医生不得不依赖于可信
目的:准确的针追踪对于计算机断层扫描(computed tomography, CT)引导的介入手术的成功至关重要,即使微小的偏差也可能危及手术安全性和临床结果。然而,现有的图像引导追踪系统通常缺乏量化并实时传达其预测可靠性的机制,使得临床医生不得不依赖于可信度不确定的指导。
方法:研究人员提出了一种动态不确定性水平评估框架(Dynamic Uncertainty Level Assessment Framework),通过将预测的不确定性得分与空间追踪误差线性关联,提供定量的实时追踪可靠性估计。该框架包含三种不同方法:(1)一种基于动态加权、可解释可靠性度量的经典方法;(2)一种轻量级卷积神经网络(convolutional neural network, CNN),直接从多视图图像数据预测不确定性;以及(3)一种混合CNN,在保持可解释性的同时自适应优化度量权重。不确定性水平定义在固定尺度上,0%对应于理想追踪(误差0毫米),100%对应于追踪误差10毫米。
结果:在临床和临床现实实验室数据集(约30,000帧)上的实验验证显示,不确定性与误差之间存在强正相关(Pearson r > 0.82),并实现了稳定的追踪误差估计(误差差异<0.6毫米),且具有实时性能(每帧5毫秒)。
结论:通过实现直观的不确定性到误差映射,所提出的框架支持更明智的术中决策,增强操作者对指导数据的信任,并为集成到不确定性感知的CT引导介入系统奠定了基础。
在计算机断层扫描(computed tomography, CT)引导的介入手术中,如经皮穿刺活检和肿瘤消融,精确的针追踪对于手术成功至关重要。即使微小的空间偏差也可能导致非诊断性样本或组织损伤。然而,现有图像引导追踪系统通常只输出坐标,缺乏实时量化并传达预测可靠性的机制,临床医生被迫依赖可信度不明的指导。为解决这一关键空白,研究人员提出了一种动态不确定性水平评估框架,旨在将抽象的不确定性转化为临床可理解的度量,从而增强术中决策和操作者信任。该研究通过建立不确定性水平与物理跟踪误差之间的线性校准(0%对应0毫米误差,100%对应10毫米误差),实现了实时、定量的可靠性估计。论文发表在《International Journal of Computer Assisted Radiology and Surgery》。
为开展研究,研究人员主要采用了以下关键技术方法:三种不确定性评估方法:(1)经典方法,基于12种可解释度量(检测、校准、环境、运动、时间、系统性能指标),通过动态加权和自适应故障安全机制计算可靠性得分;(2)全卷积神经网络(convolutional neural network, CNN),一种轻量级残差架构,输入两个同步RGB帧及辅助环境通道(光照、遮挡),直接回归不确定性;(3)混合CNN,基于MobileNetV3-Small架构,接受11个归一化度量值作为输入,预测动态权重以保持可解释性。数据集来自Research Campus STIMULATE, Magdeburg,包括临床数据集(约22,000帧,使用AprilTag真值)和半临床数据集(约8,000帧,使用Atracsys光学追踪器真值)。五根活检针(10–20厘米,14–18G)在腹部体模前操作,三个软件同步RGB相机(1920×1080像素)提供多视图图像,U-NetConvNeXt模型用于无标记针尖和基部估计。所有方法均在独立测试集上评估,帧处理时间低于10毫秒。
研究结果部分包含以下内容:
评估指标:采用跟踪误差(预测与真值之间的三维欧氏距离)、Pearson相关系数(r)衡量不确定性与误差的线性相关性,平均绝对误差(MAE)量化预测误差与实际误差的差异,以及帧处理时间评估计算效率。
不确定性-误差相关性验证:通过计算Pearson r,所有方法在所有数据集上均显示r > 0.82,表明不确定性与跟踪误差之间存在强正相关,验证了核心假设。
动态系统性能:分析时间序列图发现,在初始不稳定阶段框架分配高不确定性,稳定后不确定性低于10%;快速位移时不确定性成比例增加并迅速恢复。方法比较显示:全CNN达到最高精度(MAE=0.48毫米,7.2毫秒),经典方法接近最优精度(0.53毫米,5.1毫秒)且完全可解释,混合CNN(0.54毫米,9.7毫秒)平衡了可解释性和适应性,所有方法均实时。
场景评估:四个代表性场景使用全CNN方法展示。稳定条件下不确定性低于17%,误差低于1.7毫米;跟踪退化与恢复时不确定性升至40%以上且误差大于4毫米,恢复后逐渐下降;快速运动与相机遮挡导致不确定性超过80%,峰值误差大于10毫米,系统自主恢复;完全工具遮挡下不确定性超过80%,误差大于10毫米,但偶尔在无效输入时报告中等不确定性,暴露了视觉阻塞下的局限性。
讨论部分总结了三种方法的互补优势:全CNN精度最高,经典方法效率最优且可解释性强,混合CNN在适应性与透明度之间取得平衡。局限性包括:(1)单中心、仅体模验证,缺乏体内或多中心测试;(2)固定线性0–10毫米校准可能不适用于所有临床情境;(3)全局不确定性缺乏空间区分(如针尖与基部特异性);(4)未进行临床用户验证以评估可理解性和信任度;(5)假自信场景分析有限;(6)跨解剖区域和CT实验室环境的泛化性不确定。
研究结论:本研究介绍了一种用于CT引导介入手术中实时针追踪的动态不确定性评估框架。通过建立不确定性水平与物理跟踪误差之间经过验证的线性关系,该框架将抽象的可靠性转化为临床可操作的度量,提高了手术安全性和操作者信任。三种方法均实现了实时性能,并具有互补的权衡:全CNN提供最高精度,经典方法提供最佳效率和可解释性,混合CNN在适应性和透明度之间取得平衡。研究人员正在积极与介入放射科医生进行临床验证。未来工作将集中于将该框架嵌入到具有器械内和视觉反馈的闭环手术系统中。