《Computers & Education: X Reality》:Surgical proficiency assessment using virtual reality (VR)-based hybrid simulation for minimally invasive procedures
编辑推荐:
本研究针对内窥镜鼻窦手术(FESS)训练中,传统主观评估方法存在偏差和不一致性的问题,开发了一套基于虚拟现实(VR)的混合仿真系统,并利用动态时间规整(DTW)算法和决策树C5.0分类器,实现了对学员手术熟练度(新手/专家)的客观、高精度自动分类。该研究为外科模拟训练提供了数据驱动的客观评估框架,有助于实现个性化反馈,提升微创手术(MIS)培训效率与安全性。
成为一名技术娴熟的外科医生,需要在手术室中经历成千上万小时的磨砺,这个过程不仅漫长,而且在学员逐步走向独立的过程中,始终伴随着对患者安全的潜在风险。传统的外科技能评估多依赖导师的主观评判,容易因报告偏差导致结果不一致。与此同时,虚拟现实(VR)等扩展现实(XR)技术的进步,为创建高仿真、无风险的手术训练环境带来了革命性机遇。然而,如何利用这些技术产生的高保真数据,开发出客观、精准的手术熟练度评估工具,以更高效、更安全地培训外科医生,仍是该领域亟待突破的关键挑战。这项发表在《Computers 》上的研究,正是为了攻克这一难题。
为了回答上述问题,研究团队聚焦于功能性内窥镜鼻窦手术(FESS)——一种在紧邻关键血管、神经的狭小空间内操作的复杂微创手术。研究人员开发了一套创新的VR混合仿真系统,它结合了虚拟环境和可提供触觉反馈的实体手术工具。基于该系统,他们开展了一项旨在客观评估手术技能并实现熟练度自动分类的研究。其核心方法可概括为三点:首先,运用分层任务分析(HTA)将手术过程(如上颌窦开窗术)分解为步骤和“手术动作单元”(surgeme),以结构化方式采集数据;其次,利用动态时间规整(DTW)算法,基于专家组(n=24)的运动轨迹数据估算出“地面真值”(ground truth)参考路径,并计算每位学员(新手n=28)运动特征与此参考的差异距离;最后,将这些距离度量与总操作时间等汇总数据结合,输入决策树C5.0分类器,以区分新手与专家。
4.1. 上颌窦开窗术的分层任务分析
研究采用三级HTA框架,将FESS中的上颌窦开窗术分解为“过程-任务-手术动作单元”层次。这为在高粒度级别捕获学员的运动和时间序列数据提供了结构化基础,使得针对特定手术动作的精细分析成为可能。
4.2. 提出的模型:动态时间规整(DTW)
DTW算法在此研究中有两个关键作用。一是估计地面真值:通过对齐多位专家的运动轨迹,合成一条能代表熟练操作通用模式、同时保留关键风格特征的参考路径,避免了依赖单一专家轨迹可能带来的偏差。二是进行运动轨迹比较:计算每位学员的轨迹与地面真值之间的DTW距离,将高维时间序列数据转化为可用于分类的矩形特征(即距离度量)。相比简单的欧氏距离基线方法,DTW能更好地处理时间轴上的伸缩和速度差异。
4.3. 熟练度分类
研究使用决策树C5.0算法对学员进行分类。输入特征包括由DTW产生的各运动属性(如内窥镜和手术器械的位置、旋转、速度)的距离度量,以及任务完成时间。结果显示,该模型在区分新手和专家方面表现出高准确性。对四个手术步骤的分类准确率在82.69%到92.31%之间,其中步骤4的准确率最高,达到92.31%。
5. 实验与结果
通过对52名参与者(28名新手,24名专家)进行实验,研究验证了所提框架的有效性。数据分析表明,专家在所有步骤中的平均操作时间都显著短于新手。运动学分析进一步揭示,新手倾向于进行更多不必要的、幅度更大的工具运动,轨迹更为混乱;而专家的运动则更稳定、可控。DTW距离度量的统计分析(曼-惠特尼U检验)显示,除了时间变量,多个运动学变量(如工具旋转、内窥镜位置)也能显著区分两组人员。通过五折交叉验证、留一专家出法(LOEO)和自助法(bootstrapping)等一系列鲁棒性分析,证实了分类模型的性能稳定,且不易受个别专家操作风格的影响,DTW方法的性能也持续优于欧氏距离基线模型。
本研究得出结论,通过整合VR混合仿真、HTA、DTW和机器学习分类器,能够构建一个客观、高精度的外科手术熟练度评估框架。该框架成功地将高保真的时间序列运动数据转化为可靠的熟练度分类(新手/专家),其意义重大。它克服了传统评估中主观性强、一致性差的痛点,为外科模拟训练提供了数据驱动的解决方案。通过揭示专家与新手在微观运动模式上的具体差异(如工具路径、速度控制),该系统未来能够为学员提供个性化、有针对性的反馈,明确指出需要改进的技能短板,从而有可能显著加速外科医生的学习曲线,提升微创手术培训的整体效率与安全性。此外,该框架具有通用性,可扩展至其他类型的微创手术乃至更广泛的、需要复杂操作技能训练的领域(如航空、应急管理),为利用虚拟技术实现高效、客观的技能评估与培训指明了方向。