基于单时间戳的腹腔镜胆囊切除术手术复杂度估计方法研究

《International Journal of Computer Assisted Radiology and Surgery》:Learning from single timestamps: complexity estimation in laparoscopic cholecystectomy

【字体: 时间:2026年05月20日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3

编辑推荐:

  摘要 腹腔镜胆囊切除术(Laparoscopic Cholecystectomy,LC)中,准确评估手术复杂度至关重要,严重炎症与较长的手术时间及术后并发症风险增加密切相关。Parkland分级量表(Parkland Grading Scale,PGS)为炎症

  
摘要 腹腔镜胆囊切除术(Laparoscopic Cholecystectomy,LC)中,准确评估手术复杂度至关重要,严重炎症与较长的手术时间及术后并发症风险增加密切相关。Parkland分级量表(Parkland Grading Scale,PGS)为炎症严重程度的分层提供了临床验证框架,但在手术视频中的自动化应用仍较少被探索,尤其是在必须分析完整视频而无事先人工裁剪的现实场景中。本研究提出STC-Net,一种基于单时间戳的PGS手术复杂度估计新框架,可在弱时间监督条件下运行。与以往局限于静态图像或人工裁剪片段的方法不同,STC-Net可直接处理完整视频,并通过定位模块、窗口提议模块及分级模块联合完成时间定位与分级任务。研究人员引入了一种结合硬定位目标与软定位目标以及背景感知分级监督的新型损失函数设计。在包含1859例LC视频的私有数据集上的评估结果显示,STC-Net的准确率为60.18%,F1分数为59.68%,在非定位基线方法上两项指标均提升了超过12%,凸显了弱监督在手术复杂度评估中的有效性。研究表明,STC-Net提供了一种可扩展且高效的自动化PGS手术复杂度估计方法,有望应用于术后分析与外科培训。
论文解读
研究背景
腹腔镜胆囊切除术(LC)是最常见的胆囊切除方式之一,但其术中过程因病理差异而显著变化,从轻度胆绞痛到坏疽性胆囊炎不等。严重炎症会导致手术技术难度加大、手术时间延长及并发症风险上升。为了客观量化炎症程度,临床上采用多种分级系统,其中Parkland分级量表(PGS)因其标准明确和评分者间一致性高而被广泛采用。PGS是一种五分制评分体系,依据胆囊粘连、扩张、坏死等视觉与解剖特征在早期术中判定。然而,现有自动化PGS评估方法多依赖静态图像或人工裁剪的视频片段,难以适应真实临床环境中的完整手术视频分析。完整视频中存在大量无关帧,若缺乏有效的时间定位机制,会显著降低分级准确性。此外,精细标注完整视频的时间区间成本高且存在主观性,因此开发基于弱时间监督的自动评估方法具有重要意义。
研究方法
研究人员构建了一个名为STC-Net的新框架,可在仅提供单时间戳与PGS标签的弱监督条件下,直接从完整LC视频中估计手术复杂度。该框架由三部分组成:定位模块(Localization Module,LM)、窗口提议模块(Window Proposal Module,WPM)和分级模块(Grading Module,GM)。特征提取阶段采用CLIP视觉编码器(ViT-B/16骨干)将视频帧转化为高维表示。LM基于ASFormer模型预测帧级相关性得分;WPM利用峰值检测和高斯拟合动态生成候选时间窗;GM结合局部特征与定位概率进行分级,并通过共识策略输出最终PGS等级。训练过程中采用双重损失策略,包括定位损失(硬二分类交叉熵+软余弦相似度)和背景感知分级损失,分阶段优化以保证定位与分级任务的协同。数据集包含1859例来自多中心、多国家的LC视频,每例均由至少两名经过培训的标注员独立标注PGS等级和单时间戳,并按等级分层划分训练、验证与测试集。
研究结果
Comparison with baselines
在与无时间定位的全视频基线(Full)和基于真实时间戳裁剪的理想基线(Trimmed)的比较中,STC-Net准确率比Full高出13.51%,F1分数提升12.86%,并与Trimmed(20秒、60秒)性能相当,表明弱监督即可达到接近理想定位的效果。混淆矩阵显示,STC-Net在PGS 1级和5级的识别表现优异,中间等级存在一定混淆但多为相邻等级误差,平均距离(AD)仅为0.5,极端等级误判率低。
Ablation studies
移除WPM导致准确率下降14.22%,证明显式时间窗生成的重要性。用固定长度窗口替代动态高斯拟合窗口会降低准确率2.11%,表明自适应窗口更能匹配不同视频的时间分布。单独使用二分类交叉熵损失或余弦相似度损失均不如二者结合效果佳,后者能平衡峰值锐度与邻域平滑性。背景损失项的缺失会导致分级精度下降4.22%。两阶段训练策略优于端到端或分离训练,因为先专注定位再联合优化可提供更稳定的提案。共识策略中,选择最高峰对应提案的分类结果优于平均池化或多数投票。
讨论与结论
研究结果表明,STC-Net能够在仅依赖单时间戳弱监督的情况下,实现对完整LC视频的PGS自动分级,其性能可与依赖真实裁剪视频的方法相媲美。该方法避免了昂贵的人工标注与裁剪工作,适合大规模术后数据分析与外科教学。局限性在于尚未评估跨中心的泛化能力,且当前设计为离线模式,不适用于实时术中指导。未来工作将聚焦于在线版本开发、跨中心验证以及引入解剖先验知识与不确定性估计以减少相邻等级混淆。
结论翻译:
研究人员提出了STC-Net,这是首个可在完整LC视频中基于PGS进行手术复杂度估计的框架,仅需弱时间监督。该框架由时间戳预测的LM、生成候选片段的WPM以及对片段进行分类并聚合结果的GM组成。训练过程中采用了结合软硬时间监督的新型损失函数,以及抑制无关帧的背景感知损失。在大规模数据集上的实验证明了STC-Net的有效性及其在真实世界术后应用中的潜力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号