内镜垂体手术中手术器械分割方法的基准测试

《International Journal of Computer Assisted Radiology and Surgery》:A benchmark of methods for surgical instrument segmentation in endoscopic pituitary surgery

【字体: 时间:2026年05月22日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3

编辑推荐:

  目的:微创外科领域有影响力的人工智能解决方案研发依赖于手术器械分割等基础任务。该类任务提供的细粒度信息可支撑手术技能评估、术中决策支持及预后预测等下游应用。然而,许多可从上述应用中显著获益的手术类型因数据采集与标注成本高昂而在现有研究中代表性不足。方法:本研究

  
目的:微创外科领域有影响力的人工智能解决方案研发依赖于手术器械分割等基础任务。该类任务提供的细粒度信息可支撑手术技能评估、术中决策支持及预后预测等下游应用。然而,许多可从上述应用中显著获益的手术类型因数据采集与标注成本高昂而在现有研究中代表性不足。方法:本研究基于自建标注的内镜经蝶垂体手术器械数据集,对比了多种成熟分割模型性能,涵盖Transformer与卷积两类架构。结果:研究表明,EoMT(Encoder?only Mask Transformer)模型取得最优性能,Dice?S?rensen系数(DSC)达0.7420,且在少数类别上保持了更均衡的表现。此外,真实手术视频带来的挑战亦得到体现,包括帧内容高度可变及显著的类别不平衡,低频且与高频类别外观相似的器械类别性能下降明显。结论:上述发现明确了在垂体手术器械分割中具有开发与临床应用潜力的模型架构,同时强调了扩大数据集规模及进一步纳入具有独特挑战的小众手术类型的必要性。
研究背景与意义
内镜经蝶入路(endoscopic transsphenoidal approach, eTSA)是目前垂体腺瘤切除的金标准,该术式因操作空间狭小、邻近重要神经血管结构,学习曲线陡峭且预后预测难度大。外科工作流程分析(surgical workflow analysis, SWA)可为上述难题提供解决路径,其涵盖从手术阶段识别到逐帧语义级手术器械分割(semantic instrument segmentation, SIS)的多层次信息。然而,现有垂体手术相关研究多集中于解剖结构分割,针对手术器械的多类别语义分割缺乏系统性基准测试,且现有公开数据集中的器械形态与该术式所用精细器械差异较大,限制了人工智能模型在该领域的临床转化。为此,研究人员基于单中心临床数据构建了专用数据集,首次针对内镜垂体手术的器械分割任务开展多模型基准测试,旨在明确适用模型架构并揭示现存技术瓶颈。该研究发表于《International Journal of Computer Assisted Radiology and Surgery》。
关键技术方法
研究人员采用Khan等人报道的单中心eTSA手术视频数据集,共纳入50台手术视频,按既定手术步骤均匀抽取无严重遮挡、无长时间静止的有效帧,最终形成包含37?547帧、27?934个器械掩膜、覆盖15种器械类别的数据集,并由临床专家完成标注与审核。研究选取6种代表性分割架构,包括卷积类的U?Net、HRNet、DeepLabV3+,以及Transformer类的Vision Transformer(ViT)、EndoViT、Segformer与EoMT。采用五折交叉验证,按视频分层划分训练集、验证集与测试集,以DSC为核心评价指标,所有模型均基于PyTorch框架在NVIDIA RTX A6000 GPU上完成训练与测试。
研究结果
数据集特征:该数据集呈现显著的器械使用频率差异,反映术者操作偏好与多阶段手术流程特点,且包含烟雾、血液遮挡及器械外观相似等真实手术场景挑战。
模型性能比较:Transformer架构整体优于卷积架构,其中EoMT表现最佳,DSC为0.7420,且在低频器械类别上的性能下降幅度较小,表现出更优的类别均衡性;卷积类模型因缺乏全局上下文建模能力与下采样导致空间信息损失,部分罕见器械类别DSC接近0。EndoViT凭借内镜领域预训练优势,性能仅次于EoMT,参数量为111?M,而EoMT参数量达315?M,计算成本较高。
类别表现规律:高频且外观独特的器械类别(如止血海绵、组织胶)分割精度最高,低频且与高频类别形态相似的器械类别性能显著下降,验证了类别不平衡对小样本类别分割的不利影响。
讨论与结论
研究人员指出,真实手术环境的复杂性是限制模型性能的核心因素,尤其是类别不平衡与器械外观相似性导致的误分割问题亟待解决。未来可通过引入时序建模、领域特异性基础模型及扩充小众类别样本量进一步提升性能。该研究首次提供了内镜垂体手术器械分割的系统基准,明确了Transformer架构在该任务中的优势,为后续算法优化与临床集成奠定了基础。研究同时强调,针对代表性不足的外科手术类型,仍需持续构建高质量数据集并探索适配性更强的模型架构,以推动人工智能在精准外科中的广泛应用。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号