《Physics and Imaging in Radiation Oncology》:An advanced automated pipeline for brain tumour segmentation on magnetic resonance imaging for Gamma Knife radiosurgery
编辑推荐:
背景与目的
对于立体定向放射外科(stereotactic radiosurgery, SRS)而言,颅内肿瘤的精确勾画至关重要,因为靶区定义直接影响治疗结局。研究人员开发并完成了一个基于三维(three-dimensional, 3D)nnU-Net模型的
背景与目的
对于立体定向放射外科(stereotactic radiosurgery, SRS)而言,颅内肿瘤的精确勾画至关重要,因为靶区定义直接影响治疗结局。研究人员开发并完成了一个基于三维(three-dimensional, 3D)nnU-Net模型的多肿瘤自动分割流程的临床集成,该流程适用于脑转移瘤、垂体腺瘤、前庭神经鞘瘤和脑膜瘤。
材料与方法
研究人员基于T1加权磁化准备快速梯度回波磁共振成像(Magnetisation-Prepared RApid Gradient Echo Magnetic Resonance Imaging, MPRAGE MRI)数据,使用nnU-Net架构训练了4个彼此独立的肿瘤特异性模型。模型开发阶段每种肿瘤纳入100例病例(n=400);为评估临床工作流程,另外对每种肿瘤前瞻性处理25例病例(n=100)。采用Dice相似系数(Dice Similarity Coefficient, DSC)、第95百分位Hausdorff距离(95th-percentile Hausdorff Distance, HD95)和平均对称表面距离(Average Symmetric Surface Distance, ASSD)评估模型性能。该流程通过监听器持续监测传入的医学数字成像与通信(Digital Imaging and Communications in Medicine, DICOM)图像,并调用相应的肿瘤特异性分割模型。随后,系统自动将DICOM图像及推断生成的放疗结构集(Radiotherapy Structure-Set, RTSTRUCT)导出至治疗计划系统。
结果
在所有肿瘤类型中,前庭神经鞘瘤取得最高性能[DSC:0.90 ± 0.03;HD95:0.93 ± 0.34 mm;ASSD:0.31 ± 0.09 mm],其次为脑转移瘤[DSC:0.83 ± 0.08;HD95:1.33 ± 0.55 mm;ASSD:0.47 ± 0.19 mm]、垂体腺瘤[DSC:0.81 ± 0.09;HD95:2.39 ± 1.14 mm;ASSD:0.78 ± 0.32 mm]和脑膜瘤[DSC:0.80 ± 0.11;HD95:4.46 ± 3.64 mm;ASSD:1.19 ± 0.80 mm]。所有肿瘤类型均表现出一致性较好的分割性能(SDDSC<0.11),且每例分割可在2至4分钟内完成。
结论
该自动分割流程可实现多种颅内肿瘤的一致且快速勾画,获得了临床可接受的性能指标与效率,适用于SRS。
该论文发表于《Physics and Imaging in Radiation Oncology》,研究聚焦于伽玛刀立体定向放射外科(stereotactic radiosurgery, SRS)计划中的颅内肿瘤自动勾画问题。研究背景在于,SRS依赖极高的几何精度和靶区边界准确性,而磁共振成像(magnetic resonance imaging, MRI)虽然具有优异的软组织对比度,却仍面临几何畸变、信号不均一、病灶边界复杂以及人工勾画耗时长、观察者间变异(inter-observer variability, IOV)明显等问题。随着当日MRI至治疗的快速SRS流程逐渐增加,临床迫切需要能够直接嵌入现有医学数字成像与通信(Digital Imaging and Communications in Medicine, DICOM)工作流、并生成可供医生快速审阅的自动分割工具。既往深度学习(deep learning, DL)研究虽已在脑转移瘤、前庭神经鞘瘤、垂体腺瘤和脑膜瘤等任务上取得进展,但多局限于单一瘤种或独立离线管线,缺乏面向临床治疗计划系统(treatment planning system, TPS)的完整集成方案。基于这一空白,研究人员构建了一个院内开发的多肿瘤自动分割流程,使传入的DICOM MRI检查能够被自动识别、自动匹配肿瘤类型、自动完成分割并输出放疗结构集(Radiotherapy Structure-Set, RTSTRUCT)至Leksell GammaPlan?进行医生审核。
研究人员围绕4类常见颅内SRS靶病灶开展了系统研究,包括脑转移瘤(brain metastases, BM)、垂体腺瘤(pituitary adenomas, PA)、前庭神经鞘瘤(vestibular schwannomas, VS)和脑膜瘤(meningiomas)。论文指出,不同肿瘤在形态学、增强表现和解剖定位上存在显著差异,因此自动分割并非单一算法可轻易统一解决。脑转移瘤往往多发、体积差异大,要求模型对全脑范围内不同大小病灶均具有敏感识别能力,同时还必须抑制假阳性(false positive, FP);前庭神经鞘瘤通常为单发且边界较清楚,相对更利于自动化分割;垂体腺瘤由于毗邻海绵窦和垂体柄等关键结构,常存在边界模糊;脑膜瘤则受硬膜尾样延伸、颅骨及气骨界面影响,轮廓复杂且异质性更强。正因如此,研究的核心意义不仅在于建立4个模型,更在于证明一套基于肿瘤类型路由的自动化系统可以在临床真实流程中稳定运行,并将深度学习模型从“算法验证”推进到“计划工作流部署”。
在技术方法上,研究人员收集了2017年至2025年间用于Leksell Gamma Knife?放射外科的增强T1加权MPRAGE MRI共400例作为模型开发数据,每种肿瘤100例;另设独立前瞻性临床测试集100例,每种肿瘤25例。研究将DICOM及RTSTRUCT转换为NIfTI格式,分别训练4个肿瘤特异性的3D全分辨率nnU-Net模型,采用80/20训练-验证划分及默认预处理、数据增强、Dice+交叉熵损失。随后利用Python监听脚本持续监测来自3-Tesla MRI扫描仪的DICOM数据,通过研究描述等元数据判定肿瘤类型,并调用对应模型完成推理,再将二值分割结果转回RTSTRUCT后自动导入Leksell GammaPlan? v11.4.1。性能评估基于病灶水平,采用DSC、HD95、ASSD和假发现率(false discovery rate, FDR),并由有SRS经验的放射肿瘤医师进行Likert四级临床可用性评分。样本来源均为单中心临床病例,且参考轮廓来自常规治疗计划中的资深医师原始勾画。
在结果部分,论文首先给出了总体分割表现。病灶水平分析显示,前庭神经鞘瘤模型整体性能最佳,具有最高的重叠度和最低的表面误差,提示这一病种因形态较均一且强化较清晰,更适合高精度自动分割。脑转移瘤模型在73个病灶上也表现出较强性能,尽管病灶体积高度异质,DSC分布仍总体较高,HD95多集中在约1至1.5 mm,说明模型能够在多发病灶环境下较稳定地识别和勾画目标。垂体腺瘤模型的分割重叠度尚属临床可接受,但表面距离误差增大,反映出鞍区及鞍旁区复杂解剖边界带来的挑战。脑膜瘤模型的表现波动最大,低DSC病例和高HD95、ASSD病例更多,显示该瘤种在边缘不规则、邻近骨与硬膜界面的区域更容易产生边界偏差。
论文随后对体积差异进行了说明。4类肿瘤的自动分割体积(auto-segmented volume, ASV)均小于人工勾画体积(manual contour volume, MCV),绝对平均差分别为前庭神经鞘瘤0.15 cm
3、脑转移瘤0.27 cm
3、垂体腺瘤0.37 cm
3、脑膜瘤0.77 cm
3。这一一致性的低估现象提示,模型输出相较人工临床轮廓更为保守,可能与训练标注中包含隐性安全边界或边界不确定性有关。对于SRS而言,只要后续由放射肿瘤医师复核与修订,适度低估在工作流上仍具有可接受性。
关于运行效率,研究表明每例从DICOM检测、数据传输、格式转换、nnU-Net推理到RTSTRUCT生成并导入Leksell GammaPlan?,全流程耗时为2.8 ± 0.6分钟,范围为2至4分钟。这一点是该研究的重要临床价值所在,因为其证明了自动分割并非仅在离线实验环境中可行,而是能够真正满足伽玛刀SRS快速计划场景对时效性的要求。
在“病灶水平性能分布”这一结果层面,论文指出前庭神经鞘瘤的DSC、HD95和ASSD分布最为紧凑,提示模型在该病种上的稳定性最佳;脑转移瘤虽存在更宽的DSC范围,但多数病灶边界误差仍较小;垂体腺瘤的DSC范围为0.58至0.92,HD95可达4.70 mm,说明在边界模糊区域存在更明显的表面不一致;脑膜瘤则表现出最显著的异质性,多个病灶同时出现DSC下降与HD95/ASSD升高,体现出轮廓边界分歧较大。
在“代表性病例与定性评估”部分,研究人员通过资深放射肿瘤医师的视觉审核验证了定量结果。脑转移瘤病例的平均Likert评分为3.35 ± 0.84,中位数为4,超过一半轮廓无需修改;前庭神经鞘瘤平均评分为3.32 ± 0.63,无不可接受轮廓;垂体腺瘤平均评分为2.68 ± 0.67,需较多重大修改;脑膜瘤平均评分为2.84 ± 0.75,多数仅需轻度修订,但仍有少量不可接受结果。该部分结果说明,几何评价指标之外,临床编辑负担也是判断自动勾画实用性的关键维度,而本流程在前庭神经鞘瘤和脑转移瘤中具有更高临床成熟度。
在“假阳性与失败模式”部分,论文保留了病种差异。脑转移瘤模型假阳性负担最高,FP=13,真阳性(true positive, TP)=73,FDR=0.15,伪检多出现在血管强化或治疗后改变区域;脑膜瘤有少量假阳性,FP=3,TP=27,FDR=0.10,主要位于硬膜或静脉窦邻近区域;前庭神经鞘瘤和垂体腺瘤均未见假阳性病灶。作者同时展示了困难病例:脑转移瘤中出现血管强化诱发的误检,脑膜瘤中则出现邻近骨与硬膜界面的边界误差升高。除此之外,研究还单独分析了一个严重低信噪比且图像颗粒感明显的分布外(out-of-distribution)病例,其分割几乎完全失败,DSC仅0.02,提示该流程仍需前瞻性质控机制和防护策略。
讨论部分强调,该研究的主要贡献不只是获得较好的分割指标,而是实现了一个端到端、DICOM驱动、可直接嵌入Leksell GammaPlan?的临床自动分割系统。研究结果显示,不同瘤种的自动勾画性能与其解剖复杂性、形态规则性和增强特征高度相关。前庭神经鞘瘤最适于高精度自动化,脑转移瘤在多病灶场景下也具有较强实用性,垂体腺瘤和脑膜瘤则更依赖医生后续修订。论文同时指出,本研究属于单中心设计,模型泛化能力仍有待多中心验证;肿瘤类型识别目前依赖DICOM元数据规则,未来可由自然语言处理或图像驱动分类进一步改进;后续还需纳入更多肿瘤类型,并加强自动质量控制和决策支持功能。总体而言,该系统应被视为放射肿瘤医师决策支持工具,而非替代人工审核的独立系统。
研究结论部分可译为:本研究开发了一套面向SRS的、临床集成的多肿瘤自动分割流程,覆盖4类颅内肿瘤,并基于每种肿瘤100例训练而成的肿瘤特异性3D全分辨率nnU-Net模型构建。在独立的临床测试集上(每种肿瘤25例),该系统取得了0.80至0.90的Dice评分,并在多数肿瘤类型中实现了亚毫米至毫米级的表面误差,同时可在每例2至4分钟内输出轮廓。该流程证明了将基于深度学习的自动分割纳入常规伽玛刀计划制定的可行性,并为扩展至更多病变类型及开展多中心验证奠定了基础。