《European Radiology Experimental》:MRI radiomics-based approach to predict pituitary neuroendocrine tumor invasiveness
编辑推荐:
研究目的旨在评估磁共振成像(MRI)影像组学以及利用T2加权(T2-weighted)和对比增强T1加权(contrast-enhanced T1-weighted, CE-T1-weighted)图像单独或联合构建的机器学习模型预测垂体神经内分泌肿瘤(pit
研究目的旨在评估磁共振成像(MRI)影像组学以及利用T2加权(T2-weighted)和对比增强T1加权(contrast-enhanced T1-weighted, CE-T1-weighted)图像单独或联合构建的机器学习模型预测垂体神经内分泌肿瘤(pituitary neuroendocrine tumors, PitNETs)侵袭性的诊断潜力。材料与方法:研究人员对2019年至2022年间患有大腺瘤型PitNETs的患者进行了回顾性纳入分析。从术前T2加权和CE-T1加权图像上手动分割的病灶中提取影像组学特征,经特征筛选步骤后,依据Trouillas分类标准评估肿瘤侵袭性。研究人员采用CE-T1加权特征、T2加权特征以及CE-T1加权联合T2加权特征分别训练了五种机器学习模型,包括逻辑回归(logistic regression)、随机森林(random forest)、梯度提升(gradient boosting)、AdaBoost和XGBoost模型。模型性能通过测试集中的受试者工作特征曲线下面积(area under the receiver operating characteristic curve, AUC)进行评估。研究共纳入200例患者:95例为非侵袭性PitNETs(74例为1a级;21例为1b级),105例为侵袭性PitNETs(70例为2a级;35例为2b级)。每个序列共提取102个影像组学特征。性能最优的模型为采用五个CE-T1加权联合T2加权特征的XGBoost模型,其AUC为0.85(95%置信区间:0.75–0.95)。采用CE-T1加权图像的逻辑回归模型(AUC=0.80)和采用T2加权图像的AdaBoost模型(AUC=0.78)则获得较低的AUC值。研究结论表明,整合肿瘤形态、纹理及一阶特征的XGBoost模型在PitNETs侵袭性预测中表现出较高的性能,该影像组学模型可能有助于识别具有更高疾病持续、复发或进展风险的肿瘤。研究背景与临床意义陈述:基于CE-T1加权和T2加权MRI的影像组学模型在预测垂体神经内分泌肿瘤侵袭性方面展现出较高的区分能力,能够辅助识别具有更高复发或进展风险的肿瘤,最终通过个性化治疗策略改善患者预后。
垂体神经内分泌肿瘤(pituitary neuroendocrine tumors, PitNETs)约占颅内肿瘤的10%至25%,在普通人群中的患病率高达17%至20%。尽管多数PitNETs为良性肿瘤,但25%至55%的病例呈现侵袭性生长,且10%至20%在切除术后复发。大腺瘤型PitNETs(macro-PitNETs)以肿瘤体积较大并向周围结构扩展为特征。"侵袭性"指肿瘤在术中对硬脑膜、骨组织以及罕见的神经和血管等周围结构呈现浸润性生长,而"侵袭性"(aggressiveness)则指肿瘤快速生长、浸润能力及对治疗的抵抗性,需要长期随访观察。多项研究表明,侵袭性尤其是硬脑膜侵袭性显著影响手术预后和患者结局。
目前预测疾病复发或持续的最常用分类系统为Trouillas分类系统,将PitNETs分为五个等级。该综合临床病理分类克服了单独使用影像学评估肿瘤侵袭性和侵袭性的局限性。Knosp分级系统(1至4级)是评估PitNETs鞍旁扩展最广泛接受的术前影像学方法,但其在中间分级(2或3级)中难以准确预测真正的海绵窦侵袭,原因在于影像学上区分侵袭与压迫仍存在挑战。根据2022年世界卫生组织分类,某些特定亚型的垂体腺瘤被认为是"高风险"肿瘤。手术切除是大多数垂体大腺瘤的一线治疗方案,但在侵袭性病例中实现完全切除仍面临巨大挑战。因此,术前准确预测PitNETs的侵袭性对于制定有效的手术策略、个性化随访方案和长期管理至关重要。
MRI是界定肿瘤与周围结构解剖关系的最佳影像学技术。影像组学(radiomics)是定量生物影像分析领域的创新进展,通过从医学影像中提取大量描述肿瘤形态和纹理的特征信息,将其转化为数值化特征。这些特征能够捕捉肉眼难以辨识的肿瘤内部细微模式和异质性,为预测肿瘤亚型和预后提供依据。机器学习(machine learning, ML)作为人工智能的分支,可开发预测模型以提高诊断和预后准确性。既往PitNETs的影像组学研究主要集中于预测肿瘤的特定临床病理特征,包括肿瘤亚型、质地、增殖指数和海绵窦侵袭性等,而基于MRI影像组学-临床病理模型预测Trouillas最终分级系统下侵袭性的研究仍较为匮乏。
该研究的主要目标包括:依据Trouillas的影像学和病理学标准对大腺瘤型PitNETs进行分类,将"高风险"腺瘤纳入增殖性肿瘤类别;评估基于MRI的影像组学特征与最终肿瘤分级之间的关联;评价术前MRI影像组学特征及基于T2加权和CE-T1加权图像单独或联合构建的机器学习模型预测PitNETs侵袭性的诊断潜力。
该研究为观察性非干预性回顾性研究,纳入2019年9月至2022年2月期间在意大利罗马天主大学基金会"Gemelli"综合医院接受首次PitNETs手术的患者。纳入标准为大腺瘤型PitNETs、经病理确诊且MRI方案完整的患者;排除标准为既往接受过PitNETs治疗(手术、药物或放疗)以及肿瘤存在显著囊性或出血性成分的患者。所有患者接受内镜经蝶窦手术治疗,术中评估海绵窦、鞍底硬脑膜及蝶窦的侵袭情况,并对疑似受累组织标本进行病理学检查。
研究人员记录了患者的临床病史、基线影像学特征及完整激素检测数据,并按照肿瘤体积、内分泌状态和肿瘤组织学类型、三种细胞谱系分类(PIT-1、类固醇生成因子-1即SF-1、以及T-box垂体转录因子TBX19即T-PIT转录因子)、肿瘤侵袭性(Knosp 3或4级提示海绵窦侵袭,Knosp 1或2级伴海绵窦内侧壁、蝶窦鞍底硬脑膜侵袭且经组织学和术中证实)、增殖状态等进行分类。根据Trouillas五级分类系统,将非侵袭性(1a和1b级)与侵袭性(2a和2b级)肿瘤分别归为类别1和类别2,其中"高风险"PitNETs被视为增殖性肿瘤。
MRI图像采用1.5T扫描仪(通用电气医疗Signa系列和飞利浦Ingenia)及八通道头线圈采集,术前6个月内完成。成像方案包括冠状位T1和T2加权序列、轴位和冠状位CE-T1加权序列,层厚2.5 mm。CE-T1加权图像于经肘前静脉以2 mL/s速度注射0.1 mmol/kg钆布醇(Gadavist,拜耳先灵医药)后2至4分钟采集。
图像分割由具有10年经验的神经放射科医师使用开源软件ITK-SNAP(version 4.0.0, Kitware)逐层手动勾画病灶体积,排除脑脊液、骨质及钙化等周围结构,采用卡瓦列里原理计算体积。第二位神经放射科医师进行复核以确保测量一致性,两人均不知晓术中及临床数据。
影像组学分析前进行偏差场校正以消除低频强度伪影,采用刚性变换将T2加权分割图像与CE-T1加权图像对齐,使用最近邻重采样,重采样至像素间距分布中位值(0.45 mm)以确保均匀的平面内分辨率,并对每幅图像进行z-score标准化。
特征提取使用Pyradiomics(version 3.1.0)从CE-T1加权和T2加权的感兴趣体积中提取,共分三类:形态学特征(描述肿瘤形状和大小)、一阶特征(反映肿瘤整体灰度强度)、纹理特征(捕捉肿瘤局部灰度强度)。纹理特征以70个灰度级提取,包括灰度共现矩阵(gray-level cooccurrence matrix, GLCM)、灰度游程长度矩阵(gray-level run-length matrix, GLRLM)、灰度大小区域矩阵(gray-level size zone matrix, GLSZM)和灰度依赖矩阵(gray-level dependence matrix, GLDM)。由于平面外分辨率存在变异性,特征在二维模式下沿冠状面提取(设置force2D=True),其余参数保持默认配置。
研究人员使用Python库scikit-learn开发了五种机器学习模型:逻辑回归、随机森林、梯度提升、AdaBoost和XGBoost,分别基于CE-T1加权特征、T2加权特征以及两者联合特征进行预测。数据集按75%训练和25%测试进行分割,确保侵袭性肿瘤比例一致。对训练集影像组学特征进行z-score标准化,并将缩放参数应用于测试集。
统计分析和建模使用RStudio(R version 3.4.1)和Python(v3.7)完成。连续变量以中位数和四分位距表示,分类变量以频数和百分比表示。通过Shapiro-Wilk检验评估数据正态性。Kruskal-Wallis检验比较最终分级系统各等级间的年龄差异以及不同腺垂体细胞谱系间的肿瘤大小差异。采用χ
2检验评估性别和肿瘤组织学类型在各等级间的差异。Spearman秩相关系数评估肿瘤分级、组织学类型和体积之间的关联。对CE-T1加权和T2加权图像提取的影像组学特征与最终分级类别(1a、1b、2a、2b)的关联进行Kruskal-Wallis检验,采用Benjamini-Hochberg法进行多重比较校正。通过Pearson相关(r>0.7)剔除冗余特征。对侵袭性肿瘤进行事后Wilcoxon-Mann-Whitney检验,评估影像组学特征区分2a和2b级肿瘤以检测增殖性肿瘤的能力。
针对侵袭性模型的特征选择:Wilcoxon-Mann-Whitney检验剔除厂商敏感特征(p<0.05);单变量分析保留与侵袭性二元结局显著相关的特征(校正后p<0.05);Pearson相关(r≥0.7)剔除冗余特征;基于5折交叉验证的逻辑回归、随机森林和支持向量机分类器平均精度进行后向消除,迭代移除重要性最低的特征以减少过拟合。
模型开发采用网格搜索在训练集上优化超参数,使用5折交叉验证。模型性能通过受试者工作特征曲线(receiver operating characteristic, ROC)下面积(AUC)评估。每类分析选择测试集AUC最优的机器学习模型。比较训练和测试集的ROC曲线以评估模型泛化能力。模型区分能力采用AUC、灵敏度、特异度和准确度评估,AUC的95%置信区间通过自助法(bootstrap)计算,其余指标采用正态近似法。
研究共纳入200例患者。结合影像学和病理学评估,41.16%最初基于影像学判定为非侵袭性的肿瘤被重新分类为1b级(15.44%)、2a级(16.17%)或2b级(9.55%);反之,34.37%最初基于影像学判定为侵袭性的肿瘤被重新分类为2b级(侵袭性且增殖性)。各肿瘤分级间性别无显著差异,但年龄存在显著差异,非增殖性肿瘤患者年龄更大。肿瘤体积因组织学类型而异,"高风险"和SF-1肿瘤体积更大。SF-1肿瘤在1a和2a级(非增殖性)中更常见,而PIT-1和"高风险"肿瘤在1b和2b级(增殖性)中更频繁。较低分级肿瘤体积更小。
每名受试者共提取204个特征(CE-T1加权和T2加权各102个):形态学特征14个,一阶特征18个,纹理特征70个(GLCM 24个、GLRLM 16个、GLSZM 16个、GLDM 16个)。对最终分级分类,CE-T1加权73个特征、T2加权65个特征具有显著性(校正后p<0.05),其中各13个非相关特征被识别,涵盖形态-形状、一阶统计和纹理特征家族。两类图像分析中与最终分级系统关联最显著的四个特征均属形态学(形状)和纹理家族。事后分析未发现区分2a和2b级侵袭性肿瘤的差异性特征。
对侵袭性二元分析的特征选择:CE-T1加权分析获得5个特征(2个形状相关特征:球形度、最大二维直径;2个纹理相关特征:GLRLM灰度非均匀性、GLDM小依赖高灰度强调;1个一阶特征:范围);T2加权分析获得6个特征(2个形状相关特征:球形度、最大二维直径;2个纹理相关特征:GLRLM游程百分比、GLSZM大面积低灰度强调;2个一阶特征:范围、总能量);CE-T1加权联合T2加权分析获得5个特征(1个形状相关特征:最大二维直径;1个纹理相关特征:GLDM小依赖高灰度强调;3个一阶特征:范围及来自CE-T1加权和T2加权的总能量)。
数据集分割为训练集75%(n=150)和测试集25%(n=50),侵袭性病例比例均衡(训练集53%、测试集52%)。每类分析选择测试集AUC最优模型。ROC曲线分析确认无过拟合且泛化良好。XGBoost模型使用CE-T1加权和T2加权联合特征,在测试集AUC达0.85(95%置信区间:0.75–0.95),灵敏度0.81(95%置信区间:0.66–0.96),与训练集性能相当,优于单一序列的逻辑回归(CE-T1加权,AUC=0.80)和AdaBoost(T2加权,AUC=0.78)模型。
该研究证明依据Trouillas标准对PitNETs进行分类时需纳入"高风险"肿瘤至增殖性类别。部分基于影像学判定为非侵袭性的肿瘤经多学科评估后被重新分类为增殖性类别,证实了多学科评估的重要性。激素分泌性肿瘤在增殖性类别(1b和2b级)中的比例高于非增殖性类别(1a和2a级),SF-1肿瘤更多见于1a和2a级,PIT-1和高风险肿瘤更多见于1b和2b级。肿瘤分级与体积相关,但组织学类型与分级无关。
影像组学能量化医学图像中的像素模式,提取超出人眼视觉检测范围的数值特征。既往少数研究将影像组学应用于预测PitNETs的临床病理分类。该研究评估了基于MRI的影像组学特征与Trouillas最终肿瘤分级的关联,从T2加权和CE-T1加权图像中提取全肿瘤特征,这两种序列在量化肿瘤异质性方面具有互补性。影响因素包括胶原含量、瘤内血肿、淀粉样变、铁沉积、钙化和富含蛋白质液体等均能影响T2信号强度;而CE-T1加权反映血脑屏障破坏,可更好界定肿瘤边界和形状,为邻近组织侵袭评估提供准确信息。
研究人员从CE-T1加权图像中识别出两个代表性形状相关特征(球形度、最大二维直径),从T2加权图像中识别出一个形状相关特征(最大二维直径)和一个纹理相关特征(GLRLM)作为按Trouillas四级分类最显著的特征。肿瘤球形度和最大直径形状特征反映PitNETs的生长模式,GLRLM纹理特征评估肿瘤灰度异质性。较高分级(2a和2b级)肿瘤显示较低的球形度、较大的直径值和更高的组织灰度异质性,证实高分级肿瘤更不规则、更具异质性且更可能侵袭周围组织。由于两个侵袭性类别(2a和2b级)间未发现显著差异,研究将Trouillas最终分级系统的等级合并为非侵袭性(1a和1b级)与侵袭性(2a和2b级)两类。
研究建立了图像预处理流程以实现最佳影像组学特征评估和分类分析,确定了三种最佳机器学习影像组学模型。XGBoost模型整合CE-T1加权和T2加权图像特征,优于单一序列的逻辑回归和AdaBoost模型,在训练和测试集中表现一致,泛化能力强。多模态影像优于单模态影像的诊断准确性得到验证。增强XGBoost预测模型性能的特征包括T2加权的1个形状相关特征(最大二维直径)、CE-T1加权的1个纹理相关特征(GLDM)以及3个一阶特征(T2加权的总能量、CE-T1加权的范围和总能量)。这一发现表明,结合CE-T1加权和T2加权图像的纹理、形状和一阶特征——这些特征捕捉大小信息、灰度信号强度值的空间相互关系以及灰度强度变化——能够更准确全面地表征肿瘤整体生长模式和异质性,从而增强对肿瘤侵袭性的预测能力。具体而言,侵袭性PitNETs具有更大的最大直径、更低的致密度、更高的灰度信号强度值以及更快速的灰度强度变化,反映其更具异质性。
该概念验证研究存在一定局限性:回顾性单中心研究设计、手动肿瘤分割可能引入不一致性;未评估观察者间变异性(如组内相关系数或Dice系数),无法判断观察者间的一致性和 agreement;尽管使用了临床常用的冠状位平扫T2加权和CE-T1加权图像构建预测模型,但纳入扩散加权成像等其他序列可能提供额外信息并改善模型性能;虽使用留出集评估模型在未见过数据上的性能,但采用多重分割或嵌套交叉验证将确保模型稳定性,来自其他中心的外部测试集则是证明模型泛化能力的最佳途径;未来多中心研究及外部验证对确认模型有效性必不可少;此外,未来开发和整合基于深度学习的自动肿瘤分割方法将有助于该预测影像组学模型在临床实践中的实际应用。
研究结论部分翻译如下:该研究为使用影像组学方法结合Trouillas分类系统对PitNETs进行分层提供了新视角。肿瘤形状和纹理特征与PitNETs按Trouillas四级系统的分类相关,较低的球形度、较大的直径和增加的异质性可识别侵袭性肿瘤(2a和2b级)。整合CE-T1加权和T2加权图像中肿瘤形状、纹理和一阶特征的机器学习XGBoost模型在预测PitNETs侵袭性方面展现出高度的区分能力。这种非侵入性方法有助于识别具有侵袭性生长模式的肿瘤,在术前优化个体化治疗策略。