《Frontiers in Oncology》:Subregional CT radiomics for preoperative prediction of mitotic index and risk stratification in 2-5 cm gastrointestinal stromal tumors of the stomach: a dual-center study
编辑推荐:
本综述提出了一种基于计算机断层扫描(CT)亚区域影像组学的创新模型,用于术前预测2-5厘米胃胃肠道间质瘤(GISTs)的有丝分裂指数(Mitotic Index)并进行风险分层。该研究通过k-means聚类识别肿瘤内三个异质子区域,并利用逻辑回归(LR)构建预测模型。研究发现,基于平扫CT的亚区域模型(尤其是子区域3模型)表现出卓越的预测性能(训练集AUC达0.979),为无法使用碘对比剂的患者提供了无创风险评估新视角。此外,基于静脉期全肿瘤的常规影像组学模型同样展现出强大且稳健的预测能力(外部测试集AUC为0.805)。该研究为GISTs的个体化精准医疗和临床决策提供了有力的影像学工具。
引言
胃肠道间质瘤(GISTs)是胃肠道最常见的间叶源性肿瘤,发病率约为1/10万,好发于胃部(占60-65%)。目前,对于2-5厘米的胃GISTs,临床治疗选择存在争议,内镜切除微创但存在切缘阳性风险,而腹腔镜或开放手术切除则更为彻底。GISTs的风险分层主要依据有丝分裂指数,>5/50高倍视野(HPF)与≤5/50 HPF患者的转移率分别为16%和1.9%。有丝分裂指数通常通过术后病理获得,术前活检因样本局限易低估风险。因此,开发一种无创、可靠的术前预测方法具有重要临床价值。CT因其无创、便捷等优点广泛应用于GISTs的诊断、疗效评估和随访。传统影像特征评估主观性强,而影像组学(Radiomics)可提取肉眼难以识别的高维定量特征。传统影像组学研究多关注全肿瘤整体特征,近年来,基于肿瘤内异质性子区域的影像组学模型显示出优异性能,能更好量化肿瘤异质性。本研究旨在探索基于CT亚区域影像组学构建预测模型,以实现2-5厘米胃GISTs有丝分裂指数的术前预测和风险分层。
材料与方法
本研究为回顾性双中心研究,经浙江大学医学院附属邵逸夫医院伦理委员会批准。连续收集2016年1月至2023年12月期间在邵逸夫医院(中心1)和浙江大学医学院附属第二医院(中心2)经术后病理证实的胃GISTs患者的临床和影像资料。纳入标准包括:接受内镜或手术切除、病理确诊为胃GISTs、术前2周内完成平扫及增强CT扫描。排除标准包括:术前接受伊马替尼等靶向药物治疗、术前转移或复发、合并其他恶性肿瘤或多发GISTs、临床或影像资料不完整或图像质量差、肿瘤直径<2厘米或>5厘米。最终,中心1的239例患者作为训练/验证集,中心2的129例患者作为外部测试集。根据病理有丝分裂指数将患者分为低有丝分裂组(≤5/50 HPF)和高有丝分裂组(>5/50 HPF)。
CT图像采集使用多种西门子和GE的扫描设备。扫描前患者禁食6-8小时,扫描前15分钟饮用600-1000毫升温水以充盈胃腔。扫描参数包括管电压120 kV,自动管电流,轴位图像层厚5毫米,多平面重建层厚1.5-2毫米。平扫后,经高压注射器注射非离子碘对比剂进行增强扫描,动脉期扫描在注射后25-30秒进行,静脉期在50-60秒后进行。
由两名腹部放射科医生在不知晓临床病理信息的情况下分析CT图像上肿瘤的位置和大小。肿瘤定位为贲门、胃底、胃体和胃窦。肿瘤大小以多平面重建图像的最大直径表示。图像分割由两名具有5年腹部诊断经验的放射科住院医师使用ITK-SNAP软件(版本3.8)逐层手动勾画肿瘤区域,避开邻近正常胃黏膜组织和血管,获得感兴趣区域(ROI)。由一名经验更丰富的放射科医生审核修正轮廓,并通过组内相关系数(ICC > 0.80)和Dice相似系数(Dice > 0.80)评估测量和勾画的一致性。
所有CT图像在进行特征提取前进行了Z-score归一化预处理,以最小化不同扫描设备等因素造成的差异。采用K-means算法对ROI图像特征进行聚类,确定最佳聚类数为3,得到三个肿瘤亚区域(子区域1、2、3)。使用PyRadiomics(版本3.1)从平扫和静脉期CT图像的全肿瘤及其三个子区域提取影像组学特征,包括一阶统计特征(18个)、形状特征(14个,仅从原始图像提取)、纹理特征(GLCM 24个、GLDM 14个、GLRLM 16个、GLSZM 14个,共68个)以及基于小波变换的高阶特征(LoG滤波器和LBP,各18个一阶和68个纹理特征),每个病灶总计提取1045个特征。所有特征均符合国际生物标志物标准化倡议(IBSI)。
采用Spearman相关性分析(ICC > 0.75)去除高度相关和冗余的放射组学特征。随后使用递归特征添加(RFA)方法进行特征选择,以逻辑回归(LR)为基分类器,通过五折交叉验证确定最优特征子集。分别基于平扫和静脉期CT的各子区域(1, 2, 3)和全肿瘤区域筛选后的特征,构建了共八个LR预测模型。为应对类别不平衡,对少数类进行了随机过采样。模型性能通过受试者工作特征(ROC)曲线下面积(AUC)、准确率、敏感性和特异性进行评估,并利用决策曲线分析(DCA)评估临床效用。引入SHAP(Shapley Additive Explanations)方法对最佳模型进行可解释性分析。统计分析使用SPSS软件(版本26.0),分类变量比较采用卡方检验或Fisher精确检验,连续变量比较采用t检验或Mann-Whitney U检验,P < 0.05认为有统计学意义。
结果
中心1的239例患者(男122,女117,平均年龄61.66±10.86岁)中,低有丝分裂195例,高有丝分裂44例。中心2的129例患者(男51,女78,平均年龄60.28±9.72岁)中,低有丝分裂108例,高有丝分裂21例。临床特征分析显示,两组患者在性别(P = 0.035)和CA19-9(P < 0.001)上存在显著差异,其他临床或CT特征无显著差异。
特征选择后,平扫期最终保留特征数为:子区域1(11个)、子区域2(10个)、子区域3(14个)、全肿瘤区域(8个)。静脉期最终保留特征数为:子区域1(10个)、子区域2(13个)、子区域3(10个)、全肿瘤区域(16个)。
基于临床数据的预测模型在训练集、验证集和外部测试集的AUC分别为0.778、0.689和0.686。在平扫CT模型中,基于子区域1、2、3的模型性能均优于常规全肿瘤影像组学模型。其中,子区域3模型表现最佳,在训练集中的AUC、准确率、敏感性、特异性分别达到0.98、0.97、0.98和0.90;在验证集和外部测试集中的AUC分别为0.874和0.804。与之相反,在静脉期CT模型中,常规全肿瘤影像组学模型的性能优于所有子区域模型,其在训练集中的AUC为0.956,准确率、敏感性、特异性分别为0.94、0.97和0.83;在验证集和外部测试集中的AUC分别为0.892和0.805。DCA显示平扫CT子区域3模型和静脉期全肿瘤模型在预测2-5厘米胃GISTs有丝分裂指数方面具有显著的临床净获益。
SHAP可解释性分析聚焦于性能优异的平扫CT子区域3模型。分析显示,特征wavelet-LHH_firstorder_Skewness(反映体素强度分布不对称性)和original_shape_Flatness(表征病灶空间几何扁平度)是驱动模型预测的关键因素,其值越高,模型越倾向于预测为高有丝分裂组。
讨论
本研究首次将亚区域影像组学方法应用于预测2-5厘米胃GISTs的有丝分裂指数和风险分层。通过聚类得到的三个子区域中,子区域1主要集中于病灶较高密度区域,而子区域3主要位于较低密度区域,这与肿瘤内组织成分异质性相关。
在平扫CT模型中,基于子区域1、2、3的模型性能超越常规模型和临床模型,特别是子区域3模型表现出色。这表明平扫CT图像对于预测有丝分裂指数具有临床实用性,尤其适用于对碘对比剂有禁忌症的患者。亚区域影像组学为肿瘤风险评估提供了新视角。
与Cai等人研究结果不同,本研究中静脉期全肿瘤模型优于亚区域模型,推测原因可能在于本研究聚焦的2-5厘米胃GISTs相对均匀,内部异质性较低,且对比剂可能掩盖了部分肿瘤内异质性。此外,本研究发现在外部测试集中,平扫亚区域影像组学的AUC值略高于静脉期,与Zhang等人报道一致,可能与非增强图像更能反映肿瘤内在密度分布和纹理,与其细胞组成和有丝分裂活性关联更直接有关。
SHAP分析揭示了与GISTs恶性潜能预测相关的关键影像组学特征。偏度(Skewness)可能与肿瘤内坏死或囊变相关,而扁平度(Flatness)可能指示具有高恶性潜能GISTs的浸润性生长模式。
与既往单中心、小样本量的研究相比,本研究采用双中心设计、更大样本量并进行了外部验证,所构建模型展示了令人满意的预测能力和泛化性。
局限性
本研究存在一些局限性。首先,回顾性设计可能存在选择偏倚。其次,尽管样本量大于以往研究,但高有丝分裂样本比例仍相对不足,且2-5厘米胃GISTs相对均匀,可能限制了亚区域分析的生物学意义,未来需要更大规模、前瞻性、多中心验证。第三,本研究仅从平扫和静脉期图像提取特征,未来计划纳入动脉期和延迟期图像以更全面表征肿瘤异质性。第四,未将CT定性和定量参数与影像组学结合分析。第五,采用手动ROI分割,微小分割误差可能影响亚区域分析结果。
结论
本研究结果表明,亚区域CT影像组学模型是一种创新且可靠的工具,可用于术前预测2-5厘米胃GISTs患者的有丝分裂水平。值得注意的是,基于平扫CT的亚区域模型表现出强大的预测性能。亚区域影像组学可作为一种潜在的无创临床评估工具,为GISTs的风险分层提供新视角和附加信息,并有望在未来为患者个体化临床决策做出贡献。