《Holistic Integrative Oncology》:Machine learning model integrating CT radiomics and clinical blood indicators for auxiliary diagnosis of gastrointestinal stromal tumors
编辑推荐:
目的:开发并验证一种整合术前增强CT影像组学特征与临床血液指标的机器学习模型,用于胃肠道间质瘤(GIST)的辅助诊断。方法:这项回顾性研究收集了甘肃省人民医院2017年1月至2024年12月期间115例GIST患者及202例非GIST患者(含胃癌、胃息肉等)的
目的:开发并验证一种整合术前增强CT影像组学特征与临床血液指标的机器学习模型,用于胃肠道间质瘤(GIST)的辅助诊断。方法:这项回顾性研究收集了甘肃省人民医院2017年1月至2024年12月期间115例GIST患者及202例非GIST患者(含胃癌、胃息肉等)的数据,按7:2:1比例随机划分为训练集、验证集与测试集。研究人员从42项血液指标中通过单因素与多因素logistic回归筛选出临床特征;从增强CT图像提取的851个影像组学特征中通过最小绝对收缩与选择算子(LASSO)回归筛选关键特征。采用6种机器学习算法分别构建临床模型、影像组学模型及联合模型,采用受试者工作特征曲线下面积(AUC)、准确率、灵敏度、特异度等指标评估性能,并通过SHapley加性解释(SHAP)值、森林图及决策曲线分析(DCA)评估模型可解释性与临床效用。结果:多因素分析确定5项独立预测指标:直接胆红素(DBIL)、碱性磷酸酶(ALP)、癌胚抗原(CEA)、糖类抗原19-9(CA199)及胃蛋白酶原I/II比值(PG I/PG II);LASSO回归筛选出4个影像组学特征,包括球形度(Sphericity)、表面体积比(SurfaceVolumeRatio)等。测试集中,LightGBM影像组学模型与LightGBM联合模型的AUC分别达0.964与0.959,临床模型AUC为0.745。SHAP分析显示球形度对联合模型决策贡献最大;森林图证实所有入选特征均为显著预测因子,但特征重要性排序因解释方法而异;DCA表明两种模型在多种决策阈值下均能提供显著临床净获益。结论:本研究成功构建了基于增强CT影像组学与血液指标的机器学习模型,其中影像组学模型与联合模型在GIST良恶性鉴别中表现出高诊断准确性,有望成为有效的术前辅助诊断工具,支持临床决策。多方法联合解释深入揭示了模型决策机制,为该技术的临床转化奠定了坚实基础。
研究背景与意义
胃肠道间质瘤(Gastrointestinal Stromal Tumors, GIST)是消化道最常见的间叶源性肿瘤,虽仅占胃肠道恶性肿瘤的0.1%–3%,但具有潜在恶性与高复发风险,严重威胁患者生命健康。GIST临床表现缺乏特异性,早期诊断困难,约半数患者初诊时已发生转移,错失根治手术机会。当前GIST诊断依赖内镜、计算机断层扫描(Computed Tomography, CT)及病理活检,但内镜与传统CT对小GIST检出率低,难以准确评估生物学行为;病理活检虽为“金标准”,却属有创操作,耗时且存在肿瘤播散风险。近年来,影像组学通过高通量提取医学图像定量特征,可深度挖掘肿瘤内部异质性信息,在多种肿瘤诊断中展现出潜力,但在GIST诊断中的应用仍处于探索阶段。同时,临床常规血液指标的诊断价值尚未被充分挖掘,且缺乏将影像组学与系统性血液指标结合构建GIST智能辅助诊断模型的研究。因此,本研究旨在通过多模态数据融合,克服传统诊断方法的局限性,为临床提供可靠、透明的新型辅助诊断工具。
关键技术方法
研究人员开展了一项单中心回顾性研究,样本队列来源于甘肃省人民医院2017年1月至2024年12月收治的115例经术后病理确诊的GIST患者(病例组)与202例同期非GIST消化系统疾病患者(对照组,含胃癌、结直肠癌、胃息肉等)。纳入标准为年龄25–85岁、术前两周内于该院行腹部增强CT检查且临床资料完整;排除合并其他原发恶性肿瘤、既往胃肠道手术史或严重基础疾病影响血液指标、CT图像质量差者。研究获得医院伦理委员会批准,豁免知情同意。技术流程涵盖临床血液指标筛选、CT图像预处理与影像组学特征提取、多算法模型构建与验证、模型可解释性及临床效用评估四个关键环节。
研究结果
3.1 患者基线特征
研究共纳入317例患者,训练集221例、验证集64例、测试集32例。GIST与非GIST组在年龄、身高、体重等基线特征上无显著差异,数据集划分合理,组间可比性良好。
3.2 特征筛选结果
临床特征方面,单因素分析初筛11项差异显著的血液指标,多因素logistic回归最终确定DBIL、ALP、CEA、CA199、PG I/PG II为GIST独立预测因子,GIST患者DBIL与PG I/PG II水平高于非GIST患者,ALP、CEA、CA199水平更低。影像组学特征方面,经组内相关系数(Intraclass Correlation Coefficient, ICC)与LASSO回归筛选,从初始851个特征中保留球形度(系数0.147)、RunVariance.7(系数0.078)、表面体积比(系数-0.022)、LongRunEmphasis.7(系数0.005)共4个特征用于建模。
3.3 模型诊断性能
各类型模型中,LightGBM影像组学模型测试集AUC最高(0.964),LightGBM联合模型次之(0.959),临床模型效能有限(AUC 0.745)。LightGBM与神经网络(Neural Network, NN)算法在构建影像组学及联合模型时表现最稳定;决策树(Decision Tree, DT)与LightGBM模型在训练集存在明显过拟合(AUC=1.000)。
3.4 临床决策曲线分析
在0.1–0.7的临床相关决策阈值范围内,LightGBM影像组学模型与联合模型均提供显著且相近的临床净获益,曲线远高于“全部干预”与“全部不干预”参考线;在常用阈值0.4时,每100例患者中使用任一模型较“全部不干预”策略可多获得约35例净获益。
3.5 模型解释与特征贡献分析
对LightGBM联合模型的SHAP分析显示,球形度的平均|SHAP值|最高(2.68),是对预测贡献最大的特征,其次为表面体积比,5项临床特征贡献相对较低。特征密度散点图表明,球形度高值与正SHAP值相关,低值与负SHAP值相关。森林图则显示所有9项特征均为GIST显著预测因子,其中CEA标准化系数绝对值最大(-0.315),呈强负向影响;球形度(系数0.147)与RunVariance.7(系数0.078)为显著正向预测因子,表面体积比(系数-0.022)为显著负向预测因子。
讨论与结论
本研究首次系统整合全面血液指标与CT影像组学构建GIST辅助诊断模型,证实影像组学特征已包含充足判别信息,加入血液指标未带来显著提升,可能与GIST本身具有高度特异性影像特征及测试集样本量较小有关。研究通过DCA将统计性能转化为临床实用价值,并创新性地结合SHAP分析与森林图多视角解释模型,发现两种方法揭示的特征重要性存在差异——SHAP值反映特征在具体预测中的边际贡献(含交互作用),森林图系数反映控制混杂后的净效应,提示多方法联合解释可避免单一指标导致的误读。研究存在单中心回顾性设计、样本量有限、对照组未纳入平滑肌瘤等最难鉴别的间叶源性肿瘤、ROI勾画存在主观性等局限,未来需通过多中心大样本前瞻性研究进一步验证优化。
结论部分明确指出,基于增强CT影像组学与临床血液指标的机器学习模型对GIST具有高诊断价值,其中LightGBM影像组学模型与联合模型表现卓越,决策过程可解释性强,有望成为有效的无创术前辅助诊断工具,助力临床决策,改善患者预后。该研究发表于《Holistic Integrative Oncology》。