融合CT影像组学与临床血液指标的机器学习模型用于胃肠道间质瘤辅助诊断

《Holistic Integrative Oncology》：Machine learning model integrating CT radiomics and clinical blood indicators for auxiliary diagnosis of gastrointestinal stromal tumors

【字体：大中小】 时间：2026年05月23日 来源：Holistic Integrative Oncology

编辑推荐：

　　目的：开发并验证一种整合术前增强CT影像组学特征与临床血液指标的机器学习模型，用于胃肠道间质瘤（GIST）的辅助诊断。方法：这项回顾性研究收集了甘肃省人民医院2017年1月至2024年12月期间115例GIST患者及202例非GIST患者（含胃癌、胃息肉等）的

目的：开发并验证一种整合术前增强CT影像组学特征与临床血液指标的机器学习模型，用于胃肠道间质瘤（GIST）的辅助诊断。方法：这项回顾性研究收集了甘肃省人民医院2017年1月至2024年12月期间115例GIST患者及202例非GIST患者（含胃癌、胃息肉等）的数据，按7:2:1比例随机划分为训练集、验证集与测试集。研究人员从42项血液指标中通过单因素与多因素logistic回归筛选出临床特征；从增强CT图像提取的851个影像组学特征中通过最小绝对收缩与选择算子（LASSO）回归筛选关键特征。采用6种机器学习算法分别构建临床模型、影像组学模型及联合模型，采用受试者工作特征曲线下面积（AUC）、准确率、灵敏度、特异度等指标评估性能，并通过SHapley加性解释（SHAP）值、森林图及决策曲线分析（DCA）评估模型可解释性与临床效用。结果：多因素分析确定5项独立预测指标：直接胆红素（DBIL）、碱性磷酸酶（ALP）、癌胚抗原（CEA）、糖类抗原19-9（CA199）及胃蛋白酶原I/II比值（PG I/PG II）；LASSO回归筛选出4个影像组学特征，包括球形度（Sphericity）、表面体积比（SurfaceVolumeRatio）等。测试集中，LightGBM影像组学模型与LightGBM联合模型的AUC分别达0.964与0.959，临床模型AUC为0.745。SHAP分析显示球形度对联合模型决策贡献最大；森林图证实所有入选特征均为显著预测因子，但特征重要性排序因解释方法而异；DCA表明两种模型在多种决策阈值下均能提供显著临床净获益。结论：本研究成功构建了基于增强CT影像组学与血液指标的机器学习模型，其中影像组学模型与联合模型在GIST良恶性鉴别中表现出高诊断准确性，有望成为有效的术前辅助诊断工具，支持临床决策。多方法联合解释深入揭示了模型决策机制，为该技术的临床转化奠定了坚实基础。

研究背景与意义

胃肠道间质瘤（Gastrointestinal Stromal Tumors, GIST）是消化道最常见的间叶源性肿瘤，虽仅占胃肠道恶性肿瘤的0.1%–3%，但具有潜在恶性与高复发风险，严重威胁患者生命健康。GIST临床表现缺乏特异性，早期诊断困难，约半数患者初诊时已发生转移，错失根治手术机会。当前GIST诊断依赖内镜、计算机断层扫描（Computed Tomography, CT）及病理活检，但内镜与传统CT对小GIST检出率低，难以准确评估生物学行为；病理活检虽为“金标准”，却属有创操作，耗时且存在肿瘤播散风险。近年来，影像组学通过高通量提取医学图像定量特征，可深度挖掘肿瘤内部异质性信息，在多种肿瘤诊断中展现出潜力，但在GIST诊断中的应用仍处于探索阶段。同时，临床常规血液指标的诊断价值尚未被充分挖掘，且缺乏将影像组学与系统性血液指标结合构建GIST智能辅助诊断模型的研究。因此，本研究旨在通过多模态数据融合，克服传统诊断方法的局限性，为临床提供可靠、透明的新型辅助诊断工具。

关键技术方法

研究人员开展了一项单中心回顾性研究，样本队列来源于甘肃省人民医院2017年1月至2024年12月收治的115例经术后病理确诊的GIST患者（病例组）与202例同期非GIST消化系统疾病患者（对照组，含胃癌、结直肠癌、胃息肉等）。纳入标准为年龄25–85岁、术前两周内于该院行腹部增强CT检查且临床资料完整；排除合并其他原发恶性肿瘤、既往胃肠道手术史或严重基础疾病影响血液指标、CT图像质量差者。研究获得医院伦理委员会批准，豁免知情同意。技术流程涵盖临床血液指标筛选、CT图像预处理与影像组学特征提取、多算法模型构建与验证、模型可解释性及临床效用评估四个关键环节。

研究结果

3.1 患者基线特征

研究共纳入317例患者，训练集221例、验证集64例、测试集32例。GIST与非GIST组在年龄、身高、体重等基线特征上无显著差异，数据集划分合理，组间可比性良好。

3.2 特征筛选结果

临床特征方面，单因素分析初筛11项差异显著的血液指标，多因素logistic回归最终确定DBIL、ALP、CEA、CA199、PG I/PG II为GIST独立预测因子，GIST患者DBIL与PG I/PG II水平高于非GIST患者，ALP、CEA、CA199水平更低。影像组学特征方面，经组内相关系数（Intraclass Correlation Coefficient, ICC）与LASSO回归筛选，从初始851个特征中保留球形度（系数0.147）、RunVariance.7（系数0.078）、表面体积比（系数-0.022）、LongRunEmphasis.7（系数0.005）共4个特征用于建模。

3.3 模型诊断性能

各类型模型中，LightGBM影像组学模型测试集AUC最高（0.964），LightGBM联合模型次之（0.959），临床模型效能有限（AUC 0.745）。LightGBM与神经网络（Neural Network, NN）算法在构建影像组学及联合模型时表现最稳定；决策树（Decision Tree, DT）与LightGBM模型在训练集存在明显过拟合（AUC=1.000）。

3.4 临床决策曲线分析

在0.1–0.7的临床相关决策阈值范围内，LightGBM影像组学模型与联合模型均提供显著且相近的临床净获益，曲线远高于“全部干预”与“全部不干预”参考线；在常用阈值0.4时，每100例患者中使用任一模型较“全部不干预”策略可多获得约35例净获益。

3.5 模型解释与特征贡献分析

对LightGBM联合模型的SHAP分析显示，球形度的平均|SHAP值|最高（2.68），是对预测贡献最大的特征，其次为表面体积比，5项临床特征贡献相对较低。特征密度散点图表明，球形度高值与正SHAP值相关，低值与负SHAP值相关。森林图则显示所有9项特征均为GIST显著预测因子，其中CEA标准化系数绝对值最大（-0.315），呈强负向影响；球形度（系数0.147）与RunVariance.7（系数0.078）为显著正向预测因子，表面体积比（系数-0.022）为显著负向预测因子。

讨论与结论

本研究首次系统整合全面血液指标与CT影像组学构建GIST辅助诊断模型，证实影像组学特征已包含充足判别信息，加入血液指标未带来显著提升，可能与GIST本身具有高度特异性影像特征及测试集样本量较小有关。研究通过DCA将统计性能转化为临床实用价值，并创新性地结合SHAP分析与森林图多视角解释模型，发现两种方法揭示的特征重要性存在差异——SHAP值反映特征在具体预测中的边际贡献（含交互作用），森林图系数反映控制混杂后的净效应，提示多方法联合解释可避免单一指标导致的误读。研究存在单中心回顾性设计、样本量有限、对照组未纳入平滑肌瘤等最难鉴别的间叶源性肿瘤、ROI勾画存在主观性等局限，未来需通过多中心大样本前瞻性研究进一步验证优化。

结论部分明确指出，基于增强CT影像组学与临床血液指标的机器学习模型对GIST具有高诊断价值，其中LightGBM影像组学模型与联合模型表现卓越，决策过程可解释性强，有望成为有效的无创术前辅助诊断工具，助力临床决策，改善患者预后。该研究发表于《Holistic Integrative Oncology》。

热点排行