基于Transformer架构与体素内不相干运动图像的深度学习模型预测肝细胞癌术后早期复发

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Hepatocellular Carcinoma》：A Transformer-Based Deep Learning Model for predicting Early Recurrence in Hepatocellular Carcinoma After Hepatectomy Using Intravoxel Incoherent Motion Images

【字体：大中小】 时间：2026年02月05日 来源：Journal of Hepatocellular Carcinoma 3.4

编辑推荐：

　　本研究创新性地构建基于Vision Transformer（ViT）的融合深度学习模型，结合体素内不相干运动（IVIM）扩散加权成像（DWI）九组b值图像与参数图特征，实现肝细胞癌（HCC）肝切除术后早期复发的精准预测。该模型在训练集与测试集的曲线下面积（AUC）分别达0.991与0.821，显著优于单一临床模型，为HCC术后个体化监测提供无创影像学工具。

研究背景与意义

肝细胞癌（Hepatocellular Carcinoma, HCC）是全球范围内最常见的原发性肝脏恶性肿瘤，也是癌症相关死亡的主要原因之一。手术切除被视为早期HCC且肝功能保存良好患者的一线治疗方案。然而，HCC的预后仍然较差，术后复发率高达80%。HCC复发通常分为早期复发（术后两年内）和晚期复发（术后两年以上），其中早期复发与肝内转移相关，通常预示着更差的预后。因此，术前准确识别具有高早期复发风险的HCC患者，对于指导个体化术后监测和辅助治疗决策具有重要临床意义。

材料与方法

本研究为一项回顾性研究，经南方医科大学南方医院伦理委员会批准。研究纳入了2015年12月至2022年7月期间接受术前钆塞酸二钠增强肝脏磁共振成像（Magnetic Resonance Imaging, MRI）检查，并包含九个b值（b = 0, 10, 20, 40, 80, 200, 400, 600, 1000 s/mm²）扩散加权成像（Diffusion-Weighted Imaging, DWI）序列的122例HCC患者。所有患者均在接受肝切除术后进行了至少两年的随访，早期复发定义为术后两年内出现经影像学或病理学证实的复发事件。最终队列中，49例（40.1%）患者发生早期复发。患者被随机分为训练集（85例）和测试集（37例），两组基线临床特征无显著差异。

影像学数据采集与处理

MRI扫描使用两台3.0 T MRI系统完成。体素内不相干运动（Intravoxel Incoherent Motion, IVIM）参数图，包括表观扩散系数（Apparent Diffusion Coefficient, ADC）、真扩散系数（D）、伪扩散系数（D*）和灌注分数（f）图，由九个b值DWI图像在后处理工作站上生成。两名经验丰富的放射科医生手动勾画整个肿瘤的兴趣体积（Volumes of Interest, VOI），并提取肿瘤区域用于后续分析。

模型构建

本研究核心是构建基于Vision Transformer（ViT）框架的深度学习（Deep Learning, DL）模型。模型开发主要包括以下步骤：

1.
ViT-bDL模型：直接以九个b值DWI图像（通道堆叠后维度为64 × 64 × 64 × 9）作为输入，提取深度特征。
2.
ViT-mDL模型：以IVIM参数图（ADC, D, D*, f）作为输入，提取深度特征。
3.
ViT融合深度学习（ViT-fDL）模型：对ViT-bDL和ViT-mDL模型提取的深度特征进行融合（拼接和层归一化），构建预测模型。
4.
临床模型：通过多因素逻辑回归分析确定早期复发的独立临床预测因子（肿瘤大小和D值），构建基线模型。
5.
联合模型：将ViT-fDL模型筛选出的前10个最相关深度特征与独立的临床预测因子相结合，构建最终预测模型。

模型性能通过受试者工作特征曲线（Receiver Operating Characteristic Curve, ROC）及曲线下面积（Area Under the Curve, AUC）、校准曲线、决策曲线分析（Decision Curve Analysis, DCA）进行评估。并使用梯度加权类激活映射（Gradient-weighted Class Activation Mapping, Grad-CAM）对模型决策进行可视化解释。

研究结果

基线特征分析显示，在训练集中，早期复发组与无早期复发组在肿瘤大小、天门冬氨酸氨基转移酶（Aspartate Aminotransferase, AST）、微血管侵犯（Microvascular Invasion, MVI）和D值上存在显著差异。多因素分析确定肿瘤大小和D值为早期复发的独立预测因子。

模型性能比较显示，临床模型在训练集和测试集的AUC分别为0.755和0.764。ViT-bDL模型和ViT-mDL模型在测试集的AUC分别为0.747和0.594。而融合了二者优势的ViT-fDL模型表现更优，训练集和测试集AUC分别达到0.968和0.815。最终，联合模型（融合了ViT-fDL深度特征和临床特征）取得了最佳预测性能，训练集AUC为0.991（95% CI, 0.940–1.000），测试集AUC为0.821（95% CI, 0.660–0.927）。决策曲线分析表明联合模型具有良好的临床适用性。校准曲线和Hosmer-Lemeshow检验（P值均>0.05）提示模型拟合度良好。

模型可解释性分析通过Grad-CAM实现。可视化结果显示，在早期复发的HCC病例中，模型注意力主要集中在肿瘤边缘多个区域，提示肿瘤异质性和边缘侵袭性对预测早期复发有重要贡献；而在无早期复发的病例中，模型激活区域较少。

讨论

本研究成功开发并验证了一种基于ViT框架和IVIM图像的深度学习模型，用于预测HCC术后早期复发。ViT框架通过自注意力和多头注意力机制，能够有效捕捉多b值图像和参数图中复杂的空间关系和潜在模式，克服了传统卷积神经网络（Convolutional Neural Networks, CNN）的某些局限性。研究结果表明，融合多源特征（原始b值图像和IVIM参数图）的ViT-fDL模型优于单一特征模型。进一步与临床特征结合的联合模型展现了最佳的预测效能。

值得注意的是，IVIM序列无需使用对比剂，这使得该模型对于不适合进行对比剂检查的HCC患者（如肾功能不全者）具有重要的临床应用价值。本研究采用全肿瘤VOI分析，相较于以往基于肿瘤最大截面的2D分析，能更全面地反映HCC的高度异质性。Grad-CAM的可视化结果与既往研究一致，强调了肿瘤内异质性和侵袭性边缘是早期复发的重要影像学特征。

本研究也存在一些局限性。首先，单中心回顾性设计和相对较小的样本量（特别是测试集）可能影响模型的普适性，未来需要通过多中心前瞻性研究进行外部验证。其次，IVIM序列的参数设置在不同机构间可能存在差异。此外，尽管采用了早停法和交叉验证以减轻过拟合风险，扩大样本量仍是未来改进的方向。

结论

本研究构建的联合模型，整合了基于IVIM图像的ViT深度学习特征和临床独立预测因子，能够有效预测HCC肝切除术后早期复发风险。该模型为非侵入性、术前预测HCC预后提供了有前景的工具，有望指导临床制定个体化的术后监测和辅助治疗策略，从而改善患者预后。当前研究结果为初步发现，后续需要扩大样本量和进行外部验证以进一步深入探索。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号