《Journal of Hepatocellular Carcinoma》:A Transformer-Based Deep Learning Model for predicting Early Recurrence in Hepatocellular Carcinoma After Hepatectomy Using Intravoxel Incoherent Motion Images
编辑推荐:
本研究创新性地构建基于Vision Transformer(ViT)的融合深度学习模型,结合体素内不相干运动(IVIM)扩散加权成像(DWI)九组b值图像与参数图特征,实现肝细胞癌(HCC)肝切除术后早期复发的精准预测。该模型在训练集与测试集的曲线下面积(AUC)分别达0.991与0.821,显著优于单一临床模型,为HCC术后个体化监测提供无创影像学工具。
研究背景与意义
肝细胞癌(Hepatocellular Carcinoma, HCC)是全球范围内最常见的原发性肝脏恶性肿瘤,也是癌症相关死亡的主要原因之一。手术切除被视为早期HCC且肝功能保存良好患者的一线治疗方案。然而,HCC的预后仍然较差,术后复发率高达80%。HCC复发通常分为早期复发(术后两年内)和晚期复发(术后两年以上),其中早期复发与肝内转移相关,通常预示着更差的预后。因此,术前准确识别具有高早期复发风险的HCC患者,对于指导个体化术后监测和辅助治疗决策具有重要临床意义。
材料与方法
本研究为一项回顾性研究,经南方医科大学南方医院伦理委员会批准。研究纳入了2015年12月至2022年7月期间接受术前钆塞酸二钠增强肝脏磁共振成像(Magnetic Resonance Imaging, MRI)检查,并包含九个b值(b = 0, 10, 20, 40, 80, 200, 400, 600, 1000 s/mm2)扩散加权成像(Diffusion-Weighted Imaging, DWI)序列的122例HCC患者。所有患者均在接受肝切除术后进行了至少两年的随访,早期复发定义为术后两年内出现经影像学或病理学证实的复发事件。最终队列中,49例(40.1%)患者发生早期复发。患者被随机分为训练集(85例)和测试集(37例),两组基线临床特征无显著差异。
影像学数据采集与处理
MRI扫描使用两台3.0 T MRI系统完成。体素内不相干运动(Intravoxel Incoherent Motion, IVIM)参数图,包括表观扩散系数(Apparent Diffusion Coefficient, ADC)、真扩散系数(D)、伪扩散系数(D*)和灌注分数(f)图,由九个b值DWI图像在后处理工作站上生成。两名经验丰富的放射科医生手动勾画整个肿瘤的兴趣体积(Volumes of Interest, VOI),并提取肿瘤区域用于后续分析。
模型构建
本研究核心是构建基于Vision Transformer(ViT)框架的深度学习(Deep Learning, DL)模型。模型开发主要包括以下步骤:
- 1.
ViT-bDL模型:直接以九个b值DWI图像(通道堆叠后维度为64 × 64 × 64 × 9)作为输入,提取深度特征。
- 2.
ViT-mDL模型:以IVIM参数图(ADC, D, D*, f)作为输入,提取深度特征。
- 3.
ViT融合深度学习(ViT-fDL)模型:对ViT-bDL和ViT-mDL模型提取的深度特征进行融合(拼接和层归一化),构建预测模型。
- 4.
临床模型:通过多因素逻辑回归分析确定早期复发的独立临床预测因子(肿瘤大小和D值),构建基线模型。
- 5.
联合模型:将ViT-fDL模型筛选出的前10个最相关深度特征与独立的临床预测因子相结合,构建最终预测模型。
模型性能通过受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC)及曲线下面积(Area Under the Curve, AUC)、校准曲线、决策曲线分析(Decision Curve Analysis, DCA)进行评估。并使用梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)对模型决策进行可视化解释。
研究结果
基线特征分析显示,在训练集中,早期复发组与无早期复发组在肿瘤大小、天门冬氨酸氨基转移酶(Aspartate Aminotransferase, AST)、微血管侵犯(Microvascular Invasion, MVI)和D值上存在显著差异。多因素分析确定肿瘤大小和D值为早期复发的独立预测因子。
模型性能比较显示,临床模型在训练集和测试集的AUC分别为0.755和0.764。ViT-bDL模型和ViT-mDL模型在测试集的AUC分别为0.747和0.594。而融合了二者优势的ViT-fDL模型表现更优,训练集和测试集AUC分别达到0.968和0.815。最终,联合模型(融合了ViT-fDL深度特征和临床特征)取得了最佳预测性能,训练集AUC为0.991(95% CI, 0.940–1.000),测试集AUC为0.821(95% CI, 0.660–0.927)。决策曲线分析表明联合模型具有良好的临床适用性。校准曲线和Hosmer-Lemeshow检验(P值均>0.05)提示模型拟合度良好。
模型可解释性分析通过Grad-CAM实现。可视化结果显示,在早期复发的HCC病例中,模型注意力主要集中在肿瘤边缘多个区域,提示肿瘤异质性和边缘侵袭性对预测早期复发有重要贡献;而在无早期复发的病例中,模型激活区域较少。
讨论
本研究成功开发并验证了一种基于ViT框架和IVIM图像的深度学习模型,用于预测HCC术后早期复发。ViT框架通过自注意力和多头注意力机制,能够有效捕捉多b值图像和参数图中复杂的空间关系和潜在模式,克服了传统卷积神经网络(Convolutional Neural Networks, CNN)的某些局限性。研究结果表明,融合多源特征(原始b值图像和IVIM参数图)的ViT-fDL模型优于单一特征模型。进一步与临床特征结合的联合模型展现了最佳的预测效能。
值得注意的是,IVIM序列无需使用对比剂,这使得该模型对于不适合进行对比剂检查的HCC患者(如肾功能不全者)具有重要的临床应用价值。本研究采用全肿瘤VOI分析,相较于以往基于肿瘤最大截面的2D分析,能更全面地反映HCC的高度异质性。Grad-CAM的可视化结果与既往研究一致,强调了肿瘤内异质性和侵袭性边缘是早期复发的重要影像学特征。
本研究也存在一些局限性。首先,单中心回顾性设计和相对较小的样本量(特别是测试集)可能影响模型的普适性,未来需要通过多中心前瞻性研究进行外部验证。其次,IVIM序列的参数设置在不同机构间可能存在差异。此外,尽管采用了早停法和交叉验证以减轻过拟合风险,扩大样本量仍是未来改进的方向。
结论
本研究构建的联合模型,整合了基于IVIM图像的ViT深度学习特征和临床独立预测因子,能够有效预测HCC肝切除术后早期复发风险。该模型为非侵入性、术前预测HCC预后提供了有前景的工具,有望指导临床制定个体化的术后监测和辅助治疗策略,从而改善患者预后。当前研究结果为初步发现,后续需要扩大样本量和进行外部验证以进一步深入探索。