《Frontiers in Oncology》:Multi-channel multiphase CT-based deep learning and radiomics fusion model for noninvasive pathological grading of clear cell renal cell carcinoma
编辑推荐:
本研究开发了一种整合多通道深度学习特征、影像组学特征和临床变量的融合模型,通过多期相增强CT实现透明细胞肾细胞癌(ccRCC)的无创病理分级。该模型采用5mm瘤周扩展区域(ROI)的多通道输入结构,结合ResNet50架构和随机森林(RF)分类器,在测试队列中曲线下面积(AUC)达0.849,显著优于单一模态模型。决策曲线分析(DCA)证实其具有更高临床净获益,为ccRCC个体化治疗提供了可解释的无创评估工具。
引言
透明细胞肾细胞癌(ccRCC)作为最常见的肾恶性肿瘤亚型,占所有肾细胞癌病例的70-80%。其病理分级对评估肿瘤侵袭性、转移潜能及患者预后具有关键作用。传统分级方法依赖组织病理学活检,但由于ccRCC存在显著的空间和时间异质性,单次活检往往难以全面反映肿瘤生物学特征,限制了治疗计划的准确性。近年来,基于影像的无创预测模型已成为肿瘤分级、风险分层和治疗指导的重要工具。
影像组学(Radiomics)通过从标准医学图像中提取高通量定量特征,揭示了视觉感知之外的病理模式。然而,其判别能力常受限于特征集的预定义和对采集协议变异的敏感性。深度学习通过构建多层神经网络模拟人脑认知过程,采用反向传播算法优化参数,并通过非线性激活函数逐步提取特征,在医学影像领域取得显著成功。卷积神经网络(CNN)尤其广泛应用于肿瘤检测、分割和分级任务,在多样化数据集上展现出鲁棒性和泛化能力。
不同感兴趣区域(ROI)的设置使网络能够在多空间尺度上捕捉肿瘤生物学特性。狭窄ROI聚焦于病灶核心,可能突出瘤内异质性,而扩展ROI可包含瘤周组织,捕获水肿、血管生成或微浸润等生物学线索。通过比较不同ROI配置下的模型性能,可评估空间语境对病理分级准确性的影响。
多通道深度学习通过并行异构数据流处理架构实现跨模态信息整合。其核心是采用独立分支网络提取模态特异性特征,再通过分层融合策略构建互补的联合表征。在多期相增强CT中,将动脉期、髓质期和排泄期图像堆叠为多通道输入,可同时捕获肿瘤血管性、实质强化模式和延迟廓清特征,尤其适用于ccRCC这种以血管动力学和组织异质性为病理标志的疾病。
既往研究多局限于单期相成像或传统影像组学分析,例如Gurbani等人基于非增强和门静脉期CT图像开发的预测模型AUC仅0.58-0.69,表明简单线性融合难以充分捕捉ccRCC的复杂病理异质性。本研究通过三项针对性改进实现方法学突破:构建真正的多通道输入结构整合三期增强CT图像;引入5mm瘤周扩展区域捕获肿瘤微环境信息;将深度学习特征与影像组学特征、临床变量进行多维整合,建立更准确全面的无创评估框架。
材料与方法
研究人群
这项回顾性研究经机构审查委员会批准,免除了知情同意要求。研究纳入了2021年6月至2024年12月期间术前接受增强CT扫描并经病理确诊的ccRCC患者。纳入标准包括:术前三期增强CT图像齐全;单发肿瘤且无放化疗史;术后病理确诊且临床资料完整。排除标准为:图像存在严重运动伪影或噪声;影像或病理资料不全;非透明细胞肾癌。最终496例患者按7:3比例随机分为训练队列(347例)和测试队列(149例),使用固定随机种子2025确保可重复性。
临床和影像数据
收集的临床变量包括性别、年龄、血尿和腰痛。病理分级依据WHO/ISUP分级系统,将1-2级定义为低级别,3-4级定义为高级别。两名放射科医师独立评估术前CT影像特征,包括钙化、瘤内坏死和动脉期肿瘤小叶间动脉显示情况。分歧由第三位高年资医师仲裁。
CT采集协议
所有CT检查均采用高端多排CT扫描仪(Philips Brilliance iCT 256,GE Revolution 128)。三期增强扫描参数为:管电压120 kV,管电流250 mA,层厚1 mm(Philips)或1.25 mm(GE),层间隔1 mm(Philips)或1.25 mm(GE)。对比剂注射流速4 mL/s,扫描范围覆盖全肾及肿瘤。
图像分割
所有CT数据重采样至1 mm×1 mm×1 mm各向同性体素,窗宽窗位分别标准化为350 HU和50 HU,强度标准化采用Z-score法。两名医师使用ITK-SNAP v3.8.0软件手动勾画三维ROI,随机50例计算组内相关系数(ICC>0.75表明一致性良好)。
二维ROI构建与多通道深度学习模型开发
基于三维分割结果,沿轴位选择肿瘤最大横截面积切片作为二维输入。构建三种ROI配置:原始ROI切片(包含全肾区域)、肿瘤专用ROI切片(仅聚焦肿瘤核心)和扩展ROI切片(瘤周5mm扩展区域)。所有图像调整至224×224像素,将三期ROI沿通道维度堆叠形成224×224×3多通道输入。
采用ResNet50迁移学习框架,训练过程中使用实时数据增强(随机水平翻转和裁剪)。交叉熵损失函数初始学习率0.01,余弦退火调度,训练50个周期,批大小128。从全局平均池化层提取深度学习特征,与影像组学特征结合构建模型。使用梯度加权类激活映射(Grad-CAM)评估模型可解释性。
影像组学-深度学习模型构建
基于动脉期CT特征对ccRCC分级具有高判别力的证据,仅从动脉期图像提取影像组学特征。将三种ROI配置的深度学习特征分别与动脉期影像组学特征融合,形成三种组合模型。在训练集中进行两步特征选择:方差分析(ANOVA)保留ICC>0.9且差异显著的特征;LASSO回归通过10折交叉验证筛选非零系数特征。比较逻辑回归(LR)、支持向量机(SVM)和随机森林(RF)分类器性能。
临床-影像组学-深度学习模型整合
将最优影像组学-深度学习模型与临床变量整合构建联合模型。通过AUC、准确率、敏感性、特异性等指标评估性能,DeLong检验比较AUC差异,校准曲线评估预测概率与观测结果的一致性,决策曲线分析(DCA)评估临床净获益。
统计分析
分类变量采用卡方检验或Fisher精确检验,连续变量采用Mann-Whitney U检验或独立样本t检验。使用pROC R包计算AUC的95%置信区间,DeLong检验统计显著性(P<0.05)。所有分析采用OnekeyAI、R 4.3.3和Python 3.11.11完成。
结果
患者特征与临床特征
496例患者中,训练队列男性227例、女性120例,测试队列男性93例、女性56例。平均年龄训练队列60.89±10.06岁,测试队列59.28±9.72岁。血尿、瘤内坏死和肿瘤小叶间动脉在两组间存在显著差异(P<0.05)。单因素和多因素分析显示仅年龄与病理分级显著相关。
深度学习模型性能与可视化
ResNet50在不同ROI配置中,5mm扩展ROI预测性能最优:训练队列AUC 0.791(95%CI:0.740-0.842),测试队列AUC 0.780(95%CI:0.700-0.859)。Grad-CAM可视化显示高级别肿瘤激活区域更大,低级别肿瘤激活有限,网络对高级别病灶的瘤内异质性和肿瘤边缘表现出敏感性。
联合模型性能比较
LASSO特征选择后,三种联合模型分别保留24、31和34个特征。5mm扩展ROI为基础的联合模型整体性能最佳,RF分类器表现最稳定(训练队列AUC 0.849,测试队列AUC 0.831)。临床-影像联合模型在测试队列AUC达0.849,显著优于单纯临床模型(P<0.001),与影像组学模型无显著差异(P=0.123)。校准曲线显示联合模型预测概率与观测事件率更接近,DCA证实其在广泛阈值概率范围内具有更高临床净获益。
讨论
深度学习在医学影像多模态融合分析中展现出显著优势。通过整合CT、MRI、PET等成像模式的互补信息,能够从多角度表征病变,支持复杂病例的临床决策。本研究通过整合深度学习特征、影像组学特征和临床变量,开发了ccRCC病理分级的临床-影像联合模型。
与既往基于影像组学和传统机器学习的研究相比,本研究实现了重要方法学进展。5mm瘤周扩展的多通道模型与影像组学特征融合后表现出最优性能,可能捕获了微浸润、微血管增殖等瘤周微环境线索。多期相CT图像堆叠为三通道输入,使模型能够获取更全面的生理和病理 profiles。
本研究创新点在于双层次整合:通过多通道输入实现图像级融合,通过与影像组学和临床数据的特征级融合构建分层策略。这种混合方法最大化发挥了各技术的互补优势,DCA分析进一步支持其临床转化潜力。
从临床视角看,将多期相CT特征与常规临床数据整合为统一预测框架,可作为决策支持工具识别高危患者、指导活检优先级或定制随访计划。然而,成功临床转化需要跨多样人群和成像系统的严格外部验证,以及可解释性工具提供预测的视觉和定量解释。
需说明的是,虽然分割阶段使用三维肿瘤ROI精确定位,但深度学习分支采用基于切片的2.5D输入策略:每期选择肿瘤最大横截面积切片,三期切片在图像级融合为多通道输入。最大面积切片通常包含更丰富的肿瘤形态和强化异质性信息,在计算效率和信息量间取得平衡。未来工作将通过对照实验比较不同切片选择策略,并结合重复重采样和交叉验证进一步量化模型对切片选择的鲁棒性。
值得注意的是,WHO/ISUP分级系统本身具有明确序贯结构,等级从低到高反映肿瘤细胞核异型性和生物学侵袭性的渐进过程。本研究采用二分类策略虽简化了分级任务,但忽略了等级间的连续性和层次进展。未来样本量扩大和多中心数据纳入后,可探索多分类或序贯回归框架,更精确表征WHO/ISUP分级体系体现的连续病理谱系。
我们观察到敏感性存在轻微不足,可能源于样本量有限和类别不平衡——高级别肿瘤代表性不足导致模型预测偏向多数类(低级别),从而增加侵袭性疾病的假阴性。既往文献表明此类不平衡会显著降低机器学习性能。未来工作可考虑高级采样策略、合成少数类过采样、成本敏感或焦点损失函数等改进高级别肿瘤的敏感性。
本研究存在若干局限性:单中心回顾性设计可能引入选择偏倚;虽然随机分组,但样本量有限和事件分布不均可能导致基线不平衡;模型泛化性未经多中心验证。未来将通过分层随机分割和重复重采样优化内部验证策略,同时开展多中心外部验证评估模型鲁棒性。此外,特征选择、融合和超参数调优的最佳策略仍有待确定,可引入基于注意力的显著性映射或SHAP值分析等高级可解释性方法深化对模型决策机制的理解。
总结而言,本研究提出的多通道多期相CT深度学习与影像组学融合模型,通过整合瘤周扩展和互补期相信息,生成更具表达力和鲁棒性的特征表征,在保持临床可解释性的同时实现强预测性能。尽管存在局限,该模型作为风险分层和治疗规划的决策支持工具具有重要潜力,未来工作应聚焦于多机构测试、多模态整合和临床工作流实时部署探索。