《BMEF (BME Frontiers)》:Multiomics Machine Learning to Predict Neoadjuvant Chemotherapy Outcome and Relapse of Breast Cancer
编辑推荐:
本研究针对乳腺癌新辅助化疗(NAC)疗效个体差异大、缺乏精准预测工具的临床难题,开发了一种融合临床病理指标与磁共振影像瘤内异质性(RadSITH)标志物的多组学(MO)整合模型。通过堆叠集成学习算法,该模型在124例患者队列中实现了病理完全缓解(pCR)预测的曲线下面积(AUC)达0.917,显著优于单一模态模型;同时构建的弹性网Cox模型对术后3年无病生存期(DFS)预测的C-index达0.78-0.81。研究成果为乳腺癌个体化治疗决策提供了可解释的AI驱动工具,凸显多组学融合在精准医学中的潜力。
乳腺癌是全球女性发病率最高的恶性肿瘤,新辅助化疗(NAC)已成为局部晚期乳腺癌的标准治疗方案,旨在缩小肿瘤体积、提高保乳手术机会。然而,并非所有患者都能从NAC中获益:约26.6%的患者可实现病理完全缓解(pCR),而其余患者不仅承受无效治疗的经济负担,还可能延误有效治疗时机。瘤内异质性(ITH)是导致化疗耐药和预后差异的关键因素,但传统影像学方法难以量化这一特性。如何在新辅助化疗前精准预测pCR和复发风险,成为临床决策的痛点。
为破解这一难题,研究团队创新性地将多组学(MO)数据与堆叠集成学习相结合,开展了一项回顾性研究。论文发表于《BMEF (BME Frontiers)》,通过整合临床病理指标、分子分型及高分辨率动态磁共振成像(MRI)衍生的放射组学特征,构建了可同时预测NAC疗效和术后复发风险的智能模型。
研究的关键技术方法包括:首先,基于124例接受NAC的乳腺癌患者队列(来源:福建省肿瘤医院),从术前动态增强MRI中提取全肿瘤(RadSET)和瘤内异质性(RadSITH)放射组学特征;其次,利用灰度共生矩阵纹理参数划分肿瘤亚区,生成栖息地簇群标签图;最后,通过堆叠集成学习(融合逻辑回归、神经网络、XGBoost等7种基线算法)优化多组学整合模型,并采用5折交叉验证和置换检验评估过拟合风险。
基线患者特征
纳入的124例患者中,pCR组(33例)与非pCR组(91例)在HER2状态、Ki-67指数、分子分型及NAC方案等方面存在显著差异(P<0.05),而年龄、月经状态等基线特征无统计学差异(Table 1)。这提示分子分型与治疗反应密切相关,为模型构建提供了临床依据。
放射组学分析
通过逐步特征筛选,最终保留15个RadSET特征和7个RadSITH特征。模型比较显示,XGBoost构建的RadSITH模型对pCR预测的AUC达0.798,优于Na?ve Bayes构建的RadSET模型(AUC=0.770)(Fig. 1D-E)。瘤内异质性特征展现出更强的预测潜力。
多组学整合预测pCR
将RadSITH、RadSET、临床N分期和分子分型整合为多组学模型后,堆叠集成学习算法将pCR预测AUC提升至0.917(95% CI: 0.860-0.958),灵敏度与特异度分别达84.8%和91.2%(Fig. 2D)。SHAP分析揭示RadSITH为最重要预测因子(Fig. 2E),多变量逻辑回归进一步验证其独立预测价值(OR=22.9, P=0.005)。此外,基于神经网络的模型对RECIST疗效分层的AUC为0.824,可识别92.4%的NAC应答者(Fig. 3)。
多组学与术后复发的关联
中位随访3年内,13.6%的患者出现复发。弹性网Cox回归显示,术前模型(含MO预测pCR状态、RECIST反应和RadSITH)的C-index为0.78,术后模型(含病理分级、pCR状态、pT/pN分期)的C-index升至0.81(Fig. 4B)。Kaplan-Meier曲线证实基于多组学特征分层的患者生存差异显著(Fig. 4C)。
研究结论指出,融合瘤内异质性影像标志物的多组学整合策略,可显著提升乳腺癌NAC疗效和复发风险的预测精度。堆叠集成学习算法兼顾模型性能与可解释性,RadSITH作为独立预测因子,为量化肿瘤异质性提供了无创生物标志物。尽管存在单中心回顾性研究的局限性,该成果为开发个体化辅助决策系统奠定了方法学基础,推动影像组学向临床实践转化。未来需通过多中心前瞻性研究验证模型的普适性。