《Frontiers in Immunology》:Interpretable survival modeling integrating nutritional-inflammatory biomarkers in elderly patients with locally advanced esophageal squamous cell carcinoma treated with definitive radiotherapy
编辑推荐:
背景:接受根治性放疗的老年局部晚期食管鳞状细胞癌(esophageal squamous cell carcinoma, ESCC)患者表现出显著的生存异质性。单纯依靠解剖学分期无法充分反映宿主脆弱性、免疫炎症状态和治疗耐受性,因此基于常规可用变量构建可解释的
背景:接受根治性放疗的老年局部晚期食管鳞状细胞癌(esophageal squamous cell carcinoma, ESCC)患者表现出显著的生存异质性。单纯依靠解剖学分期无法充分反映宿主脆弱性、免疫炎症状态和治疗耐受性,因此基于常规可用变量构建可解释的预后工具可能有助于该人群的风险评估。方法:这项回顾性研究纳入了308例接受根治性放疗的老年局部晚期ESCC患者。排除12例数据缺失者后,剩余病例按7:3的比例随机分为训练队列和测试队列进行内部验证。利用临床病理和营养炎症变量构建了九种常规和基于机器学习的生存模型,并通过一致性指数(concordance index, C-index)、时间依赖性受试者工作特征曲线下面积(time-dependent area under the curve, AUC)和综合Brier评分(integrated Brier score, IBS)评估性能。对表现最佳的模型进行了SHAP分析,以阐明预测因子在整个随访过程中的贡献。结果:中位总生存期(overall survival, OS)和无进展生存期(progression-free survival, PFS)分别为19个月和13个月。对于OS,正则化线性生存模型显示出最稳定的性能,其中Ridge回归在测试队列中提供了最一致的区分度。对于PFS,模型排名更具时间和终点依赖性,没有任何复杂的机器学习算法表现出稳定的整体优势。探索性的年龄分层分析表明,老年亚组之间存在异质性,在65-74岁和≥75岁的患者中排名最高的算法不同。SHAP分析显示,营养指标,特别是老年营养风险指数(geriatric nutritional risk index, GNRI)和预后营养指数(prognostic nutritional index, PNI),对OS预测的贡献比短期PFS更持久,而基线炎症标志物如中性粒细胞淋巴细胞比值(neutrophil-to-lymphocyte ratio, NLR)和系统炎症反应指数(systemic inflammation response index, SIRI)在该多变量预测框架中显示出相对较弱的归因。基于Ridge的预测风险阈值确定了OS和PFS的明显高、低风险组。结论:在接受根治性放疗的老年局部晚期ESCC患者中,正则化线性模型显示出强大的预后效用,而更复杂的基于树或提升的模型未表现出稳定的优势。营养标志物,特别是GNRI和PNI,对OS提供了比短期PFS更持久的预后信息。探索性年龄分层分析和基于Ridge的阈值分析进一步表明,这种可解释的框架可能有助于细化随访,并在临床实施前的外部验证之前,优先考虑更高风险的老年亚组的早期营养评估或支持治疗。
论文解读:整合营养炎症指标的老年局部晚期食管鳞癌放疗预后模型研究
本研究聚焦于接受根治性放疗的老年局部晚期食管鳞状细胞癌(esophageal squamous cell carcinoma, ESCC)患者,探讨了整合营养炎症生物标志物的可解释生存模型的应用价值。该研究发表于《Frontiers in Immunology》。
研究背景与意义
食管鳞状细胞癌在全球范围内是常见的胃肠道恶性肿瘤,在中国尤其高发,且发病率随年龄增长而上升。随着人口老龄化,老年患者的比例增加,如何在控制肿瘤的同时平衡治疗耐受性和支持治疗成为挑战。尽管TNM分期系统是预后评估的基石,但它无法完全捕捉老年患者的营养储备、全身炎症状态和治疗耐受性等宿主相关特征。现有的研究多关注单一生物标志物的预后价值,缺乏将多维变量整合且具有临床可解释性的模型。因此,研究人员旨在通过比较多种生存模型,构建一个基于常规可用变量的可解释框架,以辅助老年患者的风险管理。
关键技术方法
研究人员开展了一项回顾性研究,纳入了2016年至2023年间在安徽医科大学第一附属医院接受根治性放疗的308例老年局部晚期ESCC患者。在排除12例数据缺失者后,将患者按7:3比例随机分为训练集和测试集。研究收集了临床病理特征及基线营养炎症生物标志物,包括GNRI、PNI、NLR、SIRI等。研究人员构建了九种生存模型,涵盖传统Cox模型、LASSO-Cox、Ridge回归、Elastic Net以及随机生存森林(random survival forest, RSF)、梯度提升机(gradient boosting machine, GBM)、ExtraTrees、XGBoost和XGB_AFT。模型性能通过C-index、时间依赖性AUC和IBS进行评估,并利用SHAP(Shapley Additive Explanations)分析进行解释。此外,还进行了探索性的年龄分层(65-74岁与≥75岁)和基于风险阈值的分层分析。
研究结果
患者特征
共纳入308例患者,训练集214例,测试集94例。两组间基线特征均衡。总体人群的中位OS和中位PFS分别为19个月和13个月。
OS生存模型的比较性能
在独立测试队列中,正则化Cox回归模型显示出略优于传统Cox模型和树基集成方法的区分度。Ridge回归取得了最高的C-index(0.730),而传统的Cox模型为0.726。相比之下,XGB_AFT模型表现最弱(C-index为0.527)。这表明在完整的测试队列中,正则化线性生存模型对OS的预测更为稳健。
OS的时间依赖性ROC分析
时间依赖性ROC分析进一步支持了Ridge模型对OS预测的时间稳定性。该模型在24、36和48个月的AUC分别为0.861、0.858和0.839。结合IBS分析,表明Ridge回归在OS预测中提供了最一致的区分度和稳定性。
OS的校准和决策曲线分析
对Ridge模型的进一步评估显示,在24、36和48个月时,预测风险与观察风险之间有可接受的一致性。决策曲线分析表明,在特定阈值概率范围内,Ridge模型比“全治疗”或“不治疗”策略提供了更大的净获益,尤其在24个月时最为明显。
PFS生存模型的比较性能
对于PFS预测,模型的相对排名与OS部分相似,但没有单一模型在所有评估维度上均占优。ExtraTrees在测试队列中取得了最高的总体C-index(0.687),Ridge回归和RSF紧随其后。XGBoost再次显示出最弱的区分度。PFS的模型排名在不同指标和时间点上更不稳定,表明短期进展风险的预测更具挑战性。
PFS的时间依赖性ROC分析
在预设的时间节点上,Ridge回归显示出最一致的时间区分度,12、24和36个月的AUC分别为0.800、0.771和0.729。尽管ExtraTrees的总体C-index最高,但在后期随访节点上的优势并未持续。
PFS的校准和决策曲线分析
所选模型在12、24和36个月时的校准图显示了预测风险与观察风险之间的可接受一致性。决策曲线分析显示在特定阈值下具有净获益优势,但在36个月时获益较小。
OS预测的SHAP解释
SHAP分析显示,年龄、TNM分期和化疗周期数是跨时间范围内最具影响力的预测因子。营养指标(GNRI、PNI、BMI)始终保持在所有评估时间点前10位的影响因素中,表明基线营养状态提供了稳定的预后信息。相比之下,基线炎症标志物(如SIRI、NLR)排名相对较低,表明在多变量框架中,单一基线炎症指数的增量预后信息有限。
PFS预测的SHAP解释
SHAP分析表明,化疗周期数、TNM分期和T分期是PFS的主要预测因子。与OS相比,营养指标在PFS预测中的重要性较低且不持久,提示短期进展可能更多受肿瘤范围和治疗因素影响。
探索性年龄分层模型性能
年龄分层分析揭示了不同年龄段模型行为的异质性。对于OS,65-74岁亚组中ExtraTrees表现最佳,而≥75岁亚组中GBM最优。对于PFS,两个年龄段分别由ExtraTrees和LASSO表现最好。这表明即使在老年ESCC人群内部,预后结构也存在差异。
风险阈值分层和预后分离
利用Ridge模型衍生的预测风险进行阈值分层,确定了OS(24个月,临界值0.6784)和PFS(12个月,临界值0.3943)的最佳分界点。高风险组与低风险组之间的风险比分别为4.57和3.89,Kaplan-Meier分析显示两组间生存分离明显。
讨论与结论
讨论部分指出,Ridge回归因其L2正则化特性,在处理相关临床特征和有限样本量时表现出更强的鲁棒性,反驳了算法复杂度等同于更好预后效用的观点。研究强调了营养生物标志物(特别是GNRI和PNI)在老年ESCC患者长期生存预后中的稳定价值,而炎症标志物的作用在本研究的多变量框架中相对有限。此外,研究承认了单中心回顾性设计的局限性以及仅使用基线指标的不足。
结论总结如下:在接受根治性放疗的老年局部晚期ESCC患者中,正则化线性模型显示出强大的预后效用,而更复杂的机器学习算法未表现出稳定的优势。营养标志物对OS提供了比短期PFS更持久的预后信息。探索性年龄分层分析和基于Ridge的阈值分析表明,这种可解释的框架可能有助于细化随访,并在外部验证前,优先考虑高风险老年亚组的早期营养评估或支持治疗。