基于病理组学的子宫内膜癌术前预后预测模型:一项临床可转化的整合研究

《Hormones & Cancer》:A clinically translatable pathomics-based predictive model for preoperative prognostic assessment in patients with endometrial cancer

【字体: 时间:2026年01月18日 来源:Hormones & Cancer

编辑推荐:

  本研究针对子宫内膜癌分子异质性强、传统临床参数预后预测精度不足的问题,开发了一种基于H&E染色全切片图像的病理组学预测模型。研究人员整合机器学习与临床病理因素构建预后列线图,结果显示该模型能显著提高预后预测准确性(AUC达0.966),并揭示其与MAPK信号通路等关键生物学过程相关,为个体化临床决策提供了新工具。

  
在全球范围内,子宫内膜癌(Endometrial Cancer, EC)是女性生殖系统最常见的恶性肿瘤之一,其发病率正随着肥胖和老龄化趋势的上升而持续增长。尽管早期诊断的患者预后较好,但晚期或复发性患者的5年生存率却急剧下降至50%以下,凸显了该疾病严峻的临床异质性。传统的临床病理参数,如国际妇产科联盟(FIGO)分期和组织学分级,虽然在风险分层中扮演着基础角色,但往往难以全面捕捉疾病的复杂性,尤其是在早期病例中,其预后结局可能存在显著差异。癌症基因组图谱(The Cancer Genome Atlas, TCGA)计划将子宫内膜癌划分为四个不同的分子亚型,为预后判断和治疗选择带来了革命性的见解,然而,基因组分析的成本和技术壁垒限制了其临床广泛应用。因此,开发一种易于获取且有效的预后工具,以实现更精准的风险分层,成为当前临床实践的迫切需求。
在这一背景下,计算病理学(Computational Pathology)应运而生,成为一种变革性的力量。常规苏木精-伊红(Hematoxylin and Eosin, H&E)染色全切片图像(Whole Slide Images, WSIs)的数字化,使得我们能够高通量地提取那些肉眼难以察觉的定量数据——即病理组学(Pathomics)特征。这些特征捕捉了细胞形态、组织结构乃至肿瘤微环境中的复杂细节,并通过先进的机器学习算法进行挖掘。病理组学特征已在多种癌症中展现出预测生存、分子分型及治疗反应的巨大潜力,有效地在传统组织学与基因组信息之间架起了桥梁。然而,将病理组学应用于子宫内膜癌的研究仍处于起步阶段。考虑到分子检测的可及性限制和高昂成本,病理组学为风险分层提供了一条经济高效且可扩展的新途径。
本研究旨在利用病理组学的力量,为子宫内膜癌开发并验证一个整合的预后预测工具。研究团队系统性地分析了来自TCGA-UCEC(子宫体子宫内膜癌)队列的WSIs,采用留一交叉验证(Leave-One-Out Cross-Validation, LOOCV)框架,通过结合LASSO(Least Absolute Shrinkage and Selection Operator)和随机生存森林(Random Survival Forest, RSF)的方法来识别最优的病理组学特征。进一步地,研究通过差异表达和功能富集分析探讨了所得病理组学评分的生物学基础。最终目标是构建一个列线图(Nomogram),将病理组学评分与关键临床变量协同整合,从而为个体化预后预测提供一个更优越、更经济有效的工具。这项研究发表在《Discover Oncology》期刊上。
为开展此项研究,研究人员主要应用了几项关键技术方法。回顾性收集了TCGA-UCEC项目中511例子宫内膜癌患者的H&E染色WSIs和临床数据,经过严格质控后随机分为训练集(341例)和验证集(170例)。病理组学特征提取使用CellProfiler软件从病理学家手动标注的高肿瘤细胞密度区域(>80%)进行,共提取728个定量特征。特征筛选与模型构建在LOOCV框架下进行,结合LASSO-Cox回归和RSF算法,最终得到包含10个特征的病理组学评分。通过差异表达分析、GO/KEGG/GSEA富集分析探索评分相关的生物学通路,并利用免疫组化(IHC)对p-MEK和p-ERK进行实验验证。最后,基于多变量Cox分析结果,整合FIGO分期、分级、淋巴结转移(LNM)状态和病理组学评分构建预后列线图,并通过C-index、校准曲线和ROC曲线进行评估。
特征筛选与病理组学模型构建
为了构建稳健的预后模型,研究采用了以留一交叉验证(LOOCV)为核心的机器学习框架。在每次LOOCV迭代中,使用LASSO-Cox回归进行特征筛选,然后利用随机生存森林(RSF)模型进行预测。在评估了101种不同预测算法后,结合LASSO和RSF的算法表现出最优性能,平均C-index达到0.785,因此被选为构建最终病理组学特征的模型。通过LASSO回归,最终基于10个选定的定量图像特征得到了一个稳健的病理组学评分。
病理组学评分的预后价值与临床关联
使用病理组学评分的中位数作为截断值,将整个队列(n=511)分为高风险组(n=255)和低风险组(n=256)。热图显示,病理组学风险分组与年龄、FIGO分期、分级、LNM、复发、肿瘤突变负荷(TMB)和TCGA分子亚型等多个临床病理因素存在显著关联(p<0.05)。Kaplan-Meier生存分析证实,无论是在训练队列(p=2.813e-09)、验证队列(p=6.952e-04)还是整个队列(p=1.593e-11)中,高风险组患者的总生存期均显著差于低风险组患者。时间依赖性ROC分析进一步量化了病理组学评分的预后准确性:在训练队列中,预测1年、3年和5年总生存期的AUC值分别为0.991、0.961和0.966;在验证队列中,相应的AUC值分别为0.826、0.710和0.724;在整个队列中,AUC值达到0.953、0.911和0.918。这些发现表明,通过优化的机器学习流程开发的病理组学特征,是一个强大且可靠的生物标志物,能够以高预测精度对EC患者进行预后分层。
病理组学评分在不同临床病理亚组中的分布
对病理组学风险评分在不同临床病理特征中分布的分析揭示,其与FIGO分期显著相关,显示评分随着疾病分期的进展而逐步增加。此外,病理组学风险评分还与肿瘤分级、组织学类型、LNM、mRNAsi状态(干细胞指数)、腹膜细胞学、复发状态、癌症状态和TMB等其他关键参数存在显著关联。值得注意的是,在具有更不利临床特征的亚组中,如LNM阳性、腹膜细胞学阳性、3级肿瘤以及特定分子谱, consistently观察到更高的病理组学风险评分。这一致模式强烈表明,病理组学评分有效地捕捉了潜在的肿瘤侵袭性,并反映了EC的关键生物学和临床特征。
基于病理组学分层的转录组学分析
为了阐明基于病理组学分层的分子基础,研究利用TCGA数据进行了全面的转录组学分析。基于病理组学评分中位数将整个队列分为高风险组和低风险组后,差异表达分析共识别出2715个在两组间显著失调的基因(DEGs),揭示了显著的分子异质性。对这些DEGs的功能注释(GO分析)显示,它们在核糖核蛋白复合体生物合成、核质运输、核输入、黏着斑和鸟苷酸结合等细胞调控和信号转导的关键生物学过程中显著富集。同时,KEGG通路分析表明,DEGs显著富集于若干癌症和应激相关通路,最显著的是子宫内膜癌、MAPK信号通路、自噬和细胞衰老。基因集富集分析(GSEA)结果显示,高风险组的转录组谱与关键致癌和代谢通路显著相关,包括HIF-1信号通路、AMPK信号通路、线粒体自噬和雌激素信号通路。为了进一步验证基于病理组学分层的生物学相关性,研究在代表性肿瘤样本中对MAPK信号通路的两个关键效应因子磷酸化MEK(p-MEK)和磷酸化ERK(p-ERK)进行了免疫组化(IHC)染色。IHC结果显示,与低风险组相比,高风险组中p-MEK和p-ERK的表达水平均显著增加。这项整合分析在病理组学衍生的风险组与不同的转录程序之间建立了强有力的联系,表明癌症特异性信号、应激反应机制和代谢通路的失调共同驱动了在高风险患者亚组中观察到的侵袭性表型。
列线图的构建与评估
为了确定EC患者的独立预后因素,研究首先进行了单变量Cox回归分析。将具有显著关联的变量纳入多变量Cox分析后确认,FIGO分期(HR=1.881, 95% CI: 1.064-3.326, p=0.030)、肿瘤分级(HR=1.863, 95% CI: 1.048-3.313, p=0.034)、LNM(HR=3.880, 95% CI: 1.902-6.917, p=0.012)和病理组学风险评分(HR=18.981, 95% CI: 5.875-61.324, p<0.001)均是总生存期的独立预测因子。利用这四个稳健的因素,研究构建了一个全面的列线图,旨在提供个体化的1年、3年和5年总生存概率预测。对该列线图性能的严格评估显示,其在训练队列、验证队列和整个队列中的预测生存概率与实际观察结果之间均具有极好的一致性,表明其具有很高的预测准确性。
多模式列线图的预后价值
对列线图预后效能的系统评估显示,整合的列线图在1年、3年、5年和7年的时间依赖性C-index分析中, consistently实现了最高的总生存预测准确度,在所有队列中均优于仅基于LNM、分期、分级或病理组学风险评分的模型。基于列线图总分将患者分为高风险组和低风险组后,Kaplan-Meier生存分析显示,高风险组的预后显著差于低风险组,这种生存差异在训练队列、验证队列和整个队列中均一致存在。随后的定量评估表明,整合了病理组学评分与LNM、分期、分级的列线图,其生存预测的AUC值显著高于仅包含三个临床因素的模型。这种AUC的提升在训练队列、验证队列和整个队列中均具有统计学意义(p<0.05)。综合评估证实,整合的列线图不仅提供了优越的预测准确性和稳健的风险分层,而且证明了纳入病理组学特征显著增强了超越传统临床因素的预后价值。
本研究通过整合源自H&E染色全切片图像的病理组学特征与已确立的临床风险因素,为EC建立了一个新颖的预后预测框架。研究结果表明,病理组学评分作为一个独立的预后指标显示出潜力,并能增强临床模型的预测准确性,提示计算病理学在EC风险分层中具有附加价值。尽管FIGO分期和组织学分级仍然是临床决策的基础,但它们往往无法完全捕捉疾病的异质性。病理组学能够高通量量化标准组织病理学图像中的亚视觉形态模式,提供组织架构、细胞形态和空间肿瘤微环境的可重复定量描述符。此类特征已被证明可以反映潜在分子改变和肿瘤生物学特性。本研究通过开发一个生物学上可解释的病理组学评分并将其与不同的转录组程序相联系,解决了EC中病理组学应用有限的空白,从而巩固了其作为数字生物标志物的潜力。
从转化研究的角度来看,所提出的列线图提供了一个潜在工具,可用于改进风险分层,特别是在术前环境中。如果进一步验证确认其稳健性,这种整合模型可能有助于在确定性手术前识别高危患者,从而为手术范围或辅助治疗的必要性决策提供信息。除了手术规划,该模型还可能指导辅助治疗决策和随访策略,特别是在组织学结果不明确的患者中。通过提供早期且准确的风险评估,该工具在初步诊断和确定性治疗之间架起了桥梁,从而促进及时和个体化的临床管理。最终,将此类预测模型整合到诊断工作流程中,对于改善EC护理的结局和资源分配具有广阔前景。
研究结论部分强调,本研究开发并验证了一个整合的列线图,该列线图结合了源自H&E图像的病理组学特征和标准临床病理因素,用于预测EC患者的总生存期。该模型显示出优于单独临床变量的预后性能,并提供了一个生物学上可解释、经济高效的风险分层工具。经过进一步的外部验证,该方法有潜力支持个体化的临床决策制定,并改善EC患者的预后。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号