高级别子宫内膜癌的基因组学和转录组学分析揭示了生物学异质性以及分子分类方面的挑战
开放获取
《Cancer Research Communications》:Genomic and Transcriptomic Analysis of High-Grade Endometrial Carcinoma Reveals Biological Heterogeneity and Molecular Classification Challenges
Open Access
【字体:
大
中
小
】
时间:2026年05月01日
来源:Cancer Research Communications
编辑推荐:
开放型图像查看器
摘要
高级别子宫内膜癌表现出明显的组织学多样性,但其分子基础以及转录组表型在分子分类中的潜在贡献仍不完全清楚。为了解决这个问题,我们对81例高级别子宫内膜癌(包括浆液性、透明细胞型、3级子宫内膜样癌和肉瘤样癌)进行了全外显子测序和RNA测序。根据癌症基因组图
开放型图像查看器
摘要
高级别子宫内膜癌表现出明显的组织学多样性,但其分子基础以及转录组表型在分子分类中的潜在贡献仍不完全清楚。为了解决这个问题,我们对81例高级别子宫内膜癌(包括浆液性、透明细胞型、3级子宫内膜样癌和肉瘤样癌)进行了全外显子测序和RNA测序。根据癌症基因组图谱(The Cancer Genome Atlas)和ProMisE框架,将这些肿瘤分为不同的分子亚型:POLE超突变型、微卫星不稳定高型(MSI-H)、TP53突变型(TP53-mut)以及无特定分子特征型(NSMP)。通过基因表达的无监督聚类识别出转录组表型,并将其与组织学特征、分子亚型、免疫相关基因表达和临床结果进行关联分析。研究发现,在非POLE/非MSI-H肿瘤中,TP53突变状态、p53免疫组化(IHC)和基于拷贝数的分类之间存在显著差异。转录组聚类确定了三种与细胞分化状态相关的表型组:腺体/管腔型、纤毛型和上皮-间充质转化样(EMT样)型。这些表型跨越了分子亚型的界限。例如,TP53突变型肿瘤同时存在于腺体/管腔型和EMT样型中。腺体/管腔型与增强的抗原呈递(如HLA表达)和免疫相关信号传导相关,而EMT样型则与干细胞特性和转移潜能相关。TP53突变型和NSMP型与高级别子宫内膜癌的不良预后相关,而腺体/管腔型则比EMT样型具有更好的预后,这一效应很大程度上受到肉瘤样癌比例的影响。转录组表型补充了分子亚型的信息,提高了生物学分辨率并捕捉到了临床相关的异质性。这些结果凸显了当前分子分类方法的持续挑战,支持需要采用综合性策略来处理高级别疾病。
重要性:高级别子宫内膜癌表现出显著的异质性。我们发现TP53突变状态、p53 IHC和基于拷贝数的分类之间存在显著差异,同时转录组表型跨越了不同的分子亚型。这些发现为开发改进的分类方法提供了基础,以更好地解释高级别疾病的异质性分子景观。
引言
子宫内膜癌的发病率在全球范围内正在上升,尤其是在年轻人群中(1)。传统上,子宫内膜癌根据临床病理特征被分为I型和II型。然而,最近的基因组研究将其细分为四种分子亚型。根据癌症基因组图谱(TCGA)的基因组分析,这四种亚型包括POLE超突变型、微卫星不稳定高型(MSI-H)、拷贝数高型(CN-H,通常为TP53突变)和拷贝数低型(CN-L;参考文献2)。ProMisE分类器通过使用免疫组化(IHC)检测错配修复(MMR)蛋白和p53,将肿瘤分为POLE突变型、MMR缺陷型(MMRd)、p53野生型(WT)和p53异常型(p53-abn;参考文献3-5),从而促进了其临床应用。基于这些框架,分子分类越来越多地被纳入子宫内膜癌的管理中,并被2020年世界卫生组织(WHO)的分类(6)和2023年更新的FIGO分期系统(7)所采用。然而,一个重要的挑战仍然存在:分子亚型与组织学分类之间的相关性较弱,尤其是在高级别子宫内膜癌中(5)。例如,透明细胞型和肉瘤样癌亚型包含了所有四种分子类别(8, 9)。无特定分子特征型(NSMP)在I型子宫内膜癌中很常见,也出现在高级别肿瘤中(10, 11),但其临床意义仍不明确。重要的是,NSMP型肿瘤在高级别子宫内膜癌中的预后行为尚未得到充分阐明,这引发了人们对当前分子分类框架一致性和准确性的担忧,因为这些框架主要是基于低级别子宫内膜癌建立的,可能不直接适用于高级别疾病。免疫检查点抑制剂(ICI)在KEYNOTE-158研究中显示出作为单药治疗MSI-H或MMRd子宫内膜癌患者的显著疗效(12)。基于KEYNOTE-775试验,lenvatinib和pembrolizumab的组合被批准用于非MMRd(即MMR proficient;pMMR)患者的治疗,尽管在MMRd患者中的效果更为明显。与此同时,子宫内膜癌治疗的临床格局正在发生变化。最近的试验,包括NRG-GY018(pembrolizumab)、RUBY(dostarlimab)、DUO-E(durvalumab)和AtTEnd(atezolizumab),证明了将ICI与化疗结合使用对子宫内膜癌患者的临床益处(14-17)。这些试验在MMRd或MSI-H肿瘤中显示出显著的效果,同时也显示出在pMMR亚组中具有统计学上显著的无进展生存期(PFS)改善。由于这些疗法具有显著的财务和毒性负担,因此迫切需要开发可靠的生物标志物来识别最有可能从ICI中受益的患者,特别是超出MSI-H状态的患者。最近的研究表明,子宫内膜癌中的免疫反应可能受到MSI-H状态以外因素的影响,包括特定的基因改变,如ARID1A和肿瘤浸润淋巴细胞特征(18-20)。然而,免疫特征、分子亚型和肿瘤表型之间的关联仍不够清楚。此外,高级别子宫内膜癌的细胞起源仍不清楚。子宫内膜上皮由纤毛细胞和分泌细胞组成,空间上分为管腔层和腺体层,在月经周期中动态变化。单细胞和空间转录组研究已经开始绘制这一图谱(21-25),但这些上皮谱系与子宫内膜癌亚型或预后的关系尚不清楚。为了填补这些空白,我们研究了基于转录组的表型分类是否能够提供关于细胞起源和免疫状态的见解。本研究旨在确定表型分层是否可以细化风险评估,并可能为治疗策略提供信息,特别是在分子特征模糊的亚型中,如NSMP和p53-abn。
材料与方法
患者和病理学审查
本研究的样本处理和分析工作流程概述见补充图S1。我们分析了81例传统上被归类为II型的肿瘤,包括非子宫内膜样肿瘤和3级子宫内膜样癌(EMG3)。病理诊断最初由每家机构的至少两名病理学家根据2020年WHO分类标准(https://tumourclassification.iarc.who.int/welcome/;参考文献6)进行。随后,一位妇科病理学家(H. Yoshida)进行了中心审查以确认组织学类型。分析的肿瘤包括16例浆液性癌、23例透明细胞癌、21例肉瘤样癌、19例EMG3以及2例其他肿瘤(包括1例小细胞癌和1例无法分类的低分化癌;补充表S1)。在透明细胞癌中,有7例肿瘤是混合型,含有子宫内膜样癌成分,2例肿瘤是混合型,含有浆液性成分。混合型癌定义为由两种或更多种不同的子宫内膜癌组织学类型组成的癌症,其中至少有一种成分是浆液性或透明细胞癌。肉瘤样癌和去分化癌不包括在这个类别中。根据WHO标准,没有应用定量优势成分阈值(例如≥50%)(6)。还分析了8例1至2级子宫内膜样癌的MSI-H肿瘤。代表性的组织学图像见补充图S2A-S2F。所有病理学家都对基因组分析结果和预后信息不知情。本研究是对存档的高级别子宫内膜癌标本(n = 81)进行的探索性分析。虽然没有进行正式的效力分析,但样本大小是根据预期的分子亚型分布确定的。先前的研究表明,在高级别子宫内膜癌中,分子亚型的相对频率大约为POLE(约10%)、MSI-H(约20%)、TP53-abn(约40%至50%)和NSMP(约20%至30%)。因此,大约80例的病例被认为足以包含每种亚型的代表性肿瘤数量,以便进行比较分析(26, 27)。所有手术标本均按照每个参与机构的标准协议进行固定,固定使用中性缓冲福尔马林(10%或20%),在收集冷冻组织样本后进行12至48小时。冷冻肿瘤样本用于基因组分析。提供福尔马林固定的石蜡包埋切片,包括代表性的肿瘤区域,用于IHC分析。每个患者的临床病理数据从医疗记录中回顾性获取。本研究遵循赫尔辛基宣言进行,并获得了千叶癌症中心伦理委员会的批准(批准编号:M04-001)。所有参与研究的患者均获得了书面知情同意,同意使用临床信息和组织样本。研究对象包括在顺天堂大学(2013-2023年)、东京大学医院(2010-2022年)或国家癌症中心医院(2012-2015年)接受手术切除的高级别子宫内膜癌患者,每个地点都获得了机构审查委员会的批准(批准编号:M09-0551、M20-0007、G0683、2022083Ge、2022-003)。还包括8例1至2级子宫内膜样癌患者。国家癌症中心医院的组织样本由国家癌症中心生物库提供。本研究是一项回顾性、非干预性分析;因此,不适用前瞻性试验注册和登记标识符。所有参与组织病理学诊断的病理学家以及进行基因组和转录组分析的分析人员都对临床结果和预后信息不知情。
全外显子测序
肿瘤组织在手术后立即收集,切成小块,并储存在-80°C直到使用。使用QIAamp Fast DNA Tissue Kit(Qiagen)从手术切除的标本中提取基因组DNA。外周血样本储存在-30°C。使用QIAamp DNA Blood Midi Kit(Qiagen)从外周血样本中提取基因组DNA。使用Twist Library Preparation EF系统(Twist Bioscience)、Twist Universal Adaptor系统和Twist Fast Hybridization Target Enrichment系统生成全外显子测序(WES)文库。简而言之,50 ng的基因组DNA被酶切成200至300 bp的片段,然后进行末端修复、A尾处理和双端索引接头连接。使用KAPA HiFi DNA聚合酶(KAPA Biosystems, Roche Diagnostics)进行预捕获扩增。使用Twist Comprehensive Exome Panel作为探针,从大约750 ng的扩增产物中富集外显子片段。使用NovaSeq6000测序仪(Illumina,RRID: SCR_016387)对样本文库进行大规模并行双端测序。
序列数据分析
使用Burrows–Wheeler Aligner(http://bio-bwa.sourceforge.net/,RRID: SCR_010910)和Bowtie 2(版本2.1.0,http://bowtie-bio.sourceforge.net/bowtie2/index.shtml,RRID: SCR_016368)将双端WES的读段比对到人类参考基因组(hg38)。使用内部调用器和公开可用的突变调用器(Genome Analysis Toolkit(https://gatk.broadinstitute.org/hc/en-us,RRID: SCR_001876)、MuTect2(版本2.7-2,https://gatk.broadinstitute.org/hc/en-us/articles/360037593851-Mutect2,RRID: SCR_026692)和VarScan 2(http://varscan.sourceforge.net/)调用体细胞(同义和非同义)突变。如果满足以下任何条件,则丢弃突变:总读数<20、肿瘤样本中的变异等位基因频率(VAF)<0.05、生殖系对照样本中的突变读数>2、突变仅存在于一个基因组链中,或变异存在于1,000 Genomes Project数据集(https://www.internationalgenome.org/,RRID: SCR_006828)或内部数据库中的正常人类基因组中。使用SnpEff(http://snpeff.sourceforge.net,RRID: SCR_005191)对基因突变进行注释。使用内部流程分析拷贝数(CN),确定log R比率(LRR)如下:(i)从1,000 Genomes Project数据库中相关正常样本的基因组中选择纯合(VAF ≤0.05或≥0.95)或杂合(VAF 0.4–0.6)的单核苷酸多态性(SNP);(ii)根据100-bp窗口两侧的G + C百分比调整选定SNP的正常和肿瘤读深度;(iii)LRR计算为log2(ti/ni),其中ni和ti分别是位置i处的正常和肿瘤调整后的深度;(iv)使用以位置i为中心的移动窗口(1 Mb)的中位数确定每个代表的LRR。使用FACETS(版本0.6.2,RRID: SCR_026264;参考文献28)确定每个基因组区域两个等位基因的CN LRR。本研究使用的变异调用策略和关键参数见补充表S2。
突变特征分析
通过SigProfilerExtractor(https://github.com/AlexandrovLab/SigProfilerExtractor,版本1.1.21,RRID: SCR_023121;参考文献29)对VAF ≥0.1且通过质量过滤的突变进行突变特征分析。为了总结结果,我们将单碱基替换(SBS)类别合并为更广泛的类别。年龄类别是通过将SBS1(age)和SBS5(age)的值相加得出的。APOBEC类别是通过将SBS2(APOBEC)和SBS13(APOBEC)的值相加得出的。类似地,POLE类别是通过将SBS10a(POLE)、SBS10b(POLE)、SBS14(POLE)和SBS20(POLD1)的值相加得出的。MMRd类别基于SBS15(MMRd)的值。SBS87按原样使用。根据Cancer Somatic Mutations Catalogue网站(https://cancer.sanger.ac.uk/signatures/,RRID: SCR_002260)上的描述,我们也将CN特征类别合并为更广泛的类别。HRD-TandemDup类别是通过将CN17[同源重组缺陷(HRD)]、CN18(未知)和CN19(未知)的值相加得到的。接下来进行了转录组测序。
使用NEBNext rRNA Depletion Kit v2(New England Biolabs)对从临床样本中提取的500 ng RNA进行了核糖体RNA耗竭处理。测序文库是使用NEBNext Ultra II RNA Library Prep Kit for Illumina(New England Biolabs)制备的,并使用NovaSeq6000测序仪(Illumina)对每个序列的两端进行了150 bp的测序。每个基因的表达水平是使用DESeq2(https://bioconductor.org/packages/release/bioc/html/DESeq2.html,版本1.48.1,RRID: SCR_015687)计算的。
表型评分的计算是通过单样本基因集富集分析(ssGSEA)来表示腺体/管腔型、纤毛型和EMT样转录程序的。基因集是从转录组簇之间的差异表达基因中得出的,并通过手动筛选进一步精炼,以选择具有强烈表达对比度和生物学相关性的代表性基因。选择基于排名的ssGSEA方法是为了提高跨样本和数据集的稳健性。我们使用GSEAPY包(https://gseapy.readthedocs.io/en/latest/,版本1.0.6,RRID: SCR_025803;参考文献30)来确定ssGSEA评分。
使用标记引物,通过聚合酶链反应(PCR)在五个微卫星位点BAT25、BAT26、NR-24和MONO-27分析了MSI。PCR产物在3730xl DNA Analyzer(Applied Biosystems,Thermo Fisher Scientific,RRID: SCR_018059)上进行电泳,并使用Peak Scanner 2软件(Applied Biosystems)进行分析。
我们从UCSC Xena提供的TCGA泛癌症数据集中获得了子宫内膜癌和子宫肉瘤的批量效应校正后的RNA测序(RNA-seq)数据(RRID: SCR_018938;参考文献31)。元数据,如组织学类型和亚型信息,是从UCSC Xena和cBioPortal(https://www.cbioportal.org/,RRID: SCR_014555)获取的。分析使用了595个样本(包括相邻的正常组织)和17,507个基因(没有缺失值),这些基因的表达数据和元数据都是可用的。
所有的IHC检测,包括p53(DO7,预稀释,Dako,Glostrup,丹麦,RRID: AB_3669092)、PMS2(EP51,预稀释,Dako/Agilent,RRID: AB_2889977)、MSH6(EP49,预稀释,Dako/Agilent,RRID: AB_2889975)、雌激素受体(ER;SP1,预稀释,Ventana/Roche,RRID: AB_2335977)、孕激素受体(PR;1E2,预稀释,Ventana/Roche,RRID: AB_2335976)和PD-L1(E1L3N,1:400,Cell Signaling Technology,RRID: AB_2687655)的检测,都是按照我们之前的研究方法进行的。p53、PMS2、MSH6和PD-L1的IHC检测是使用Link 48自动染色仪(Dako/Agilent,RRID: SCR_026889)进行的,而ER和PR的染色是使用BenchMark ULTRA平台(Ventana/Roche,RRID: SCR_025506)进行的。脱蜡后,组织切片使用上述抗体进行染色,然后用hematoxylin复染。对于PD-L1的评估,使用了E1L3N克隆,该克隆已被证明与临床验证的检测方法高度一致(32, 33),并且内部验证确认了使用结合阳性评分(CPS)≥1的一致性。病理学家根据以下标准评估所有IHC切片:对于p53染色,如果肿瘤具有强烈且弥漫性的核染色模式(>80%的癌细胞)或完全没有癌细胞的染色模式(空模式),则认为其p53染色模式异常,表明存在TP53改变。相邻的非肿瘤细胞的染色作为内部阳性对照。染色模式弱或异质的肿瘤被认为是具有野生型TP53。此外,亚克隆突变p53的免疫染色定义为野生型模式和一个或多个突变模式的组合,每种模式至少存在于5%的肿瘤细胞中(34)。因为据报道IHC检测pMS2和MSH6可以替代四抗体组合(MLH1、MSH2、MSH6和PMS2)进行MMRd筛查(35),所以在这项研究中,MMRd状态定义为PMS2或MSH6蛋白的核染色完全丧失。内部阳性对照包括相邻的正常黏膜、间质细胞和炎症细胞。
为了预后分析,ER根据ESGO/ESTRO/ESP指南使用10%的临界值进行二分类(阴性,<10% vs. 阳性,≥10%)。CD8+ T细胞的使用HALO软件(Indica Lab,RRID: SCR_018350)进行分析。感兴趣的区域由一位经过认证的病理学家(S. Sakashita)手动注释,包括活肿瘤区域,并排除了坏死、出血、伪影和组织折叠。细胞分割是使用HALO Multiplex IHC v3.4.9模块和基于hematoxylin的核检测及分水岭分离方法进行的。阳性阈值是通过OD直方图检查来定义的,以匹配视觉解释。阈值在所有切片上统一应用。所有结果都经过视觉审查,以确认适当的分割和阈值设置。测量了该区域内CD8+ T细胞的数量及其面积,并计算了单位面积内的CD8+ T细胞数量。PD-L1的表达是通过计算CPS(36)来评估的。CPS是通过将PD-L1阳性细胞的数量(包括活肿瘤细胞、淋巴细胞和巨噬细胞)除以活肿瘤细胞的总数再乘以100来计算的。代表性的IHC染色结果显示在补充图S3A–S3J中。本研究中的所有IHC评分都是由一位具有妇科病理学专长的经过认证的病理学家(H. Yoshida)进行的。IHC是在福尔马林固定、石蜡包埋(FFPE)的诊断样本上进行的,每个病例只进行一次自动化染色。由于通过验证的预分析程序和内部及外部控制确保了检测的稳健性,因此没有生成技术重复样本,这与标准临床病理实践一致。
(i)基因组学和(ii)病理学的分子亚型定义:
(i)基因组学:肿瘤根据以下四个分子亚型进行分类。POLE超突变亚型是由位于POLE基因外切酶结构域内的已知会损害外切酶活性的致病突变(如P286R、S297Y、V411L、L424I和S459F;https://www.oncokb.org/)的存在来定义的(37)。MSI-H亚型被分配给具有高MSI状态和/或高MSI评分的肿瘤,但没有POLE热点突变。TP53突变(TP53-mut)亚型包括具有致病TP53突变的肿瘤(或作为TP53负调节因子的MDM2扩增),在排除了POLE和MSI-H病例后。不符合上述三种亚型任何标准的肿瘤被分类为NSMP。由于我们将数据与TCGA数据集进行了比较,我们主要依赖于WES数据进行分子分类,同时也在我们的队列中进行了IHC检测。
(ii)病理学(基于IHC):POLE超突变亚型的定义与(i)中的相同。MMRd是通过IHC检测PMS2或MSH6表达的丧失来定义的(35)。p53-abn亚型是由异常的p53 IHC染色模式定义的。不符合这些类别标准的肿瘤被分类为NSMP。
统计分析是使用Python(版本3.11.4,RRID: SCR_008394)和SciPy(版本1.11.1,RRID: SCR_008058)进行的。定量变量在组间比较时使用了非参数Wilcoxon秩和检验或单因素方差分析(ANOVA),必要时进行了Tukey事后检验,这些比较的P值<0.05被认为具有统计学意义。对于基于基因集水平的基因表达分析,包括GSEA和ssGSEA,使用了相应的分析包中实现的假发现率控制进行多重比较校正。统计分析是探索性的,报告了确切的P值;名义P值<0.05被用作解释的参考阈值。变量之间的相关性使用Spearman相关系数进行评估。由于这项研究是作为回顾性观察性分析进行的,因此不适用随机化和前瞻性分组。
基于外显子组测序结果对高级别子宫内膜癌进行分类
我们对81个肿瘤进行了外显子组测序(肿瘤-正常配对),以检测基因组突变,包括非子宫内膜样肿瘤和EMG3s(图1A–C;补充图S4;补充描述;补充表S3)。临床病理特征在补充表S4中进行了总结。总体突变谱与之前的研究(2, 10, 38, 39)相当吻合。然而,我们也观察到与TCGA数据集相比的突变频率差异,特别是POLE突变在外切酶结构域内的频率更高,而CTNNB1突变的频率较低(图1B)。这些差异可能反映了病理特征的差异,即仅包括了高级别子宫内膜癌。它们也可能受到潜在种族或民族背景的影响。此外,我们还进行了突变特征、染色体CN和CN特征分析(图1A)。图1。查看大图下载幻灯片。
外显子组测序揭示了高级别子宫内膜癌的基因组图谱。A,条形图显示了突变数量和特征比例。顶部显示了每个兆碱基的突变数量。中间显示了不同突变特征的相对贡献。底部两个条形图显示了具有CN丢失或增加的基因组区域长度以及不同CN特征的相对贡献。B,每个样本的遗传和临床特征总结。每一列对应一个样本。每一行对应一个不同的遗传或临床特征或基因突变状态。C,条形图显示了按亚型划分的特定基因突变的频率。左侧显示了按组织学分类的各种基因的突变频率。右侧显示了按分子亚型划分的突变频率。APOBEC,载脂蛋白B mRNA编辑酶,催化多肽;clear-S,透明细胞癌与浆液癌混合;CS,肉瘤;EM,子宫内膜样;G1/G2,1–2级子宫内膜样;MSS,微卫星稳定;VUS,意义不明的变异。
基于(i)基因组数据和(ii)IHC数据的分子亚型分类
肿瘤根据基因组数据被分为四个分子亚型,包括POLE、MSI-H、TP53-mut和NSMP,并通过IHC结果进行了验证,如图2A所示。选择这种方法是为了确保临床相关性和与TCGA衍生框架的一致性,同时解决了在肿瘤含量低的样本中基于CN的分类敏感性有限的问题。从基因组学角度来看,12个(14.8%)被分类为POLE,14个(17.3%)为MSI-H,35个(43.2%)为TP53-mut,其中包括34个具有TP53突变和1个具有MDM2扩增的肿瘤,以及20个(24.7%)为NSMP(图2A)。从病理学角度来看,12个(14.8%)被分类为POLE,14个(17.3%)为MMRd,41个(50.6%)为p53-abn,14个(17.3%)为NSMP。图2。查看大图下载幻灯片。
组织学分类与分子亚型之间的关系。A,确定分子亚型的工作流程。B,条形图显示了不同组织学分类中的分子亚型分布。条形图上方的数字表示每个类别中的患者数量。C,根据组织学亚型计算的PFS的Kaplan–Meier曲线。D,根据分子亚型计算的PFS的Kaplan–Meier曲线。E,根据ER表达计算的PFS的Kaplan–Meier曲线。P值是使用log-rank检验计算的。每个图表下方显示了风险数字。EM,子宫内膜样。
在非POLE/非MSI-H病例中,观察到8例(14.5%)的TP53突变状态与p53 IHC结果不一致。此外,在55例中还发现了基于CN的分类与TP53/p53状态之间的差异(29.1%;补充表S5;图2A)。这种不一致性似乎是高级别子宫内膜癌的特征性表现,在这类癌症中,染色体不稳定性和复杂的等位基因构型非常常见。详细的病例级分析(补充表S5–S8;补充描述)表明,这种差异与技术和生物学因素有关,包括:(i)WES检测中遗漏的TP53突变(例如,大片段缺失、其他结构改变或被严格过滤排除的变异);(ii)由于用于测序的样本(新鲜冷冻样本)与用于免疫染色的样本(FFPE)不同而产生的空间异质性;(iii)与TP53缺失无关或低于预定义的CN-H阈值的染色体不稳定性(补充描述)。这些发现强调了需要改进非POLE/非MSI-H高级别子宫内膜癌的分层策略。在后续分析中,TP53突变状态被用作操作性分层轴,以研究高级别子宫内膜癌的组织学、表型和基因型特征之间的关系。
我们研究了高级别子宫内膜癌中不同组织学类型之间的分子亚型分布(图2B)。正如预期的那样,TP53突变在浆液性癌中较为常见(14/18,78%),而MSI-H/MMRd和POLE亚型在子宫内膜样癌中最为普遍,包括那些具有混合组织学的癌症(例如,含有透明细胞成分的癌症)。透明细胞癌和癌肉瘤则分布在多个分子亚型中,特别是TP53突变型和NSMP型(图2B)。研究表明,在高级别子宫内膜癌中,组织学分类和分子亚型并不总是相符的。这种差异引发了一些重要的临床问题,例如:尽管具有相同的基因型,TP53突变型癌肉瘤和浆液性癌在临床和生物学上有什么差异?哪些因素决定了它们不同的组织学表型?
生存分析显示,虽然组织学亚型之间存在预后差异,尤其是癌肉瘤的预后较差,但分子分类提供了更清晰的分层(图2C和D)。POLE和MSI-H肿瘤的预后较好,而NSMP型的预后与TP53突变型相似。最近的研究报告指出,NSMP型内的预后根据ER状态而有所不同(27, 40)。我们将NSMP肿瘤分为ER阳性和ER阴性两组进行生存分析。在这个仅限于高级别癌症的队列中,两组之间没有观察到显著的预后差异(P = 0.70,图2E),甚至ER阳性的NSMP病例的预后也与TP53突变型肿瘤相当差。这表明,尽管ER分层在更广泛的队列中非常有效,能够区分低风险(通常是低级别)和高风险肿瘤,但在以组织学侵袭性为主的高级别癌症环境中,其预后预测价值可能会减弱。鉴于TP53突变型和NSMP型的预后相似,我们进一步研究了拷贝数改变(CNA)以区分这些亚型。TP53突变型的CNA比NSMP型更广泛(TP53突变型的CNA区域中位数长度为2.12 Gbp,NSMP型为844 Mbp),并且CCNE1、ERBB2和FGFR1等基因的扩增较为频繁,HRD相关的CNA特征CN18的阳性率也更高(图1B和3A–C)。相比之下,BRCA1/2缺陷相关的CNA特征CN17较为罕见,相应的突变特征SBS3也不存在;相反,在TP53突变型和NSMP亚型中,AGE、APOBEC或SBS87特征更为常见(图1A和3C)。尽管在整个队列中,CNA负担与较差的预后相关(图3D),但这种效应主要是由于POLE和MSI-H类型的包含所致,这些类型的CNA较少。在TP53突变型和NSMP类型内部,基于CNA的分类(CN-H vs. CN-L)未能有效分层预后(图3E),表明其在高级别子宫内膜癌中的预测效用有限。这些发现突显了当前分子分类器在高级别子宫内膜癌中的预测能力有限,特别是对于NSMP型,进一步的分层以及对生物学特征的深入理解是必要的。
为了识别高级别子宫内膜癌中超出分子和组织病理学分类的临床相关特征,我们进行了转录组分析。我们选择了5,000个在样本间表达水平高且变异显著的基因进行聚类。主成分分析显示,EMG3s、癌肉瘤和透明细胞癌的聚类较为松散,而浆液性癌的聚类模式更为分散(图4A)。为了提高聚类分辨率,我们使用了t分布随机邻域嵌入(t-SNE),结果显示出一个正常组织簇和三个转录定义的肿瘤簇(图4B)。
为了进一步表征这些簇的细胞特性,我们分析了它们的基因表达谱。簇1表现出与腺体/腔道子宫内膜细胞相关的基因表达升高,如WNT7A、HNF1B和FOSL2(图4C)。簇2富集了纤毛细胞标记物,包括RFX3和TPPP3的表达,以及ESR1(编码ER)和PGR(编码PR)(图4C)。簇3显示Hedgehog通路基因(GLI1和GLI2)、催乳素(PRL)和间充质标记物(TWIST1、ZEB1和CDH2)的高表达,这与癌肉瘤的表型一致(补充图S5)。为了探索这些簇的生物学相关性,我们进行了GSEA分析。簇3显示出基底样或干细胞样的特征富集,以及TGFβ通路的激活,这与EMT和肉瘤样表型一致(图4D;补充表S9)。相比之下,簇1显示出TNF和NF-κB通路活性的富集(图4E;补充表S9),表明具有促炎状态和增强了对免疫检查点(ICIs)的反应性。为了概括这些表型,我们定义了代表腺体/腔道、纤毛和EMT样特征的基因特征,并计算了ssGSEA分数(补充表S10)。这些表型分数与转录组簇很好地对齐,并且也与组织学分类相关(图4F和G)。透明细胞癌主要表现出强烈的腺体/腔道特征,而EMG3s则富集了纤毛特征。转录组表型重新连接了组织学特征,并细化了分子分类。
接下来,我们研究了这些鉴定出的转录组表型的临床和免疫学意义。这三个簇在分子和组织学亚型上的分布部分一致。簇2主要包含POLE和MSI-H肿瘤,而簇3富集了TP53突变型和NSMP肿瘤(图5A)。NSMP肿瘤分布在所有三个簇中,表明这个分子组内部存在异质性。
在高级别子宫内膜癌中,我们将转录组表型与分子和组织学分类进行了整合。t-SNE图显示了样本在不同分子亚型中的分布。t-SNE图还显示了样本在不同组织学类型中的分布。每种比较的ANOVA P值和Tukey事后分析结果已提供。簇3显示出基底样或干细胞样的特征富集,以及TGFβ通路的激活,这与EMT和肉瘤样表型一致(图4D;补充表S9)。相比之下,簇1显示出TNF和NF-κB通路活性的富集(图4E;补充表S9),表明具有促炎状态和对ICIs的增强反应性。我们将转录组表型与分子和组织学分类进行了整合。t-SNE图显示了样本在不同分子亚型中的分布。t-SNE图还显示了样本在不同组织学类型中的分布。每种比较的ANOVA P值和Tukey事后分析结果已提供。每种比较的ANOVA P值和Tukey事后分析结果已提供。簇3显示出基底样或干细胞样的特征富集,以及TGFβ通路的激活,这与EMT和肉瘤样表型一致(图4D;补充表S9)。这些结果突显了基于转录组的分类在高级别子宫内膜癌中的额外分辨率,并支持其潜在的临床相关性。基于转录组表型的分类揭示了不同的免疫学和临床特征。
有趣的是,MSI-H肿瘤分布在所有转录组簇中(图5A),这表明仅凭MSI状态可能无法完全捕捉免疫反应或ICIs敏感性的异质性。为了进一步探索不同簇之间的免疫学特征,我们评估了免疫表型,包括CD8+ T细胞的浸润和PD-L1的表达。正如预期的那样,MSI-H肿瘤的CD8+ T细胞浸润程度高于MSS肿瘤(图6A)。然而,簇1与簇2/3之间的CD8+细胞浸润没有显著差异,总体上不同组织学亚型之间也没有显著差异(图6B)。通过IHC观察到的PD-L1表达模式与CD8+细胞浸润密切相关,这在部分簇1肿瘤中尤为明显,无论其MSI状态如何(图6C)。这可能反映了抗原呈递的增强,因为HLA-A和HLA-B的表达水平在簇1中显著高于簇2和3(图6D),并且这两个基因都与腺体/腔面评分呈正相关(图6E),表明上皮表型与免疫激活之间存在联系。在排除了POLE/MSI-H类型后,我们重复了这些分析,并确认HLA-A和HLA-B的表达在簇1中仍然高于簇2和3,并且与腺体/腔面评分保持正相关,表明簇1与免疫激活之间的关联并非由POLE/MSI-H状态驱动(补充图S8A–S8H)。这些趋势在TCGA数据集中也得到了证实(补充图S9A和S9B)。总体而言,MSI状态仍然是T细胞浸润的主要驱动因素,但簇1状态是PD-L1表达以及HLA-A和HLA-B的主要标志物。图6。
在高分级子宫内膜癌的转录组簇中,分子、免疫和临床特征存在差异。A、箱形图显示了MSS和MSI-H样本中CD8+ T细胞的密度。B、箱形图显示了不同组织学亚型和RNA簇中CD8+ T细胞的密度。C、箱形图显示了不同组织学亚型和RNA簇中PD-L1的染色情况。D、箱形图显示了不同RNA簇中HLA-A和HLA-B的表达情况。E、散点图显示了腺体/腔面评分与HLA-A和HLA-B表达之间的相关性。Spearman等级相关系数和P值已标出。F、根据RNA簇的PFS的Kaplan–Meier曲线。G、根据RNA簇的TP53突变患者和NSMP患者的PFS的Kaplan–Meier曲线。P值使用对数秩检验计算得出。H、根据RNA簇的浆液性和透明细胞癌患者的PFS的Kaplan–Meier曲线。P值使用对数秩检验计算得出。I、箱形图显示了TCGA数据集中RNA簇中表型评分的分布。J、箱形图显示了TCGA数据集中不同组织学亚型中表型评分的分布。K、TCGA数据集中MSI-H、TP53突变和NSML患者的PFS的Kaplan–Meier曲线。L、根据RNA簇分层的TCGA数据集中相同患者组的PFS的Kaplan–Meier曲线。NC、标准化计数。
最后,我们检查了不同簇之间的无进展生存期(PFS)。簇3的特征是具有EMT样的转录组特征,并且富含肉瘤样癌,其PFS显著短于簇1和簇2(图6F)。值得注意的是,即使在NSMP和TP53突变类型中,簇3的PFS也显著较差(图6G),这表明转录组分型可以提供额外的信息,补充基于基因组的分子亚型分类。当仅限于TP53突变亚型时,也观察到了较差的PFS(补充图S10)。然而,当排除肉瘤样癌病例后,不同簇之间的PFS没有统计学上的显著差异,表明簇3的预后影响主要受组织学组成的影响。一项仅限于浆液性和透明细胞癌的探索性分析显示簇3的PFS倾向较差,但由于样本量有限,这一趋势没有达到统计学显著性(图6H)。在TCGA数据集中也重现了这种转录组聚类(补充图S6A–S6E和S7),ssGSEA评分确认了病例与三种转录组表型的匹配(图6I和J)。排除1/2级子宫内膜癌后的PFS分析显示了NSMP和TP53突变肿瘤之间的分离,这与一般概念一致,但与我们的队列结果相反(图6K)。尽管如此,它仍然显示簇3的结果最差(图6L),支持了转录组分型的可重复性及其与临床结果模式的关联。然而,由于TCGA中分配到该簇的非肉瘤样癌病例数量较少,因此无法独立于组织学评估簇3的预后相关性。总体而言,这些发现表明,尽管簇3捕获的EMT样转录特征与肉瘤样癌密切相关,但它们可以通过捕获与侵袭性临床行为相关的转录程序来补充基于基因组的分子亚型。
在这项研究中,我们整合了对高分级子宫内膜癌的基因组学、组织病理学和IHC分析,揭示了分类的模糊性,特别是TP53突变状态、p53 IHC和基于CN的分类之间的不一致性。由于原始TCGA框架来源于包括低分级和高分级肿瘤的队列,因此在ProMisE中,CN-high病例大多被等同于p53-abn状态;然而,我们仅考虑高分级子宫内膜癌的分析表明,当仅考虑高分级子宫内膜癌时,这种等同性并不总是成立。此外,通过结合转录组表型和已建立的分子框架,我们的发现突出了当前分子亚型无法完全捕捉到的表型异质性。分子亚型分析证实了预期的关联(2, 11, 39, 41–44),例如TP53突变肿瘤在浆液性癌中的优势以及POLE突变在高分级子宫内膜癌中的富集。TP53突变肿瘤的特点是广泛的染色体拷贝数异常(CNA)、频繁的CCNE1扩增以及HRD相关CNA特征CN18的高流行率。相比之下,通常与BRCA1/2缺陷的同源重组修复相关的CNA特征CN17和突变特征SBS3几乎不存在,这与先前的报告一致,即子宫内膜癌中SBS3的流行率较低(45, 46)。这些发现表明,TP53突变肿瘤中观察到的HRD样CNA模式可能是通过独立于BRCA1/2丢失的机制产生的,不同于卵巢癌和乳腺癌中观察到的典型HRD(47, 48)。CCNE1扩频的高频率和BRCA1/2突变的低频率进一步支持了高分级子宫内膜癌中HRD的高流行率(49, 50)。值得注意的是,在我们的队列中,通常被视为中等风险的NSMP肿瘤在高分级环境中表现出较差的临床结果,与TP53突变肿瘤相当。此外,CN-H状态未能在TP53突变和NSMP组合组中区分预后,两者在高分级子宫内膜癌中显示出相似的较差结果,突显了需要新的分层方法。转录组分析确定了三种具有不同生物学特征的表型。簇1是一种免疫反应性的腺体/腔面表型,表现出HLA表达升高和TNF/NF-κB信号通路的激活,反映了保留的抗原呈递能力,类似于分化良好的腺上皮。簇2是一种纤毛表型,表现出ER/PR活性、纤毛细胞标记物和较低的炎症激活,与终末分化的纤毛上皮群体相似。簇3是一种EMT样表型,表现出高EMT和干性特征、低免疫活性以及免疫抑制的特征,与侵袭性生物学特性和潜在的免疫检查点抑制剂(ICI)抗性一致。这些表型与子宫内膜单细胞分化轨迹一致,为理解肿瘤异质性提供了基于生物学的框架。虽然MSI-H/dMMR状态目前是ICI适用性的主要生物标志物,但其中一部分肿瘤在临床上没有反应。在胃肠道肿瘤中的转录组分析显示,非反应者通常具有上调的EMT信号通路(53),表明簇3表型可能潜在地解释了ICI抗性,即使在MSI-H/dMMR子宫内膜癌中也是如此。相反,较高的HLA-A和HLA-B表达与其他癌症中的抗原呈递、增加的T细胞浸润和良好的预后相关(54–56),更一般地,HLA-I表达的增加与TIL密度的增加和对ICI的治疗反应相关(57)。这些观察结果与我们最近在宫颈癌中的发现一致,其中HLA-I的高表达与CD8+ T细胞的增加浸润相关(58)。因此,属于簇1的浆液性或透明细胞肿瘤可能代表了一组具有相对有利免疫反应性的亚群。我们的队列是在基于ICI的方案广泛采用之前收集的,但未来的研究应评估转录组表型、ICI反应性和分子亚型之间的关系,以改进治疗分层。在高分级子宫内膜癌中,簇1和簇2的PFS都优于簇3。即使在排除了POLE突变和MSI-H肿瘤后,这种预后分离在高分级子宫内膜癌中仍然存在,表明TP53突变和NSMP类型的预后相似较差。这与之前的报告相反,包括那些包含低分级子宫内膜癌的报告,其中NSMP通常被认为是一个低风险组(2, 4, 61)。尽管在这个队列中观察到了簇之间的预后差异,但这些关联受到组织学组成的强烈影响,特别是肉瘤样癌,因此应谨慎解释。将转录组信息与分子亚型相结合可能为非POLE/non–MSI-H肿瘤中的表型差异提供背景信息,需要在更明确的组织学亚群中进行进一步研究。我们的研究有几个局限性。首先,缺乏接受基于ICI治疗方案的患者,限制了直接评估临床反应的能力。目前,基于ICI的方案的预测生物标志物,如lenvatinib–pembrolizumab或化疗±PARP抑制剂与ICI的组合,主要是根据MMR状态确定的。转录组分类是否可以进一步改进ICI反应性的预测仍有待在临床环境中进行评估。其次,队列的大小和组成是为了捕捉组织病理学和分子多样性而优化的,而不是为了反映高分级子宫内膜癌的真实世界分布,目前还没有建立一种在个体患者水平上分配转录组簇的实用方法。开发简化的、临床适用的方法来确定分子和转录组亚型对于将其转化为常规实践至关重要。最后,仅基于细胞标记物表达无法明确细胞起源;包括各种子宫内膜细胞类型的肿瘤和正常上皮细胞的甲基组分析将有助于澄清谱系关系。总之,我们的研究突出了高分级子宫内膜癌分子分类中的固有挑战,特别是在非POLE/non–MSI-H肿瘤中,这些挑战目前尚未得到解决。同时,基于RNA的聚类通过将组织学相关的异质性与现有的分子亚型相结合,提供了额外的生物学见解。
原始测序数据存储在日本基因型-表型档案库中,由日本DNA数据库托管(RRID: SCR_003118;参考文献62),访问号为JGAS000753/JGAD000894(https://humandbs.dbcls.jp/en/hum0422-v1)。本研究生成的其他数据可向通讯作者请求获得。作者披露
M. Kawazu在研究期间获得了日本医学研究开发机构的科学研究资助、千叶县研究资助、武田科学基金会、Takamatsu公主癌症研究基金、Uehara纪念基金会、NOVARTIS基金会(日本)、Kobayashi癌症研究基金会和Kashiwado纪念基金会的资助;在提交的工作之外,他还获得了Pacific Biosciences的个人费用。S. Inoue在研究期间获得了Takamatsu公主癌症研究基金、Novartis基金会、Kondou纪念基金会、Toyoaki奖学金基金会和Hirose基金会的资助。S. Sakashita在提交的工作之外,还获得了Jellox Biotech和Sakura Fintek Japan的资助。K.尾田报告了来自柯尼卡美能达的资助、来自阿斯利康公司的资助和个人费用,以及来自中外制药和GenMine Labs的个人费用(这些都与提交的工作无关)。其他作者没有报告任何利益冲突情况。
作者贡献:
川津正(M. Kawazu):概念化、数据整理、形式分析、指导、资金获取、验证、研究、可视化、方法论设计、初稿撰写、项目管理、审稿与编辑。
田口昭(A. Taguchi):概念化、资源准备、形式分析、研究、初稿撰写、审稿与编辑。
吉田英(E. Yoshida):概念化、资源准备、形式分析、审稿与编辑。
吉田宏(H. Yoshida):形式分析、研究、审稿与编辑。
宇野正(M. Uno):资源准备、研究、审稿与编辑。
井上胜(S. Inoue):概念化、形式分析、研究、审稿与编辑。
山本阳(Y. Yamamoto):形式分析、研究、审稿与编辑。
坂下胜(S. Sakashita):形式分析、研究、审稿与编辑。
上野彻(T. Ueno):形式分析、研究、审稿与编辑。
中村阳(Y. Nakamura):研究、审稿与编辑。
林杰(J. Lin):研究、审稿与编辑。
小岛胜(S. Kojima):形式分析、研究、审稿与编辑。
川濑康(K. Kawase):研究、审稿与编辑。
石坂昭(A. Ishizaka):资源准备、研究、审稿与编辑。
宫田胜(S. Miyata):研究、审稿与编辑。
小岛真(M. Kojima):资源准备、指导、研究、审稿与编辑。
池村正(M. Ikemura):形式分析、研究、审稿与编辑。
曽根康(K. Sone):资源准备、指导、研究、审稿与编辑。
石川昌(M. Ishikawa):资源准备、研究、审稿与编辑。
加藤哲(T. Kato):资源准备、指导、研究、审稿与编辑。
间野宏(H. Mano):指导、资金获取、研究、审稿与编辑。
寺尾阳(Y. Terao):资源准备、指导、审稿与编辑。
尾田康(K. Oda):资源准备、形式分析、指导、初稿撰写、项目管理、审稿与编辑。
致谢:
我们感谢杉谷沙织(Saori Sugaya)、武山丽奈(Reina Takeyama)和樱井纪子(Noriko Sakurai)提供的技术支持。国家癌症中心生物库的运作得到了日本国家癌症中心研究与发展基金的支持。作者们使用了生成式人工智能工具来辅助语言编辑、文本翻译成英文以及手稿部分内容的撰写。作者们对内容进行了必要的审阅和编辑,并对最终稿件的质量负全责。本研究得到了以下机构的资助:科学研究资助项目[21H02772(川津正)、22K09566(田口昭)、21K15072(林杰)、24K02584(尾田康);日本医学研究与发展机构(AMED)的资助[JP21cm0106502(川津正)、JP22ck0106723(川津正)、JP22ck0106724(川津正)、JP23ama221528(川津正)、JP22zf0127009(间野宏)、JP22wm0325014(田口昭)、JP23wm0325057(田口昭);千叶县研究基金(川津正);今井清一纪念基金会研究基金(田口昭);大正生命社会福利基金会(林杰);武田科学基金会(川津正);高松公主癌症研究基金(川津正和井上胜);上原纪念基金会(川津正);诺华基金会(日本)的科学研究促进资助(川津正和井上胜);小林癌症研究基金会(川津正);柏田纪念基金会(川津正);近藤纪念医学基金会(井上胜);东阳学园奖学金基金会(井上胜);广濑基金会(井上胜)。本文的补充数据可在《Cancer Research Communications Online》(https://aacrjournals.org/cancerrescommun/)上查阅。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号