《Cancer Research》:Integrative Multiomic Classification Reveals Distinct Origins and Evolutionary Trajectories of Thymic Epithelial Tumors
Open Access
编辑推荐:
本研究针对胸腺瘤(TET)组织病理学分类重复性低、缺乏明确驱动事件的难题,整合基因组、转录组及单细胞数据,将TET分为GTF2I突变型、拷贝数改变型(CN型)胸腺瘤和胸腺癌三亚型,揭示各亚型细胞起源(胸腺上皮祖细胞、分化TEC、簇状细胞)及演化路径,发现CN型特异性激活IRS4并通过PI3K/AKT通路致癌,为精准分型与靶向治疗提供依据。
在癌症研究领域,胸腺瘤(TET)这类起源于胸腺上皮细胞(TEC)的罕见肿瘤,长期以来让临床医生和研究者颇为头疼。传统上依赖组织形态学的WHO分类,不仅观察者间重复性差,还难以准确预测临床行为——同样是胸腺瘤,有的生长缓慢,有的却容易复发转移。更棘手的是,超过60%的B型胸腺瘤缺乏明确的驱动基因突变,被称为“驱动阴性”肿瘤,其分子机制一直是谜团。与此同时,胸腺瘤的细胞起源也存在争议:正常胸腺发育中,皮质胸腺上皮细胞(cTEC)、髓质胸腺上皮细胞(mTEC)和胸腺上皮祖细胞(TEP)等多种细胞类型,究竟哪一种是肿瘤的“源头”?这些问题的解决,迫切需要超越传统病理的分子层面探索。
为此,来自韩国首尔国立大学医院(SNUH)和韩国科学技术院(KAIST)的研究团队,开展了一项整合基因组、转录组和单细胞转录组的大规模研究。他们分析了137例TET样本(124例胸腺瘤、13例胸腺癌),包括20例新测序样本和117例TCGA公共数据,结合小鼠胸腺发育的单细胞图谱,首次系统揭示了TET的三个分子亚型及其细胞起源、演化轨迹,并发现CN型胸腺瘤的关键驱动基因IRS4。这项研究为胸腺瘤的精准分类和靶向治疗提供了全新视角,成果发表在《Cancer Research》。
研究主要采用以下关键技术方法:整合20例新测序(WES、RNA-seq)与117例TCGA数据,结合小鼠胸腺发育单细胞转录组(涵盖胚胎期至成年);通过UMAP降维和RNA velocity分析TEC发育轨迹;利用加权皮尔逊相关系数和单类逻辑回归模型匹配肿瘤与正常细胞转录组;采用STAR+RSEM处理RNA-seq数据,GSVA计算通路评分;通过WGS和期望最大化算法推断拷贝数扩增时序;基于HEK293T细胞的过表达实验验证IRS4功能;回顾TCGA队列组织切片评估浆细胞浸润。
突变景观定义TET分子亚型
通过对137例TET的基因组分析,研究发现GTF2I突变型胸腺瘤(71例,57.3%)几乎均为A/AB型,携带GTF2IL404H热点突变,常伴HRAS激活突变,基因组呈二倍体,无拷贝数改变;CN型胸腺瘤(23例)多为B型,缺乏GTF2I/HRAS突变,却频繁出现1q、7号染色体扩增及6、13号染色体缺失等臂水平拷贝数改变;胸腺癌(13例)无GTF2I/HRAS突变,反而富集CYLD失活突变和APOBEC相关突变特征,突变负荷显著高于胸腺瘤(中位1.1/Mb vs 0.4/Mb)。临床关联显示,CN型胸腺瘤更易进展为高Masaoka分期,无复发生存率显著差于GTF2I型(P=0.002)。
TET的转录身份
结合小鼠胸腺单细胞图谱(3481个TEC细胞,分为15种类型),研究发现GTF2I型胸腺瘤转录组与胸腺上皮祖细胞(TEP)高度相似,CN型则与分化后的cTEC/mTEC接近,胸腺癌则富集簇状细胞(tuft cell)和终末mTEC特征。通过单类线性模型计算的“祖细胞指数”“簇状细胞指数”进一步验证了这一分布:GTF2I型祖细胞指数最高(P=4.6e-13),胸腺癌簇状细胞指数最高(P=2.9e-7)。
TET亚型的独特转录通路
无监督聚类显示,137例TET的转录组完美对应三个基因组亚型。基因集富集分析发现,GTF2I型胸腺瘤高表达脂肪酸摄取和β-氧化相关基因(脂质分解代谢),CN型则激活氧化磷酸化和从头脂肪生成通路(能量产生与脂质合成);胸腺癌富集抗肿瘤免疫反应相关基因。单细胞公共数据验证也支持这一结果:CN型对应高拷贝数改变的亚群,GTF2I型对应低拷贝数亚群。
CN型胸腺瘤染色体扩增发生早
通过分析CN型胸腺瘤的拷贝数扩增时序,研究发现其染色体扩增是逐步获得的,而非全基因组复制。例如,同一患者(SNU_19_C)的1q扩增早于8q扩增(P=3.9e-8)。基于胸腺瘤时钟样突变率(6.12碱基替换/年/Gbp),估算最早扩增事件发生在出生后1年内,最晚则在33岁左右,提示CN型胸腺瘤起源于生命早期,通过缓慢积累拷贝数改变演化。
IRS4转录激活是CN型胸腺瘤的推定致癌驱动
比较GTF2I型与CN型胸腺瘤的转录组,发现IRS4在91.3%的CN型胸腺瘤中特异性高表达(TPM中位数显著高于其他亚型,P<2.2e-16),而在GTF2I型和胸腺癌中沉默。功能实验显示,HEK293T细胞过表达IRS4后,AKT和磷酸化AKT(pAKT)水平升高,细胞增殖加快,且对IGF1R抑制剂OSI-906的敏感性降低。临床数据显示,IRS4高表达的CN型胸腺瘤无复发生存率更差(P=0.012)。
研究结论与讨论
这项研究首次通过多组学整合,将TET清晰划分为三个具有明确细胞起源和分子特征的亚型:GTF2I突变型(起源于胸腺上皮祖细胞,二倍体基因组)、CN型(起源于分化TEC,早期获得拷贝数改变,IRS4驱动)、胸腺癌(起源于簇状细胞,高突变负荷)。这一分类不仅解决了传统病理分类的局限性,更揭示了各亚型的演化规律——CN型胸腺瘤起源于生命早期,通过缓慢积累拷贝数改变逐步发展,而GTF2I型可能源于祖细胞分化受阻。
尤为重要的是,研究发现了CN型胸腺瘤的特异性驱动事件:IRS4转录激活。IRS4作为胰岛素受体底物,通过持续激活PI3K/AKT通路促进肿瘤增殖,且其高表达与不良预后相关。这为CN型胸腺瘤的靶向治疗提供了潜在靶点——抑制IGF1R/PI3K/AKT轴可能成为有效策略。
此外,研究建立的“转录组-单细胞图谱匹配”“拷贝数扩增时序推断”等方法,为其他罕见肿瘤的分子分型提供了范式。尽管样本量中胸腺癌较少(13例),但研究仍首次系统描绘了其分子特征,为后续研究奠定基础。
总之,这项工作不仅深化了对胸腺瘤发生发展的理解,更推动了从“形态学分型”到“分子驱动分型”的转变,为精准医疗时代的胸腺瘤诊疗提供了关键理论依据。