《Frontiers in Genetics》:Identification and validation of a seven-gene metastasis-associated prognostic model in breast cancer
编辑推荐:
摘要
引言:转移是乳腺癌患者死亡的主要原因。本研究旨在基于转移及癌症相关差异表达基因(M-CA-DEGs)开发预后特征,并识别潜在的新型治疗基因。材料与方法:数据来自TCGA-BRCA、AURORA US Network、SCAN-B和GEO数据库。通过单因素
摘要
引言:转移是乳腺癌患者死亡的主要原因。本研究旨在基于转移及癌症相关差异表达基因(M-CA-DEGs)开发预后特征,并识别潜在的新型治疗基因。材料与方法:数据来自TCGA-BRCA、AURORA US Network、SCAN-B和GEO数据库。通过单因素Cox和LASSO回归分析鉴定M-CA-DEGs并构建预后风险模型,利用校准曲线和决策曲线分析(DCA)验证预后价值,随后验证独立预后因子。通过基因集富集分析(GSEA)和单样本基因集富集分析(ssGSEA)评估功能富集,比较风险组间的免疫浸润和突变谱,构建转录因子(TF)–mRNA调控网络,进行单细胞分析表征基因表达模式,并在MCF-10A乳腺上皮细胞系和乳腺癌细胞系中检测预后基因的mRNA水平。结果:研究人员开发并验证了新型七基因转移相关预后特征(IGJ、CXCL14、PTGER3、RTN1、EGOT、TLR10、PANX2)。风险评分被证实为强有力的独立预后因子。低风险组表现出更优的生存、免疫“热”表型(活化CD8+T细胞富集)及更高的免疫活性,而高风险组则显示T细胞排斥及激酶信号和代谢通路富集。体细胞突变景观在组间存在显著差异。关键的是,研究人员识别出两个先前未被充分表征的基因(RTN1和TLR10)作为肿瘤进展的新型驱动因子。单细胞转录组学揭示了其细胞类型特异性表达模式,体外实验证实了癌细胞系中的差异表达。结论:本研究建立了稳健、生物学基础明确的乳腺癌转移相关七基因预后模型。除预测外,工作还确定了两个新治疗靶点,揭示了风险组间独特的免疫和代谢表型,从而为肿瘤异质性提供了新机制见解及未来治疗的潜在靶点。
论文解读
研究背景与意义
乳腺癌是全球女性最常见的恶性肿瘤及癌症相关死亡的主要原因,尽管早期诊断和治疗取得进展,转移仍导致绝大多数患者死亡。临床与分子异质性使预后与治疗决策复杂化,现有模型常缺乏多队列验证或未充分整合肿瘤的免疫与突变背景。因此,研究人员旨在开发并验证一种结合转移与致癌过程的基因特征,以提升风险分层精度并挖掘潜在治疗靶点。
关键技术方法
研究整合TCGA-BRCA、AURORA US Network、SCAN-B及GEO数据库的多组学数据,通过差异表达分析鉴定转移及癌症相关差异表达基因(M-CA-DEGs),采用单因素Cox与LASSO回归构建七基因预后模型,经校准曲线与决策曲线分析(DCA)评估预测效能;利用GSEA与ssGSEA进行功能富集,TIMER 2.0与TIDE框架分析免疫微环境,TRRUST数据库预测转录因子调控网络,基于STOmicsDB与CZ CELLxGENE Discover的单细胞转录组数据解析细胞类型特异性表达,并通过qPCR在MCF-10A及多种乳腺癌细胞系中验证基因表达。
研究结果
- 1.
转移相关基因筛选与验证
通过TCGA-BRCA与AURORA数据集的差异表达分析,鉴定出18个M-CA-DEGs,其在肿瘤与癌旁组织中表达差异显著且多数呈共表达。
- 2.
七基因预后模型构建与验证
单因素Cox筛选出12个预后相关基因,LASSO回归进一步确定IGJ、CXCL14、PTGER3、RTN1、EGOT、TLR10、PANX2构建风险模型。风险评分公式纳入各基因表达量与回归系数,按中位数分为高低风险组,结果显示高风险组总生存期显著更差,模型在SCAN-B与TCGA队列中均表现良好,校准曲线与DCA验证其准确性与临床净获益。
- 3.
风险评分的独立预后价值与列线图
多变量Cox证实风险评分为独立预后因子,联合年龄、肿瘤大小、淋巴结状态构建列线图,预测1、3、5年生存概率,校准曲线与ROC曲线显示良好一致性。模型在PAM50各亚型及不同治疗亚组中均具稳定预后价值。
- 4.
多模型比较
弹性网Cox等四种模型中,临床变量联合七基因特征(Model C)与临床联合PAM50(Model B)在区分度、校准度与净获益方面最优,优于单纯临床模型与弹性网模型。
- 5.
功能富集分析
高风险组富集细胞增殖、DNA复制修复、RNA转录加工及PLK1、Aurora、mTOR等激酶通路,同时TCA循环、糖酵解等代谢通路激活;低风险组免疫相关通路活性更高。
- 6.
免疫微环境分析
低风险组活化CD8+T细胞、Th1、NK细胞、树突状细胞等28种免疫细胞浸润显著增强,免疫评分、基质评分及微环境评分更高;TIDE分析显示低风险组以T细胞功能障碍为主,高风险组以T细胞排斥为主,且高风险组MDSCs增多,提示不同免疫逃逸机制。
- 7.
突变谱分析
高风险组TP53与SPTA1突变率升高,低风险组CDH1与PIK3CA突变率升高,且突变状态与风险评分显著相关。
- 8.
转录因子调控网络
TRRUST预测并验证SP1正调控CXCL14,FOXP3、VDR、RXRA正调控TLR10,相关转录因子表达与预后关联。
- 9.
单细胞与空间转录组分析
单细胞测序揭示七基因在不同细胞亚群中特异性表达:IGJ主要在浆细胞,CXCL14在癌症相关成纤维细胞(CAFs),PTGER3主要在血管周围样细胞,RTN1在髓系细胞与CAFs,EGOT在上皮细胞,TLR10在B细胞,PANX2在CAFs高表达。将基因分为免疫、基质、恶性三组,三者联合模型预后最佳。
- 10.
细胞系表达谱
qPCR显示RTN1含三种剪接异构体,其中RTN1?A在肿瘤组织中显著降低;TLR10、PTGER3、PANX2、EGOT、IGJ在各细胞系均有表达,CXCL14在部分细胞系缺失,不同细胞系中各基因表达水平存在显著差异。
结论与讨论
该研究通过整合多组学与单细胞数据,构建了生物学基础明确的七基因转移相关预后模型,有效实现乳腺癌患者风险分层,并在多队列与多亚型中验证其稳健性。研究首次系统揭示RTN1与TLR10在乳腺癌中的潜在抑癌作用,发现SPTA1在高风险组突变频率升高,提出VDR–TLR10等新型调控轴,为肿瘤异质性与免疫治疗策略提供新视角。成果发表于《Frontiers in Genetics》,为乳腺癌精准预后与靶向治疗提供了可转化的分子工具与理论依据。