KIF22与KRAS合成致死作用:三阴性乳腺癌多组学分析揭示的新治疗靶点

《Frontiers in Oncology》:Multi-omics comprehensive analysis identified KIF22 and KRAS as highly synthetic lethal pairs for triple-negative breast cancer

【字体: 时间:2026年02月06日 来源:Frontiers in Oncology 3.3

编辑推荐:

  本综述通过整合单细胞RNA测序(scRNA-seq)、空间转录组学(ST)及大样本RNA测序(bulkRNA-seq)等多组学数据,系统描绘了三阴性乳腺癌(TNBC)的肿瘤微环境异质性,并鉴定出与高合成致死(HSL)活性相关的关键驱动基因。研究创新性地结合高维加权基因共表达网络分析(hdWGCNA)与多种机器学习算法,筛选出KIF22、KRAS等10个核心基因,并通过体内外实验验证了KIF22与KRAS在TNBC中具有合成致死(SL)相互作用,为TNBC的精准靶向治疗提供了新的策略和潜在靶点。

  
引言
三阴性乳腺癌(TNBC)是一种侵袭性强、预后差的乳腺癌亚型,占所有乳腺癌病例的15%至25%。其典型特征为孕激素受体(PR)、雌激素受体(ER)表达≤1%,人表皮生长因子受体2(HER2)表达为0至1+。由于缺乏有效的治疗靶点,晚期TNBC患者的5年生存率仅为约11%。合成致死(SL)是一种重要的治疗策略,通过同时靶向两个非致死基因的协同相互作用,实现选择性杀伤癌细胞而不影响正常细胞。本研究利用多组学数据,旨在深入解析TNBC的异质性,探索SL活性与疾病进展的关联,并识别新的SL治疗靶点。
方法
数据收集与分析
研究从GEO数据库获取了包括GSE161529、GSE176078和GSE246613在内的67个TNBC样本的单细胞RNA测序(scRNA-seq)数据。同时,从GEO(GSE58812, GSE31519)、TCGA(TCGA-TNBC)和cBioPortal(brca_metabric)数据库收集了604个TNBC样本和113个正常样本的大样本RNA测序(bulkRNA-seq)数据。空间转录组学(ST)数据来源于Sunny Z Wu的研究。经过严格的质量控制(保留线粒体读数≤20%或检测基因数>200的细胞),共获得245,924个高质量细胞用于后续分析。使用Seurat包进行标准化、主成分分析(PCA)降维,并应用Harmony算法校正批次效应。细胞聚类分辨率为0.8,最终通过经典标记基因注释出11个细胞亚群:B细胞、T细胞、NK细胞、浆细胞、单核细胞、巨噬细胞、浆样树突状细胞(pDCs)、成纤维细胞、内皮细胞、上皮细胞和周细胞。ST数据使用Seurat和SCTransform进行标准化和无监督聚类,SPOTlight算法用于细胞类型注释。
SL活性基因集评分
从SynLethDB数据库获取175个TNBC相关的SL基因。采用五种算法(AUCell、UCell、singscore、ssGSEA、AddModuleScore)在单细胞水平量化SL活性。
拷贝数变异分析
使用“inferCNV”R包区分TNBC中的恶性和非恶性上皮细胞亚群。以正常对照细胞为参考,通过比较基因表达水平推断大尺度拷贝数变异(CNV)。
细胞间通讯分析
利用“CellChat”R包推断TNBC微环境中的配体-受体相互作用,构建细胞亚群间的通讯网络。
伪时间分析
应用CytoTRACE算法基于单细胞转录组数据推断细胞干性和分化潜能。Slingshot算法用于重建细胞分化轨迹。
hdWGCNA与差异表达分析
结合高维加权基因共表达网络分析(hdWGCNA)和差异表达分析(DEGs),识别与HSL细胞表型相关的关键调控基因模块。
功能富集分析
采用基因集变异分析(GSVA)评估HSL和低SL活性(LSL)组间的生物学功能通路差异。使用“clusterProfiler”包进行疾病本体论(DO)、京都基因与基因组百科全书(KEGG)和基因本体论(GO)富集分析。
特征基因筛选
首先通过Spearman相关分析筛选与HSL显著正相关的基因。随后应用五种机器学习算法——随机森林(Random Forest)、LASSO、自适应最佳子集选择(ABESS)、决策树(Decision Tree)和梯度提升机(GBM)进行特征选择。在五种算法中均出现的基因被定义为SL核心基因。
模型基准测试与特征可解释性
使用“mlr3”包的基准测试功能,比较八种学习器(KNN、NB、Ranger、RPART、SVM、Log_reg、LDA、XGBoost)在预测HSL相关基因任务上的性能。通过SHapley加性解释(SHAP)分析量化每个特征基因对模型预测结果的贡献。
实验验证
细胞实验使用多种乳腺癌细胞系(如MDA-MB-231, SUM159)和正常乳腺上皮细胞系(MCF-10A)。通过慢病毒转导进行基因敲低(shRNA)或过表达。采用蛋白质印迹法(Western blot)检测KIF22和KRAS蛋白表达,RT-qPCR检测mRNA水平。功能实验包括CCK-8检测细胞增殖、流式细胞术分析细胞凋亡和周期、克隆形成实验、划痕愈合实验和Transwell实验评估迁移和侵袭能力。动物实验在BALB/c裸鼠中进行皮下成瘤实验,观察肿瘤生长,并通过免疫组织化学(IHC)检测肿瘤组织中Ki67的表达。多重免疫荧光(mIHC)用于检测TNBC组织和癌旁组织中KIF22和KRAS的蛋白表达和定位。
结果
TNBC的单细胞微环境图谱
UMAP分析将TNBC的scRNA-seq数据聚类为27个簇,最终注释出11个细胞亚群。各细胞亚群的特异性标记基因表达明确,例如巨噬细胞(CD68, C1QA, C1QB)、上皮细胞(EPCAM, CDH1, KRT7)等。不同数据集中各细胞亚群的比例分布存在差异。
TNBC中SL活性的表达模式
在TCGA队列中,TNBC患者的SL活性表达水平显著高于非TNBC患者。ST分析显示,SL活性在肿瘤核心区域表达最高。inferCNV分析将上皮细胞分为4个簇(K1-K4),其中K2、K3和K4簇具有显著更高的CNV评分,被鉴定为恶性TNBC细胞,而K1簇可能包含正常上皮细胞。SL活性在恶性上皮细胞中的表达水平显著高于正常上皮细胞。五种基因集评分算法均一致显示SL活性在TNBC恶性上皮细胞中高度活跃。
TNBC恶性细胞中SL活性的异质性评估
SL活性在恶性细胞内部呈现不均匀分布。根据SL评分(75th百分位数>2.164为HSL,25th百分位数<1.321为LSL),将恶性细胞分为HSL、中间SL活性(ISL)和LSL三组。CytoTRACE分析显示,HSL细胞具有更高的CytoTRACE评分,表明其干性更强、分化潜能更低、恶性程度更高。SL评分与CytoTRACE评分呈正相关(r = 0.38)。Slingshot轨迹推断提示TNBC的恶性分化可能起始于HSL细胞亚群,并逐渐向低SL活性状态演变。
TNBC微环境中的细胞间通讯
CellChat分析表明,HSL恶性上皮细胞与其他细胞亚群的相互作用数量和强度均高于LSL恶性细胞。HSL细胞主要的出信号模式涉及MK、MIF、VEGF和ANNEXIN,而入信号模式涉及TWEAK、EGF、GRN、PTN和MK。MDK在介导SL活性与TNBC微环境的信号连接中起关键作用。PROGENY分析显示,HSL细胞中MAPK、JAK-STAT、TGFβ等肿瘤相关信号通路显著活跃,而LSL细胞中仅p53等少数通路活跃。GSVA分析进一步揭示HSL细胞在E2F靶点、G2M检查点、MYC靶点V1、DNA修复等与靶向和免疫治疗相关的通路上富集。scMetabolism算法显示HSL细胞在药物代谢、脂肪酸代谢、糖酵解等多种代谢通路上表达更广泛。
SL活性驱动的特征基因识别
hdWGCNA构建了包含蓝色、棕色、黄色、蓝绿色和绿色五个模块的基因共表达网络。其中蓝色、棕色和蓝绿色模块与HSL组高度相关。差异表达分析在HSL细胞中鉴定出281个上调的差异表达基因。与hdWGCNA模块基因取交集后,获得100个与HSL活性相关的交叉基因。进一步通过Pearson相关分析筛选出95个与SL活性显著正相关的特征基因。富集分析表明,这些基因在DO分析中与乳腺癌等多种癌症显著相关;KEGG通路富集于p53信号通路、DNA复制和代谢相关通路;GO分析显示其在生物过程(如核分裂、有丝分裂核分裂、细胞器分裂)、细胞组分(如染色体区域、凝缩染色体)和分子功能(如微管结合、微管蛋白结合、组蛋白激酶活性)上显著富集。
描述HSL活性的标志基因筛选
五种机器学习算法分别筛选出特征基因:随机森林和GBM各20个,LASSO筛选出78个,决策树和ABESS各筛选出20个。取五种算法的交集,最终确定10个核心标志基因:PGP、KIF22、CCNB1、RPA3、BCL2L12、SMC2、MKI67、PBK、CDK1和MIS18A。
标志基因的表达与验证
在scRNA-seq数据中,10个标志基因的ROC曲线下面积(AUC)均较高(0.708-0.841),表明其具有良好的预测能力。这些基因在HSL恶性细胞中高表达,在TNBC微环境中主要富集于恶性细胞。bulkRNA-seq水平验证显示,10个基因在TNBC组织中的表达显著高于正常组织,且其表达水平与SL活性密切正相关。Kaplan-Meier生存分析表明,PGP、KIF22、CCNB1、RPA3、BCL2L12、SMC2和PBK的高表达与TNBC患者较差的总生存期(OS)显著相关。ST分析显示PGP、KIF22、CCNB1、RPA3、BCL2L12、MKI67和CDK1在TNBC肿瘤组织核心区域高表达,与SL活性分布区域高度重叠。
机器学习模型的基准测试与标志基因的SHAP分析
基准测试显示,随机森林(Ranger)模型在ROC AUC和PRAUC上均表现最优,测试集准确率达94.5%,ROC AUC和PRAUC均为0.99。SHAP分析直观展示了10个标志基因对模型预测结果的具体贡献度,KIF22等基因贡献显著。
KIF22与KRAS体内外的协同效应
RT-qPCR和Western blot验证了10个标志基因在TNBC细胞系(如MDA-MB-231, SUM159)中的mRNA和蛋白表达水平均高于非TNBC细胞系和正常乳腺上皮细胞系。根据SynLethDB数据库,KRAS被鉴定为KIF22的合成致死配对基因。mIHC显示KIF22(定位于细胞核)和KRAS(定位于细胞质)在TNBC组织中的表达显著高于癌旁组织。功能实验表明,在MDA-MB-231(携带KRAS G13D突变)细胞中,单独敲低KIF22或KRAS对细胞增殖和凋亡影响不大,但同时敲低KIF22和KRAS则能显著抑制细胞增殖、增加细胞凋亡、降低克隆形成能力以及减弱细胞迁移和侵袭能力。在双敲低细胞中同时过表达KIF22和KRAS可恢复细胞增殖速率。体内动物实验进一步证实,与对照组或单基因敲低组相比,同时敲低KIF22和KRAS的移植瘤生长最慢,肿瘤体积最小,肿瘤组织内Ki67阳性率最低。
讨论
本研究通过多组学整合分析,系统揭示了TNBC中SL活性的异质性及其与肿瘤干细胞特性、细胞通讯和信号通路的密切关联。鉴定出的10个标志基因,特别是通过实验验证的KIF22-KRAS合成致死对,为TNBC的精准治疗提供了新的靶点和分层策略。对于携带KRAS突变(如G13D)且难以从现有KRAS(G12C)抑制剂中获益的TNBC患者,靶向KIF22可能成为一种有前景的补充治疗策略。未来研究需进一步探索KIF22-KRAS合成致死作用的分子机制,并推动其向临床转化。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号