《Cardiovascular Therapeutics》:Machine Learning Integrates Bulk and Single-Nucleus RNA Sequence to Explore Apoptosis-Related Gene in Myocardial Infarction
编辑推荐:
本研究针对心肌梗死(MI)后非心肌细胞凋亡作用不清、缺乏单细胞水平调控机制解析的难题,整合了单核RNA测序与转录组学数据,并结合多种机器学习算法,系统识别了心肌细胞凋亡相关基因(ARGs)的异质性,并锁定TNFRSF12A为MI中的关键调控分子。实验验证其在MI小鼠模型和TGF-β诱导的NIH3T3细胞中显著上调,证实其作为诊断生物标志物和治疗靶点的潜力,为MI的精准诊疗提供了新思路。
心肌梗死(Myocardial Infarction, MI)是威胁人类健康的头号“杀手”之一,冠状动脉堵塞导致心肌缺血、缺氧,进而引发一系列复杂的病理过程。其中,细胞凋亡是导致心肌细胞丢失、加速心脏不良重塑和心力衰竭的关键机制。然而,心脏并非仅有心肌细胞在“孤军奋战”,非心肌细胞(如成纤维细胞、内皮细胞、免疫细胞等)占了心脏细胞构成的“大半壁江山”。有趣的是,研究发现,非心肌细胞的凋亡发生率甚至是心肌细胞的8-9倍,但其在MI进展中的具体作用,尤其是单细胞水平的精细调控网络,一直笼罩在迷雾之中。既往研究多聚焦于心肌细胞凋亡,对非心肌细胞凋亡的“戏份”关注不足,这限制了我们全面理解MI的病理机制和开发新的干预策略。为了拨开这层迷雾,研究人员开展了一项整合多组学与机器学习的前沿探索。
本研究由Bin Li、Yuan Wu、Shude Liao、Jing Wang、Chenghui Yan、Panting Wei、Dali Zhang、Dan Liu、Yaling Han合作完成,论文发表在《Cardiovascular Therapeutics》上。为了系统刻画MI中凋亡相关基因(Apoptosis-Related Genes, ARGs)的调控网络,研究团队构建了一个整合多组学的分析框架。他们巧妙地将高分辨率的单核RNA测序(snRNA-seq)数据与反映整体组织水平的转录组(bulk RNA-seq)数据相结合,旨在从细胞群体和单细胞两个维度捕捉ARGs的活性变化。具体而言,研究人员从公共数据库获取了MI患者的单核测序数据集(GSE270788,含健康供体和急性期MI患者样本)和转录组数据集(GSE21610)。通过先进的数据分析流程(包括Seurat包进行质控、标准化和聚类,AUCell算法评估单细胞水平的ARGs活性)和多种机器学习算法(包括随机森林、Boruta和LASSO回归)进行特征基因筛选,最终锁定了一个核心枢纽基因。随后,研究团队通过动物模型(小鼠左前降支冠状动脉结扎术构建MI模型)和细胞实验(TGF-β诱导的NIH3T3成纤维细胞),对计算发现进行了实验验证,为关键基因的功能意义提供了坚实证据。
研究结果
3.1. 单核RNA测序数据分析
研究人员首先对单核测序数据进行了系统分析。经过严格的质量控制,保留了12,352个高质量细胞用于下游分析。通过无监督聚类和经典标记基因注释,这些细胞被划分为6种主要类型:髓系细胞、平滑肌细胞、心肌细胞、成纤维细胞、内皮细胞和脂肪细胞。比较MI组与对照组的细胞比例发现,MI后髓系细胞、成纤维细胞、内皮细胞和脂肪细胞的数量增加,而平滑肌细胞和心肌细胞的数量减少,提示MI后心脏细胞组成发生了显著变化。
3.2. ARGs活性分析
利用AUCell算法量化单细胞水平的ARGs活性发现,与对照组相比,MI组所有类型细胞的ARGs活性均升高。其中,成纤维细胞(除脂肪细胞外)的凋亡活性显著高于其他细胞类型。这一发现首次在单细胞分辨率上揭示了MI后不同心脏细胞中ARGs活性的异质性,并突出表明成纤维细胞是MI后凋亡活动的主要“参与者”。
3.3. KEGG和GO富集分析
通过对高相关性且上调的51个基因进行功能富集分析,发现这些基因在生物学过程上显著富集于“凋亡信号通路调节”,在分子功能上富集于“泛素蛋白连接酶结合”。KEGG通路分析进一步表明,这些基因主要与PI3K-Akt信号通路相关,提示该通路可能在MI相关的凋亡调控中扮演重要角色。
3.4. 通过机器学习识别最优基因
研究团队将单核测序分析筛选出的候选基因与转录组数据集(GSE21610)的差异表达信息相结合。随后,他们采用了三种独立的机器学习算法——LASSO回归、Boruta特征选择和随机森林(Random Forest, RF)——进行枢纽基因筛选。三种算法结果取交集,最终确定了一个共同的枢纽基因:TNFRSF12A。
3.5. 免疫浸润分析
通过ssGSEA算法分析免疫细胞浸润发现,TNFRSF12A的表达与多种免疫细胞(如未成熟树突状细胞、效应记忆CD4+T细胞)显著相关。ROC曲线分析显示,TNFRSF12A区分MI与对照组的曲线下面积(AUC)高达0.983,表明其具有极佳的诊断潜力。在单细胞水平上,TNFRSF12A的表达主要定位于成纤维细胞和脂肪细胞。
3.6. 细胞通讯分析
为了深入理解TNFRSF12A阳性成纤维细胞的功能,研究人员将成纤维细胞进一步分为TNFRSF12A+和TNFRSF12A-两个亚群。细胞通讯分析表明,TNFRSF12A+成纤维细胞具有更强的信号输出和接收能力。它们主要通过THBS1-CD36和THBS-CD47等配体-受体对与其他细胞(特别是心肌细胞)进行通讯。这表明TNFRSF12A+成纤维细胞在MI后的细胞间对话中处于活跃地位,可能通过特定信号通路影响微环境。
3.7. TNFRSF12A的实验验证
为验证生物信息学预测,研究团队构建了小鼠MI模型。超声心动图显示,MI组小鼠心脏收缩功能显著受损,心室扩大。蛋白质印迹和实时定量PCR结果一致证实,MI心肌组织中TNFRSF12A在蛋白和mRNA水平均显著上调。此外,在体外用TGF-β刺激NIH3T3成纤维细胞模拟活化状态,也观察到了TNFRSF12A蛋白水平的上调。这些实验证据强有力地支持了TNFRSF12A在MI病理过程中,特别是在成纤维细胞活化/纤维化中的作用。
结论与讨论
本研究通过整合单核RNA测序、转录组学和机器学习,首次在单细胞水平系统刻画了MI后凋亡相关基因的活性异质性,并揭示成纤维细胞是凋亡活动的主导细胞类型。研究人员成功鉴定出TNFRSF12A是调控MI中ARGs活性的关键分子。随后的实验验证在动物和细胞水平均证实了TNFRSF12A在MI后的上调。这些发现强调了非心肌细胞(尤其是成纤维细胞)凋亡在MI后心脏重塑中的重要作用。
TNFRSF12A是肿瘤坏死因子受体超家族成员,既往研究提示其与心脏纤维化及心力衰竭严重程度相关。本研究不仅通过多组学分析将其锁定为关键靶点,还通过细胞通讯分析发现TNFRSF12A+成纤维细胞具有独特的信号传递特征,富集于NOD样受体、Toll样受体信号通路等,暗示其可能通过调节炎症和应激反应参与MI病理过程。尽管研究使用了经典的NIH3T3细胞进行验证,并承认其与成体心脏肌成纤维细胞存在差异,但结果仍为TNFRSF12A的功能提供了重要支持。
该研究的核心意义在于:1) 为理解MI的复杂病理机制提供了全新的单细胞视角,将关注点从心肌细胞扩展到占据多数的非心肌细胞;2) 鉴定出TNFRSF12A这一具有高诊断价值(AUC=0.983)的潜在生物标志物;3) 提示TNFRSF12A及其所在的成纤维细胞亚群可作为干预MI后不良重塑的潜在治疗靶点。当然,TNFRSF12A调控成纤维细胞凋亡的具体分子机制、其在其他细胞类型(如脂肪细胞)中的作用,以及其作为治疗靶点的临床转化潜力,仍需未来更深入的研究来阐明。总之,这项研究为开发针对MI的精准诊断方法和靶向疗法奠定了重要的理论基础。