基于加权基因共表达网络分析与机器学习鉴定和验证脊髓损伤的线粒体相关诊断标志物

【字体: 时间:2026年03月06日 来源:Behavioural Neurology 2.3

编辑推荐:

  本综述结合加权基因共表达网络分析(WGCNA)与机器学习算法,聚焦脊髓损伤(SCI)中线粒体功能紊乱的关键作用,成功筛选出六个具有高诊断价值的线粒体相关核心基因(NDUFB3、SLC25A24、SLC25A40、GSTZ1、MAOA、MRPL12),并深入探讨了其与免疫微环境重塑(如T细胞、B细胞、巨噬细胞)的关联,为理解SCI的病理机制和开发新的生物标志物及治疗靶点提供了新见解。

  
脊髓损伤(SCI)是一种严重的神经系统疾病,极大地影响患者生活质量。线粒体功能障碍在其病理过程中扮演着关键角色。本研究旨在通过整合生物信息学与机器学习方法,鉴定与SCI相关的线粒体诊断标志物。
1. 引言
脊髓损伤不仅导致运动、感觉和自主神经功能障碍,还可能伴随感染、深静脉血栓等严重并发症。当前治疗方法多样,但效果和预后评估存在差异,常无法针对患者个体化的病理机制。线粒体在细胞能量代谢、钙稳态、氧化应激反应和细胞凋亡中至关重要。越来越多的研究强调了线粒体在SCI中的重要性,其功能异常与神经元存活和功能恢复密切相关,且与阿尔茨海默病、帕金森病等神经退行性疾病的预后相关。尽管SCI始于急性机械损伤,但其后续进展与慢性神经退行性疾病共享多种病理生理特征,包括氧化应激、神经炎症、代谢失衡和进行性神经元丢失,这些都与线粒体功能障碍紧密相连。因此,基于线粒体相关基因构建SCI预后模型,探索其在临床预后评估中的价值,对理解SCI病理生理机制和推动个体化医疗发展具有重要意义。
2. 方法
研究从GEO数据库获取了批量转录组数据(GSE151371,38个SCI和20个对照样本)和单细胞RNA测序(scRNA-seq)数据(GSE158892,2个SCI样本)。通过差异表达分析鉴定SCI与对照样本间的差异表达基因(DEGs)。随后对DEGs进行基因本体(GO)和京都基因与基因组百科全书(KEGG)富集分析,以探究其功能。利用加权基因共表达网络分析(WGCNA)筛选与SCI最相关的基因模块。整合DEGs、WGCNA模块基因以及从GeneCards获取的线粒体相关基因列表,得到候选基因集并构建蛋白质-蛋白质相互作用(PPI)网络。应用三种机器学习算法——随机森林(RF)、支持向量机(SVM)和LASSO回归,筛选关键枢纽基因。采用EPIC算法评估免疫细胞浸润情况。对scRNA-seq数据进行预处理、降维(主成分分析PCA和t分布随机邻域嵌入t-SNE)和细胞簇注释,以分析枢纽基因在不同细胞类型中的表达。此外,通过miRWalk数据库预测调控枢纽基因的微小RNA(miRNA),并构建miRNA-mRNA调控网络。所有统计分析使用R软件进行,枢纽基因的诊断价值通过受试者工作特征(ROC)曲线评估。
3. 结果
3.1. 差异表达基因的鉴定
与对照组相比,SCI组中共鉴定出2566个上调基因和2634个下调基因。该结果通过火山图直观展示,揭示了SCI中广泛的转录组变化。
3.2. DEGs的GO和KEGG富集分析
功能富集分析显示,DEGs在细胞组分(CC)方面主要位于囊泡、内膜系统和细胞质;在分子功能(MF)方面主要涉及阳离子结合、催化活性和酶结合;在生物过程(BP)方面主要富集于运输、定位建立和对应激的反应。KEGG通路分析表明,DEGs显著富集于坏死性凋亡、T细胞受体信号通路和NOD样受体信号通路等,这些通路与SCI后线粒体活性氧(ROS)产生和免疫调节密切相关。
3.3. 加权基因共表达网络分析
WGCNA共识别出11个不同的基因共表达模块。其中,浅绿色模块和橙红色模块分别与SCI状态呈最强正相关和负相关。最终从这两个模块中选取了1578个基因用于后续分析。
3.4. 与SCI发展相关的线粒体相关基因的PPI网络
通过整合DEGs、WGCNA模块基因和线粒体相关基因集,最终得到76个候选基因,并构建了它们的蛋白质相互作用网络,这些基因更可能代表SCI相关线粒体功能障碍的核心分子改变。
3.5. 枢纽基因的鉴定
综合SVM、RF和LASSO三种机器学习算法的结果,最终筛选出六个重叠的枢纽基因:NDUFB3、SLC25A24、SLC25A40、GSTZ1、MAOA和MRPL12。
3.6. 枢纽基因的表达与诊断价值
所有六个枢纽基因在SCI组中的表达均显著上调。ROC曲线分析显示,这六个基因对SCI的诊断均具有良好预测价值,曲线下面积(AUC)值均大于0.77。
3.7. 免疫浸润分析
EPIC算法分析显示,与正常组相比,SCI组中B细胞、CD4+T细胞和CD8+T细胞的浸润水平均显著降低,而巨噬细胞水平升高。相关性分析进一步揭示,枢纽基因与这些免疫细胞浸润水平存在显著关联。例如,B细胞水平与MAOA呈负相关,CD4+T细胞水平与SLC25A24、GSTZ1、NDUFB3和SLC25A40呈负相关,巨噬细胞水平与SLC25A24和MAOA呈正相关。这些结果表明枢纽基因可能参与塑造SCI后的免疫微环境。
3.8. 基于GEO数据库的单细胞RNA测序分析
对两个SCI样本的scRNA-seq数据分析后,通过t-SNE算法将细胞分为23个簇,并注释出6种细胞亚型。研究发现,NDUFB3在树突状细胞(DC)中表达显著高于其他细胞,而MAOA在CD34+祖B细胞中表达显著更高。这为理解枢纽基因在特定免疫细胞类型中的功能提供了细胞层面的依据。
3.9. miRNA–mRNA调控网络
通过miRWalk数据库预测了可能调控这六个枢纽基因的miRNA,并利用韦恩图找出了同时靶向多个枢纽基因的8个重叠miRNA。最终构建了一个推测的miRNA-mRNA调控网络,揭示了枢纽基因可能受到的转录后调控机制。
4. 讨论
本研究通过整合批量与单细胞转录组分析,成功鉴定了六个与线粒体功能相关的SCI潜在生物标志物,并观察到SCI后免疫细胞构成的改变,可能反映了损伤后的免疫重塑。每个枢纽基因在SCI病理机制中可能扮演着独特角色:NDUFB3作为线粒体呼吸链复合体I的组成部分,其上调可能加剧氧化应激和巨噬细胞活化;SLC25A24和SLC25A40是线粒体溶质载体家族成员,可能通过影响线粒体离子和代谢物转运参与免疫调节;GSTZ1与代谢重编程相关,其过表达可能影响能量代谢和二氯乙酸(DCA)的代谢;MAOA作为单胺氧化酶,其表达与巨噬细胞浸润正相关,提示其可能参与巨噬细胞的免疫抑制极化;MRPL12是线粒体核糖体关键组分,在维持线粒体蛋白合成和能量代谢中起核心作用。这些基因共同指向了线粒体功能障碍、代谢紊乱和免疫微环境改变在SCI进程中的交织作用。然而,本研究存在一定局限性,如依赖公开数据集、样本量有限、缺乏独立的实验验证和临床队列验证等。因此,这些发现应被视为假设生成,需要在更大规模的前瞻性数据集和机制研究中进行确认。
作者贡献
陈海峰、蔡伟和张云鹏对研究的构思和设计有贡献。蔡伟、唐晓明、李尧和戴健负责数据的收集和整理。陈海峰、张云鹏、唐晓明和马健负责数据的分析和解读。陈海峰、蔡伟、张云鹏、唐晓明、戴健和李尧对这项工作贡献相同,应被视为共同第一作者。
致谢
作者无内容报告。
资金
本手稿未收到任何资金。
披露
所有作者撰写并批准了最终手稿。
伦理声明
南京医科大学附属淮安第一医院伦理委员会认为本研究基于开源数据,因此免除了伦理批准的需要。
同意
作者无内容报告。
利益冲突
作者声明不存在利益冲突。
数据可用性声明
当前研究期间生成和/或分析的数据集可根据合理要求从通讯作者处获得。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号