利用机器学习结合单细胞RNA测序技术,对人类和小鼠中的关键吞噬基因进行比较分析
《Neuroscience》:Comparative analysis of key phagocytic genes in humans and mice using machine learning integrated with single-cell RNA sequencing
【字体:
大
中
小
】
时间:2026年02月07日
来源:Neuroscience 2.8
编辑推荐:
脑出血后小胶质细胞吞噬活性存在物种差异,单细胞RNA测序结合机器学习模型(XGBoost)分析发现小鼠TLR2和人类CLEC7A基因与吞噬活性显著相关,揭示小鼠吞噬作用持续增强而人类短暂升高后转为炎症持续的模式。
李成成|刘航
重庆医科大学药学院,中国重庆400010
摘要
小胶质细胞的吞噬作用对于脑内出血(ICH)后的神经功能恢复至关重要。通过单细胞RNA测序,我们比较了小鼠和人类ICH中小胶质细胞的反应,并发现了显著的物种特异性时间模式。小鼠的小胶质细胞表现出持续的吞噬活性增强,而人类小胶质细胞仅表现出短暂的增强后随之下降,并伴有持续的炎症。为了识别与吞噬差异相关的基因,我们评估了五种机器学习模型,并选择了XGBoost作为表现最佳的模型。该分析确定了小鼠中的Tlr2和人类中的CLEC7A作为与小胶质细胞吞噬状态相关的基因。推断的转录因子活性分析进一步显示,小鼠吞噬性小胶质细胞亚群中与吞噬和炎症相关的转录活性更强,而人类小胶质细胞主要表现为与炎症相关的转录因子。与这些结果一致,在单细胞数据中Tlr2的表达在第14天显著增加,免疫染色证实其与IBA1+小胶质细胞的共定位以及在ICH后第3天和第7天的上调。总之,我们的发现表明,将单细胞RNA测序与机器学习相结合有助于识别与吞噬相关的基因,并揭示了小胶质细胞吞噬作用的保守和差异模式,为理解物种特异性的ICH反应提供了新的见解。
引言
脑内出血(ICH)是一种严重的急性脑血管疾病,大约三分之二的患者会出现永久性的功能障碍(Seiffge等人,2024年)。尽管负担沉重,但目前尚无有效的药物治疗方法来促进功能恢复。ICH后的神经损伤源于原发性和继发性损伤机制(Cordonnier等人,2018年)。快速清除血肿不仅可以减轻体积效应,还可以减轻继发性损伤(Li等人,2021年;Yao和Tsirka,2012年)。临床研究表明,在幕上出血的情况下,如果在24小时内进行微创血肿清除,可以改善功能结果,这突显了血肿清除作为促进恢复的关键策略的重要性,即使应用了严格的纳入标准(Pradilla等人,2024年)。
除了外科干预外,免疫细胞的内源性吞噬活性在血肿清除中也起着关键作用。小鼠和人类小胶质细胞在ICH后都表现出吞噬能力,这种能力受到“吃我”和“不要吃我”信号平衡的调节(Liu等人,2022年)。磷脂酰丝氨酸(PS)、CD36、CD163、NRF2和PPARγ等分子已被发现参与调节小胶质细胞的吞噬作用。增强这些细胞的吞噬功能可以加速血肿清除,并可能改善ICH后的神经功能恢复(Chen等人,2023年;Xie等人,2016年;Zhao等人,2015年;Zhou等人,2023年)。
然而,啮齿动物和人类在ICH后的功能恢复方面存在显著差异(Gong等人,2021年;Paiva等人,2023年)。许多在啮齿动物模型中显示有效的疗法在临床试验中失败了,这可能是由于再生能力的差异以及炎症和吞噬反应的物种特异性变化(Dhir等人,2020年;O’Collins等人,2006年)。阐明这些种间差异——特别是小胶质细胞的吞噬功能——对于开发适用于人类ICH的治疗策略至关重要。
机器学习(ML)已成为一种强大的特征选择方法,能够从大规模生物数据集中识别关键分子决定因素(Krokidis等人,2023年;Yang等人,2021年)。随着单细胞RNA测序技术的进步,现在可以获得大量的高维转录组数据。与传统的单变量分析相比,基于ML的算法(如逻辑回归、极端梯度提升(XGBoost)、随机森林和支持向量机递归特征消除(SVM-RFE)能够捕捉非线性关系,处理共线性,并优先考虑对预测性能贡献最大的特征。通过迭代减少冗余和优化特征集,ML有助于发现传统统计方法可能忽略的生物学上有意义的基因特征。此外,可解释性工具(如SHapley Additive exPlanations(SHAP)可以直观地展示每个特征对模型的贡献(He等人,2025年;Ponce-Bobadilla等人,2024年)。将这些方法应用于ICH相关的单细胞转录组数据,可以系统地识别与吞噬相关的核心基因,从而揭示小胶质细胞功能的新分子机制,并突出潜在的治疗靶点。
在这项研究中,我们利用公开可用的单细胞数据集来表征小鼠和人类ICH中小胶质细胞亚群吞噬活性的动态变化。通过基于ML的特征选择,我们确定了小鼠中的Tlr2和人类中的CLEC7A作为与小胶质细胞吞噬活性相关的基因。这些发现揭示了啮齿动物和人类ICH研究之间的转化差距,并为未来的治疗开发提供了理论基础。
章节片段
机器学习
为了识别ICH后小胶质细胞吞噬活动相关的关键基因,我们将监督机器学习分类器应用于来自小鼠和人类样本的单细胞RNA-seq数据集。工作流程包括四个主要步骤:数据预处理、带超参数优化的模型训练、性能评估以及使用SHAP进行特征重要性解释。
ICH后人类单细胞图谱的重建
我们分析了GSE266873数据集中的单细胞RNA测序数据,该数据集包含了人类ICH样本。根据已建立的标记物对细胞群体进行了注释,识别出八个主要簇:少突胶质细胞、星形胶质细胞、小胶质细胞、中性粒细胞、内皮细胞、单核细胞、少突胶质细胞前体细胞(OPCs)和T细胞(图1A-B)。时间分析将样本分为ICH后的三个阶段:第一阶段(0–3小时,S1)、第二阶段(12小时,S2)和第三阶段(26–32小时,S3)。
讨论
目前针对脑内出血(ICH)的治疗策略仍然有限,尽管手术清除血肿很有前景,但并不能完全恢复功能,尤其是在人类中(Mendelow等人,2005年)。相比之下,啮齿动物表现出显著的神经功能恢复能力,这促使人们研究这种差异背后的机制。由于小胶质细胞是大脑中的主要吞噬细胞,并在炎症和组织重塑中发挥关键作用(Li等人),
结论
我们的研究表明,小鼠和人类ICH中的小胶质细胞吞噬作用表现出不同的时间模式和吞噬活动模式。在小鼠中,吞噬能力通过吞噬相关和炎症相关的转录程序得到维持,而在人类中仅观察到短暂的增强,并伴有持续的炎症。机器学习分析突出了与物种特异性吞噬相关的基因,其中Tlr2表现出
CRediT作者贡献声明
李成成:撰写——原始草稿、可视化、监督、软件开发、研究、正式分析、数据管理、概念构思。刘航:撰写——审稿与编辑、可视化、验证、研究。
致谢
本文中的计算工作部分得到了重庆医科大学信息中心超级计算中心的支持。
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号