机器学习鉴定PPARG作为脓毒症诊断生物标志物并与CD14/NF-κB信号通路相关联:整合转录组学与实验验证

《Frontiers in Cellular and Infection Microbiology》:Machine learning identifies PPARG as a diagnostic biomarker for sepsis linked to CD14/NF-κB signaling: integrated transcriptomics and experimental validation

【字体: 时间:2026年05月28日 来源:Frontiers in Cellular and Infection Microbiology 4.8

编辑推荐:

  背景(Background):脓毒症(Sepsis)是由宿主对感染反应失调引起的危及生命的器官功能障碍。由于临床和生物学异质性较大,早期诊断是临床难点。CD14是固有免疫激活中的核心模式识别受体(pattern-recognition receptor),但其

背景(Background):脓毒症(Sepsis)是由宿主对感染反应失调引起的危及生命的器官功能障碍。由于临床和生物学异质性较大,早期诊断是临床难点。CD14是固有免疫激活中的核心模式识别受体(pattern-recognition receptor),但其下游连接CD14与免疫代谢调节的网络尚未完全明确。研究人员旨在鉴定与CD14相关的血液诊断生物标志物并探索潜在调控机制。 方法(Methods):从基因表达综合数据库(Gene Expression Omnibus, GEO)获取全血转录组数据集,发现集为GSE236713,外部验证集为GSE65682。通过CD14高表达与低表达样本间的差异表达基因(Differentially Expressed Genes, DEGs)和脓毒症相关加权基因共表达网络分析(Weighted Gene Co-Expression Network Analysis, WGCNA)模块取交集获得候选基因。通过蛋白互作(Protein-Protein Interaction, PPI)网络分析确定枢纽基因(hub genes),采用最小绝对收缩与选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归和随机森林(Random Forest, RF)筛选特征基因。比较多种机器学习算法并建立人工神经网络(Artificial Neural Network, ANN)分类器。评估临床关联、免疫细胞组成(CIBERSORT)及通路活性(基因集富集分析 Gene Set Enrichment Analysis, GSEA)。在脂多糖(Lipopolysaccharide, LPS)刺激的RAW264.7巨噬细胞中通过CD14敲除/过表达及NF-κB核转位抑制剂SN50进行机制验证。 结果(Results):鉴定出5个特征基因——MMP9、PPARG、C1QC、MS4A4A和ARG1。在7种算法中ANN性能最优(内部验证AUC = 0.974,外部验证AUC = 0.953)。PPARG单基因诊断效能最强(AUC = 0.994),与序贯器官衰竭评估(Sequential Organ Failure Assessment, SOFA)评分相关(r = 0.50, P = 1.5 × 10-29),被优先选为诊断生物标志物。Cox模型显示PPARG与ICU短期预后风险相关(HR = 1.64, 95% CI 1.34–2.01, P = 1.3 × 10-6)。GSEA提示PPARG低表达样本中NF-κB相关通路富集。CIBERSORT显示PPARG与单核细胞比例相关性最强(r = 0.328, P = 1.06 × 10-6)。体外实验中,LPS诱导的PPARG下调依赖于CD14;SN50部分逆转CD14过表达细胞中的PPARG抑制并降低肿瘤坏死因子α(Tumor Necrosis Factor-α, TNF-α)分泌。 结论(Conclusion):通过整合机器学习与实验验证,本研究将PPARG确定为脓毒症诊断生物标志物,并提供其与CD14/NF-κB信号通路相关联的支持性证据。这些发现为开发基于宿主反应的诊断标签及进一步探究脓毒症中PPARG相关免疫代谢调控奠定基础。
论文解读:《Machine learning identifies PPARG as a diagnostic biomarker for sepsis linked to CD14/NF-κB signaling: integrated transcriptomics and experimental validation》发表于《Frontiers in Cellular and Infection Microbiology》
研究背景
脓毒症(Sepsis)是因宿主对感染反应失调导致的危及生命的器官功能障碍,具有高发病率和高死亡率。早期识别困难且传统炎症标志物如C反应蛋白(C-Reactive Protein, CRP)和降钙素原(Procalcitonin, PCT)在早期敏感性和特异性欠佳。CD14作为Toll样受体4(Toll-Like Receptor 4, TLR4)协同受体识别脂多糖(Lipopolysaccharide, LPS)启动固有免疫,但其下游转录网络尤与其免疫代谢调节分子的关系未明。研究人员通过整合全血转录组学、机器学习及体外实验,旨在挖掘CD14关联的脓毒症诊断生物标志物并探讨CD14/核因子κB(Nuclear Factor kappa-light-chain-enhancer of activated B cells, NF-κB)轴对候选分子的调控,最终确定过氧化物酶体增殖物激活受体γ(Peroxisome Proliferator-Activated Receptor Gamma, PPARG/PPARγ)为诊断生物标志物并建立人工神经网络(Artificial Neural Network, ANN)诊断模型。
主要关键技术方法
研究人员使用GEO数据库中欧洲裔人群全血转录组队列:发现集GSE236713(脓毒症324份样本及健康对照30例,采样于ICU入科5日内)和外部验证集GSE65682(脓毒症760例及健康对照42例,入科24小时内采样)。以CD14表达最佳截断值(Youden Index)将样本分为CD14-high/CD14-low组,筛选差异表达基因(Differentially Expressed Genes, DEGs,|log2FC| > 0.5, adj. P < 0.05)。构建加权基因共表达网络(Weighted Gene Co-Expression Network Analysis, WGCNA)筛选脓毒症相关模块,取DEGs与模块基因交集获候选基因。通过STRING数据库构建蛋白互作(Protein-Protein Interaction, PPI)网络,cytoHubba四种算法取交集体征枢纽基因(hub genes)。采用最小绝对收缩与选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归与随机森林(Random Forest, RF)基于基尼系数重要性筛选特征基因。比较7种机器学习算法建立ANN分类器,内部7:3划分训练验证,外部独立队列验证。通过CIBERSORT反卷积估算22种免疫细胞比例,基因集富集分析(Gene Set Enrichment Analysis, GSEA)分析Reactome通路。体外使用LPS(100 ng/mL, 6 h)刺激RAW264.7巨噬细胞,构建CD14敲除(Knock Out, KO)及过表达(Over Expression, OE)稳转株,用NF-κB/Rel核转位抑制剂SN50(10 μM预处理4 h)干预,Western blot检测蛋白,酶联免疫吸附测定(Enzyme-Linked Immunosorbent Assay, ELISA)检测TNF-α。
研究结果
3.1 Identification of candidate genes by differential expression analysis and WGCNA
研究人员发现脓毒症患者全血中CD14表达显著高于健康人(AUC = 0.859),按最优截断分组后得3582个DEGs。WGCNA软阈值β=16构建无标度网络,识别出与脓毒症正相关最显著的magenta模块(r = 0.56, P = 1.43×10-38)和grey60模块(r = 0.55, P = 5.78×10-36),两模块内基因显著性(Gene Significance, GS)与模块成员度(Module Membership, MM)呈正相关。DEGs与两模块基因取交集获得374个候选基因,关联CD14表达状态与脓毒症表型。
3.2 Functional enrichment and PPI-based identification of hub genes
GO与KEGG富集显示候选基因主要涉及病原体应答、炎症调节及脂质代谢过程,通路含NF-κB、TLR及过氧化物酶体增殖物激活受体(Peroxisome Proliferator-Activated Receptor, PPAR)信号。STRING构建PPI网络(置信度≥0.7,270个节点),cytoHubba四种算法交集体征39个枢纽基因(含PPARG、CD14、MMP9等)。
3.3 Machine learning–based identification of feature genes and ANN construction
LASSO保留14个非零系数基因,RF保留9个(平均基尼下降>2.0),交集得5个特征基因:MMP9、PPARG、C1QC、MS4A4A、ARG1。七种算法比较中ANN内部验证AUC最高(0.974),优于一向表现较好的极端梯度提升树(eXtreme Gradient Boosting, XGBoost, AUC=0.952)。最终ANN(输入层5节点,双隐层4和2神经元)在外部验证集GSE65682达AUC = 0.953。
3.4 Clinical association analysis prioritizes PPARG as a diagnostic biomarker
五基因单基因ROC中PPARG区分脓毒症与健康人AUC最高(0.994),故优先定为诊断生物标志物。PPARG表达与SOFA评分正相关(Spearman r = 0.50, P = 1.5×10-29);在多变量Cox回归中与ICU短期不良结局风险相关(HR = 1.64, 95% CI 1.34–2.01, P = 1.3×10-6)。按SOFA分层(≥11为高危)PPARG判别AUC达0.796。时间分层显示PPARG在入科第1、2、5天均显著区别于对照组,D1与D5有轻微差异。
3.5 Immune cell composition and its association with PPARG expression
CIBERSORT显示脓毒症组单核细胞、M1巨噬细胞等升高,NK细胞等降低。PPARG表达与推断单核细胞比例正相关最强(r = 0.328, P = 1.06×10-6),与M2巨噬细胞亦正相关(r = 0.184, P < 0.005),校正疾病状态后关联仍显著(β = 0.178, P = 4.47×10-5)。
3.6 GSEA reveals signaling pathways associated with PPARG expression stratified by CD14
全样本GSEA显示NF-κB相关Reactome基因集在PPARG低表达组显著富集(负Normalized Enrichment Score, NES)。按CD14-high/CD14-low分层后,非经典NF-κB通路(TNFR2_NON_CANONICAL_NF_KB_PATHWAY)及TNF结合生理受体通路(TNFS_BIND_THEIR_PHYSIOLOGICAL_RECEPTORS)在PPARG低组富集,CD14-high亚组富集显著性减弱(P = 0.055

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号