通过生物信息学和机器学习，整合分析方法发现了与乳酰化相关的败血症生物标志物

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Biochemical and Biophysical Research Communications》：Integrative analysis identifies lactylation-related biomarkers in sepsis via bioinformatics and machine learning

【字体：大中小】 时间：2026年01月24日 来源：Biochemical and Biophysical Research Communications 2.2

编辑推荐：

　　本研究通过整合转录组数据、机器学习算法和实验验证，发现SLC4A4、SLC16A4和CRYAB是脓毒症的新型诊断生物标志物，并揭示了乳酰化修饰在免疫调节和器官损伤中的作用。

钱海翔|黄晨乐|孟建康|孙朝瑞|聂世楠|薛翔

南京医科大学金陵临床学院急诊医学系，南京，210002，中国

摘要

背景

蛋白质乳酰化是一种由乳酸驱动的新型翻译后修饰，已成为炎症性疾病（包括败血症）中细胞代谢与表观遗传调控之间的关键纽带。然而，关于乳酰化相关基因（LRGs）及其在败血症中的诊断潜力，目前仍缺乏系统的研究。

方法

我们利用公共数据库中的转录组数据（GSE236713作为训练集；GSE28750作为验证集）进行了综合研究。差异表达分析确定了与败血症相关的基因，并通过GeneCards将这些基因与LRGs进行交叉比对，以筛选候选基因。随后进行了功能富集分析。我们采用了三种机器学习算法——LASSO回归、支持向量机（SVM）和随机森林（RF）来筛选核心生物标志物，并通过ROC曲线分析验证了它们的诊断效果。此外，还通过CIBERSORT评估了免疫细胞浸润情况。在通过盲肠结扎和穿刺（CLP）诱导的小鼠败血症模型中进一步验证了主要发现。

结果

从最初的3252个差异表达基因中，我们筛选出了10个候选LRGs。机器学习算法将这些基因缩小到三个核心生物标志物：SLC4A4、SLC16A4和CRYAB。这些生物标志物在训练组和独立验证组中均表现出一致的差异表达模式（SLC4A4下调，SLC16A4和CRYAB上调）。ROC分析证实了它们的强大诊断性能，AUC值均超过0.7。此外，这些生物标志物与特定的免疫细胞亚群（尤其是CD8⁺ T细胞和活化肥大细胞）存在显著相关性，表明它们在免疫失调中起作用。在CLP小鼠模型中的验证也证实了这三个基因在败血症肺组织中的显著失调。

结论

这项多学科研究确定了SLC4A4、SLC16A4和CRYAB作为有前景的败血症乳酰化相关诊断生物标志物。我们的发现揭示了乳酸代谢、表观遗传修饰和免疫功能障碍在败血症中的复杂相互作用，为早期诊断和机制研究提供了新的见解。

引言

败血症是全球重症患者的主要死亡原因之一。其特点是发病机制复杂、疾病进展迅速以及临床预后具有高度异质性，长期以来一直是急诊医学和重症监护医学领域的重要研究课题。统计数据显示，2017年全球共有4800万例败血症病例，死亡率为22.5%，占全球死亡人数的19.7% [1,2]。然而，诊断延迟和缺乏有效的靶向治疗导致了败血症的治疗效果不佳。尽管近年来临床实践指南不断更新，但基于传统指标（如败血症相关器官功能衰竭评估（SOFA）评分、procalcitonin（PCT）和C-反应蛋白（CRP）的诊断系统仍存在灵敏度不足和特异性有限的问题。这种系统无法满足精准医疗中“早期识别和早期干预”的需求。因此，寻找具有病理生理相关性的新生物标志物仍是败血症研究的关键重点 [3,4]。

翻译后修饰（PTMs）是精确调控细胞活动的重要机制。最近发现的赖氨酸乳酰化揭示了代谢、表观遗传学和免疫反应之间相互作用的新范式。与传统修饰类型不同，乳酰化直接由乳酸这一代谢副产物驱动。这种修饰涉及将乳酰基团引入组蛋白和非组蛋白的赖氨酸残基上，从而直接改变染色质结构、转录因子活性或信号蛋白功能。因此，它被描述为连接“代谢和表观遗传学”的桥梁 [5,6]。在代谢应激（如败血症）条件下，细胞优先进行有氧糖酵解（“Warburg效应”），导致细胞内和全身乳酸积累。这种高乳酸环境显著促进了组蛋白的乳酰化水平，进而激活了与免疫和修复相关的基因表达程序 [7]、[8]、[9]。例如，在巨噬细胞中，乳酰化可以直接驱动关键基因的表达，促进从促炎型M1表型向修复型M2表型的转变，这一过程对决定炎症反应的轨迹至关重要 [10]。因此，在败血症的复杂病理生理过程中，乳酰化被认为是一个核心的分子开关。通过整合代谢信号和表观遗传调控，它可能深度参与免疫细胞的功能重编程、“细胞因子风暴”的放大和消退以及器官损伤的进展 [11]。然而，关于败血症中乳酰化调控基因的全基因组表达谱、这些网络中的关键调控节点以及乳酰化标记或相关基因作为诊断生物标志物的潜力，目前仍缺乏系统的理解。

生物信息学和机器学习技术的快速发展为复杂疾病中生物标志物的高效筛选开辟了新的途径。通过整合败血症患者的多组学数据，可以利用加权基因共表达网络分析（WGCNA）和差异表达分析等生物信息学方法初步识别与乳酰化相关的候选分子。进一步应用机器学习算法可以评估和优化这些候选生物标志物的诊断性能，显著提高筛选过程的准确性和效率。然而，生物信息学预测仍需严格的实验验证以确保其临床适用性。这种“数据挖掘→实验验证”的研究范式已成为当代转化医学的核心策略。

基于此背景，我们的研究提出了科学假设：乳酰化相关基因在败血症中发生显著改变，可能作为潜在的诊断生物标志物和治疗靶点。为了验证这一假设，我们设计了一项结合生物信息学、机器学习和实验验证的综合研究。我们的目标是：（1）系统地筛选与乳酰化相关的差异表达基因；（2）使用多种机器学习算法识别核心生物标志物并评估其诊断价值；（3）深入研究这些生物标志物与免疫细胞浸润之间的关系；（4）最终使用临床前动物模型验证这些生物标志物的表达及其与组织损伤的关联。这项研究可能为败血症的早期预警和机制理解提供新的见解。

部分摘录

败血症数据集的获取

败血症数据集来自基因表达组学（GEO）数据库（http://www.ncbi.nlm.nih.gov/geo/）。GSE236713数据集（GPL16791平台）被指定为训练集，而GSE28750数据集（GPL570平台）作为验证集。经过数据处理后，训练集最终包括125名败血症患者和30名健康对照组，验证集包括10名败血症患者和20名对照组。

差异表达分析和候选基因的获取

GSE236713数据集（GPL16791平台）作为训练集，包含125名败血症患者和30名健康对照组。GSE28750数据集（GPL570平台）作为验证集，包含10名败血症患者和20名健康对照组。

从GeneCards数据库中共获得了161个乳酰化相关基因。对GSE236713数据集的分析确定了3252个差异表达基因（DEGs），其中2636个上调，616个下调

讨论

早期和精确地诊断败血症以及对病理机制的深入理解对于改善患者预后至关重要。传统的生物标志物由于灵敏度和特异性有限，未能满足临床需求。本研究聚焦于乳酰化这种新兴的翻译后修饰形式。与以往仅关注单一乳酰化靶点或途径的研究不同，我们采用了综合框架

CRediT作者贡献声明

钱海翔：撰写——原始草稿、可视化、验证、方法学、正式分析。黄晨乐：可视化、验证。孟建康：可视化、验证。孙朝瑞：撰写——审稿与编辑。聂世楠：撰写——审稿与编辑、撰写——原始草稿。薛翔：撰写——审稿与编辑、撰写——原始草稿、可视化、验证。

利益冲突声明

作者声明他们没有已知的可能会影响本文研究的财务利益或个人关系。

联系信箱：

粤ICP备09063491号

摘要

背景

方法

结果

结论

引言

部分摘录

败血症数据集的获取

差异表达分析和候选基因的获取

讨论

CRediT作者贡献声明

利益冲突声明

热点排行