基于机器学习的慢加急性肝衰竭无偏聚类分析揭示酸碱平衡指标对预后的关键影响

《Nature Communications》:Unbiased clustering of acute-on-chronic liver failure patients using machine learning in a real-world ICU cohort

【字体: 时间:2026年01月21日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对慢加急性肝衰竭(ACLF)这一高死亡率综合征的异质性问题,利用非负矩阵分解(NMF)机器学习算法对1256例北美终末期肝病研究协会(NACSELD)定义的ICU患者进行无监督聚类分析。研究发现两个具有显著不同30天死亡率(70.35% vs 26.06%)的亚型,并首次揭示碳酸氢盐、pH值、碱剩余和阴离子间隙等酸碱平衡变量是主要聚类驱动因素。该模型在欧洲肝病学会-慢性肝衰竭联盟(EASL-CLIF)定义队列、失代偿期肝硬化队列和外部验证队列中均表现一致,为ACLF精准分型和预后评估提供了新视角。

  
在重症医学领域,慢加急性肝衰竭(ACLF)始终是临床医生面临的严峻挑战。这种在慢性肝病基础上急性加重的综合征,短期死亡率高达50%以上,但其异质性极强,不同患者临床表现和预后差异显著。更复杂的是,全球三大肝病学会——欧洲肝病学会-慢性肝衰竭联盟(EASL-CLIF)、北美终末期肝病研究协会(NACSELD)和亚太肝病学会(APASL)对ACLF的定义各不相同,导致风险分层和个体化治疗面临巨大困难。
传统上,ACLF的严重程度评估主要依赖器官衰竭(OFs)的数量和类型,如CLIF-C ACLF评分系统。但这些方法基于先验临床假设,可能忽略疾病背后的复杂相互作用机制。随着真实世界大数据和人工智能技术的发展,无监督机器学习为探索ACLF的内在异质性提供了新思路。
在此背景下,西安交通大学、美国西达赛奈医学中心和多国研究团队联合在《Nature Communications》发表了重要研究成果。研究人员创新性地应用无监督机器学习方法,对真实世界ICU中的ACLF患者进行无偏聚类分析,成功识别出两个具有显著不同临床特征和预后的亚型,并意外发现酸碱平衡指标在ACLF分型中的核心作用。
研究采用的关键技术方法包括:基于MIMIC-IV和eICU数据库构建多中心真实世界队列;使用非负矩阵分解(NMF)等五种聚类算法进行患者分型;通过分区围绕中心点模糊聚类(PAC)算法确定最佳聚类数;采用t-SNE进行降维可视化;通过随机森林算法识别死亡率预测因子;并在EASL-CLIF定义队列、失代偿期肝硬化队列和独立外部队列中进行全面验证。
确定最佳聚类模型
研究纳入1256例符合NACSELD标准的ACLF患者,收集50个临床和实验室变量。通过比较五种NMF算法,发现所有算法一致确定最佳聚类数为2。其中Lee算法在六个评估指标上表现最优,被选为最终聚类模型(命名为Lee-2)。聚类一致性矩阵显示清晰非重叠边界,证明结果稳定性。
亚组分析揭示显著差异
t-SNE可视化显示两个聚类虽有部分重叠,但大多数数据点明显分离。生存分析发现两个聚类30天死亡率差异显著:聚类1为70.35%,聚类2为26.06%。而传统器官衰竭分级(2个、3个、4个OFs)的死亡率分别为45.05%、62.86%和69.05%。多变量Cox回归显示,Lee-2模型在死亡率预测上优于传统OFs分类方法。
关键聚类因素分析
研究发现前十大聚类贡献变量中,酸碱平衡相关指标占据重要地位:碳酸氢盐(聚类1 vs 聚类2: 18.25 vs 23.00 mEq/L)、pH值(7.31 vs 7.38)、碱剩余(-6.00 vs -0.25 mEq/L)和阴离子间隙(19.50 vs 13.88 mEq/L)。此外,聚类1在去甲肾上腺素使用量(6.44 vs 0.58)、肌酐(2.38 vs 1.00 mg/dL)和乳酸(3.40 vs 2.10 mmol/L)方面显著更高。
器官衰竭分布差异
两个聚类在器官衰竭类型上呈现不同模式:聚类1肾脏衰竭(32.85% vs 10.92%)和循环衰竭(84.01% vs 62.50%)更常见;而聚类2呼吸衰竭比例更高(77.33% vs 90.85%),但进一步分析发现聚类1实际呼吸功能障碍更严重,表现为更低的中位PO2/FiO2比值和更多比例的患者比值低于100 mmHg。
多队列验证一致性
研究在EASL-CLIF定义的ACLF队列(1411例)中验证,两个聚类30天死亡率分别为69.0%和27.0%,关键聚类变量分布与原始队列一致。在失代偿期肝硬化队列(1334例)中,两个聚类死亡率分别为73.4%和31.7%,进一步证明模型在更广泛人群中的适用性。外部独立验证队列也证实了模型的稳定性和可靠性。
随机森林分析死亡率预测因子
整体和亚组分析均识别出INR、PT、PTT、胆红素和体温是重要的死亡风险预测因子。亚组分析显示,聚类1中乳酸、PO2、SpO2、去甲肾上腺素和SBP是显著风险因素;而聚类2中ALT、钠、RBC、BUN和RDW是重要预测因子。
研究结论强调,这种无监督机器学习方法成功识别了ACLF的两种不同亚型,具有显著不同的死亡风险和病理生理特征。特别重要的是,研究首次系统揭示了酸碱平衡指标在ACLF分型和预后中的关键作用,为理解ACLF的代谢调控机制开辟了新视角。研究人员还开发了在线分类工具(https://aclf-clustering.streamlit.app/),帮助临床医生快速判断患者亚型。
这项研究的创新之处在于首次将无偏聚类分析应用于ACLF异质性研究,突破了传统基于器官衰竭数量的分类局限,揭示了酸碱平衡这一此前被忽视的重要维度。研究结果在多个定义标准和不同队列中得到验证,具有较强的临床适用性和推广价值,为ACLF的精准医疗奠定了基础。未来研究可进一步探索针对不同亚型的个性化治疗策略,特别是酸碱平衡调节在改善预后中的潜在价值。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号