基于SHAP-UMAP监督聚类的MASLD亚群与CKD新发风险的精准分层研究

《Hepatology Research》:Exploring a Subpopulation of MASLD Associated With New Onset of CKD Using Supervised Clustering Techniques

【字体: 时间:2026年01月28日 来源:Hepatology Research 3.4

编辑推荐:

  本综述创新性地应用SHAP(SHapley Additive exPlanations)转换矩阵与UMAP(uniform manifold approximation and projection)监督聚类技术,对代谢功能障碍相关脂肪性肝病(MASLD)人群进行表型异质性解析。研究发现MASLD可被划分为3个特征迥异的亚群,其中伴有致动脉粥样硬化血脂谱、高脂肪酸肝指数(FLI)及高尿酸血症的肥胖亚组(集群7)是新发慢性肾脏病(CKD)的最高风险群体。该研究为基于机器学习(ML)的CKM(心血管-肾脏-代谢)综合征风险精准防控提供了新策略。

  
引言
代谢功能障碍相关脂肪性肝病(MASLD)是心血管-肾脏-代谢(CKM)综合征的重要组成部分,其与新发慢性肾脏病(CKD)的关联日益受到关注。然而,MASLD患者群体存在显著的异质性,这种异质性对CKD发生风险的影响尚不明确。传统无监督聚类方法的结果往往存在重叠且难以解释。本研究旨在利用一种名为“监督聚类”的新型机器学习方法,结合SHAP(SHapley Additive exPlanations)值转换矩阵,探索MASLD的亚群划分,并评估各亚群与新发CKD的关联。
研究方法
研究纳入了2006年在日本札幌一处诊所接受年度健康检查的12,168名受试者(男性/女性:7927/4241,平均年龄48岁),基线均无CKD。主要终点为10年随访期间新发CKD(定义为估算肾小球滤过率eGFR < 60 mL/min/1.73 m2或尿蛋白阳性)。
研究的核心分析流程包括两大步骤:首先,利用所有可用数据(12,168样本 × 41个特征)进行监督聚类以识别独特亚群。具体而言,先使用CatBoost模型对SLD(脂肪性肝病)的原始分类进行预测,然后计算SHAP值,将原始特征矩阵转换为SHAP矩阵,以最大化簇的纯度。随后,比较多种降维技术(PCA、t-SNE、UMAP等)结合不同聚类算法(k-means、HDBSCAN、GMM)的效果。最终,基于轮廓系数等指标,确定最优方案为使用SHAP转换矩阵进行UMAP降维,再采用高斯混合模型进行聚类。
研究结果
1. MASLD亚群的识别与特征
GMM分析将总人群划分为10个亚群,其中MASLD患者被清晰地分为3个亚群(集群5、6、7)。富集分析显示:
  • 集群5(瘦型MASLD):以相对较低的体重指数(BMI)、腰围(WC)、血压以及较高的高密度脂蛋白胆固醇(HDL-C)为特征。
  • 集群6(肥胖型MASLD):具有较高的BMI、WC、血压和甘油三酯(TG)水平。
  • 集群7(高危肥胖型MASLD):在集群6的基础上,表现出更严重的肥胖指标、致动脉粥样硬化血脂谱(如低HDL-C、高小而密低密度脂蛋白胆固醇sdLDL-C)、更高的脂肪酸肝指数(FLI)以及高尿酸血症。
基于SHAP值的特征重要性分析进一步揭示,FLI和尿酸水平是预测高危集群7的关键因素。
2. MASLD亚群与新发CKD的风险关联
Kaplan-Meier生存曲线分析显示,三个MASLD亚群的新发CKD累积发生率存在显著差异。集群5的风险最低,与部分非SLD人群相近;集群6和集群7的风险显著升高,且集群7的风险最高。
多变量Cox比例风险模型在校正了年龄、性别、eGFR、高血压、糖尿病和血脂异常后,与集群5相比,集群7发生CKD的风险比(HR)仍显著升高(HR 1.256, 95% CI 1.005–1.569)。即使进一步校正具体血脂指标,集群7的高风险依然存在。
3. 高危亚群的预测与临床工具开发
研究人员构建了CatBoost模型来预测高危集群7,该模型表现出色(AUC = 0.984)。SHAP依赖图显示,BMI、WC、FLI、丙氨酸氨基转移酶(ALT)、血糖等因素对预测集群7的贡献呈单调递增趋势,而HDL-C和尿酸则呈现U型曲线效应,提示其影响的复杂性。
为了便于临床转化,研究还开发了一个列线图,整合了年龄、性别、是否属于集群7、糖尿病、高血压和基线eGFR,用于个体化预测患者1年、5年和10年的CKD无病概率。
讨论与结论
本研究首次成功应用SHAP-UMAP监督聚类技术,在MASLD人群中识别出具有不同CKD风险的临床相关亚型。研究结果表明,MASLD并非同质性疾病,其内部存在显著的异质性,特别是伴有肥胖、高FLI和高尿酸血症的亚群(集群7)是新发CKD的极高危群体。这提示对于MASLD患者的管理应采取精准分层策略,对该高危亚群需加强肾脏功能的监测与早期干预。FLI和血尿酸水平可作为识别这类高危个体的重要生物标志物。本研究为理解MASLD的异质性及其与CKD的复杂关系提供了新的视角,并为未来开展针对特定MASLD表型的精准预防和治疗研究奠定了基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号