新技术专栏 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通 | 新技术专栏
生物通首页  >  新技术专栏  >  正文

开发并验证一种可解释的机器学习模型,该模型利用常规实验室生物标志物来识别常见的代谢性脂肪性肝病(MASLD):来自两项观察性研究的证据

《Clinical and Experimental Medicine》:Development and validation of an explainable machine learning model using routine laboratory biomarkers for identifying prevalent MASLD: Evidence from two observational studies

【字体: 大 中 小 】 时间:2026年05月17日 来源:Clinical and Experimental Medicine 3.5

编辑推荐:

  摘要尽管已经开发了许多用于预测代谢功能障碍相关脂肪性肝病(MASLD)的模型,但它们的性能仍然不尽如人意。我们的目标是开发一个基于机器学习(ML)的可解释性血浆生物标志物模型,以识别常见的MASLD。来自国家健康与营养调查(NHANES 2017–2020)的数据被随机分为训练队

摘要

尽管已经开发了许多用于预测代谢功能障碍相关脂肪性肝病(MASLD)的模型,但它们的性能仍然不尽如人意。我们的目标是开发一个基于机器学习(ML)的可解释性血浆生物标志物模型,以识别常见的MASLD。来自国家健康与营养调查(NHANES 2017–2020)的数据被随机分为训练队列(N = 2760)和内部队列(N = 1184)。使用了11种ML算法来构建分类模型。通过SHapley Additive exPlanations(SHAP)方法对模型可解释性进行了可视化展示。进一步使用韩国NHANES(KNHANES)2019–2021的数据对这些模型进行了外部验证。通过受限立方样条回归分析评估了选定特征与常见MASLD之间的关联。特征选择采用了LASSO回归和Boruta算法。关键预测因子包括糖尿病(DM)、腰围(WC)、年龄、高血压和血浆致动脉粥样硬化指数(AIP)。所有评估的ML算法都表现出强大的预测能力,曲线下面积(AUC)超过0.70。其中,Extra Trees(ET)的表现最好,在内部测试组中的AUC为0.879(95% CI 0.856–0.897),并在外部KNHANES队列中保持了良好的性能,AUC为0.822(95% CI 0.815–0.829)。DeLong测试显示ET与其他算法之间的AUC存在显著差异。这些发现表明,年龄、WC、DM、高血压和AIP是与常见MASLD相关的有信息量的特征。ET模型表现出强大的区分能力,可能成为MASLD筛查的实用工具。

图形摘要

此图像的替代文本可能是由AI生成的。

尽管已经开发了许多用于预测代谢功能障碍相关脂肪性肝病(MASLD)的模型,但它们的性能仍然不尽如人意。我们的目标是开发一个基于机器学习(ML)的可解释性血浆生物标志物模型,以识别常见的MASLD。来自国家健康与营养调查(NHANES 2017–2020)的数据被随机分为训练队列(N = 2760)和内部队列(N = 1184)。使用了11种ML算法来构建分类模型。通过SHapley Additive exPlanations(SHAP)方法对模型可解释性进行了可视化展示。进一步使用韩国NHANES(KNHANES)2019–2021的数据对这些模型进行了外部验证。通过受限立方样条回归分析评估了选定特征与常见MASLD之间的关联。特征选择采用了LASSO回归和Boruta算法。关键预测因子包括糖尿病(DM)、腰围(WC)、年龄、高血压和血浆致动脉粥样硬化指数(AIP)。所有评估的ML算法都表现出强大的预测能力,曲线下面积(AUC)超过0.70。其中,Extra Trees(ET)的表现最好,在内部测试组中的AUC为0.879(95% CI 0.856–0.897),并在外部KNHANES队列中保持了良好的性能,AUC为0.822(95% CI 0.815–0.829)。DeLong测试显示ET与其他算法之间的AUC存在显著差异。这些发现表明,年龄、WC、DM、高血压和AIP是与常见MASLD相关的有信息量的特征。ET模型表现出强大的区分能力,可能成为MASLD筛查的实用工具。

图形摘要

此图像的替代文本可能是由AI生成的。

订阅生物通快讯

订阅快讯:
免费订阅退订

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号