《Scientific Reports》:Integrating body composition analysis and machine learning for non-invasive identification of metabolic dysfunction-associated fatty liver disease: a large-scale health examination-based study
编辑推荐:
本研究针对代谢相关脂肪肝病(MAFLD)在常规健康体检中早期识别困难的临床挑战,研究人员通过整合体成分参数与机器学习算法,开发了一种非侵入性诊断模型。通过对23,348名体检者的大规模数据分析,发现内脏脂肪评级是最关键指标,基于树模型的算法曲线下面积达0.96以上。该研究为MAFLD的基层筛查提供了高效工具,对公共卫生防控具有重要意义。
随着生活方式改变和肥胖率上升,代谢相关脂肪肝病(MAFLD)已成为全球最常见的慢性肝病之一。这种疾病与肥胖、胰岛素抵抗和代谢综合征密切相关,但早期诊断面临巨大挑战。在常规健康体检场景中,传统肝功能指标往往难以有效识别肝脏脂肪变性,而肝活检作为金标准又因侵入性难以普及。这种诊断困境导致大量患者错过早期干预时机,如何通过简便、无创的方法实现MAFLD的精准筛查,成为临床和公共卫生领域亟待解决的问题。
针对这一痛点,研究团队开展了一项基于大规模健康体检数据的研究,探索体成分参数在MAFLD识别中的价值,并构建机器学习诊断模型。该研究近日发表在《Scientific Reports》期刊,为MAFLD的早期筛查提供了新思路。
研究人员主要运用了三大方法:首先采用生物电阻抗分析(BIA)技术对体成分进行精确测量,包括内脏脂肪评级、肌肉量等参数;其次基于多中心健康体检队列,纳入2017-2021年期间23,348名成年人的数据作为训练集,并设置2022-2023年的3,357人作为独立验证队列;最后构建了八种机器学习算法进行比较,通过十折交叉验证和外部验证确保模型稳健性。
特征选择与模型构建
通过多重共线性诊断和特征重要性分析,从13个初始特征中筛选出最具预测价值的指标。极端梯度提升(XGBoost)、梯度提升决策树(GBDT)和LightGBM等树模型表现最优。
模型性能验证
内部验证中曲线下面积(AUC)均超过0.96,外部验证AUC保持在0.95以上,准确率、召回率和F1分数均显示模型具有出色的判别能力。
关键预测因子识别
内脏脂肪评级 consistently 被识别为最重要的预测因子,其次是腰围和体重指数(BMI)。逻辑回归分析在调整混杂因素后证实了这些指标的独立预测价值。
亚组分析结果
分层分析显示模型在不同性别、年龄和BMI亚组中均保持稳定性能,内脏脂肪在各亚组中都是最稳健的预测指标。
研究结论表明,体成分参数特别是内脏脂肪评估,对MAFLD具有强大的诊断区分能力。将机器学习与常规体检数据相结合,能够实现MAFLD的准确、无创识别,为临床诊断和人群筛查提供了可扩展的解决方案。这项研究的创新之处在于将常用的体成分测量指标与先进算法结合,在保持方法简便性的同时大幅提升诊断效能,对优化健康体检流程、实现慢性肝病早期防控具有重要实践意义。