《Frontiers in Nutrition》:Combined analysis of the triglyceride–glucose index and melanin-concentrating hormone in metabolic dysfunction–associated fatty liver disease: a machine learning–based study
编辑推荐:
本文结合机器学习方法,系统探讨了血清黑色素浓集激素(MCH)与甘油三酯-葡萄糖(TyG)指数在代谢相关脂肪性肝病(MAFLD)风险预测中的独立与关联作用。研究发现二者均是MAFLD的独立危险因素,并构建了性能优异的逻辑回归预测模型(测试集AUC达0.926),为MAFLD的早期、无创风险分层提供了新思路。
背景与目的
代谢相关脂肪性肝病(Metabolic dysfunction-associated fatty liver disease, MAFLD)是一种全球高发的肝脏疾病,既往被称为非酒精性脂肪性肝病(Non-alcoholic fatty liver disease, NAFLD)。作为代谢综合征的关键肝脏表现,MAFLD与肥胖、胰岛素抵抗(IR)密切相关,并可独立增加肝硬化和肝细胞癌的风险。然而,肝脏活检作为诊断金标准具有侵入性,而瞬时弹性成像等无创技术(如受控衰减参数CAP)的准确性又受到体重指数(BMI)等多种因素影响,在肥胖患者中应用受限。因此,寻找便捷、低成本、可靠的无创生物标志物对MAFLD的早期筛查和风险分层至关重要。在此背景下,本研究旨在探讨血清黑色素浓集激素(Melanin-concentrating hormone, MCH)和甘油三酯-葡萄糖(Triglyceride-glucose, TyG)指数与MAFLD的关联,并利用机器学习方法开发预测模型,以识别高风险个体。
研究方法
本研究在遵义医科大学附属医院健康管理中心开展,为一项横断面研究,共纳入319名参与者,其中212名MAFLD患者和107名健康对照。MAFLD的诊断依据2020年国际专家共识,需结合肝脏脂肪变性的影像学证据(本研究中通过腹部超声评估)及至少一项代谢异常(如超重/肥胖、2型糖尿病或特定代谢风险因素)。研究人员收集了参与者的人口统计学、临床指标及空腹血样,检测了包括肝功能、血脂、空腹血糖(FPG)、空腹胰岛素(FINS)和血清MCH水平在内的多项指标。计算了稳态模型评估的胰岛素抵抗指数(HOMA-IR)和TyG指数(计算公式:TyG = ln[(TG (mg/dL) × FPG (mg/dL))/2])。研究将数据集按8:2随机分为训练集和测试集。通过LASSO回归和方差膨胀因子(VIF)分析进行特征选择,最终确定了五个预测变量:MCH、TyG指数、BMI、高密度脂蛋白胆固醇(HDL-C)和天冬氨酸氨基转移酶/丙氨酸氨基转移酶比值(AST/ALT)。随后,使用训练集构建了三种机器学习预测模型:逻辑回归(Logistic Regression, LR)、随机森林(Random Forest, RF)和支持向量机(Support Vector Machine, SVM)。通过五折交叉验证进行内部验证,并在独立测试集上评估模型性能。模型的区分度通过受试者工作特征曲线下面积(AUROC)、准确性、敏感性、特异性、F1分数等指标评估;校准度通过Brier评分和校准曲线评估;决策曲线分析(Decision Curve Analysis, DCA)用于评估临床净获益。此外,研究还进行了多变量逻辑回归分析以确定MAFLD的独立危险因素,并按性别、年龄、BMI进行亚组分析,探讨MCH与MAFLD关联的稳健性。最后,通过中介分析探究了TyG指数在MCH与MAFLD关联中的潜在中介作用。
研究结果
- 1.
基线特征:与健康对照组相比,MAFLD患者年龄更大、男性比例更高,且具有显著更高的BMI、血压、FPG、ALT、AST、TG、HOMA-IR、TyG指数和血清MCH水平,而HDL-C水平显著更低。
- 2.
模型构建与性能:基于五个关键变量构建的三种机器学习模型中,逻辑回归模型表现最佳。在训练集中,其AUC为0.939 (95% CI: 0.884–0.968),Brier评分为0.088;在独立测试集中,AUC为0.926 (95% CI: 0.865–0.957),Brier评分为0.108,均优于随机森林和支持向量机模型,展现出优异的区分度和校准度。决策曲线分析表明,逻辑回归模型在广泛的阈值概率范围内具有最高的临床净获益。
- 3.
可视化与风险因素:基于最优的逻辑回归模型,研究构建了列线图,将MCH、TyG指数、BMI、HDL-C和AST/ALT五个变量的贡献可视化,便于临床计算个体患MAFLD的风险概率。多变量逻辑回归分析证实,MCH和TyG指数是MAFLD的独立危险因素,其比值比(OR)分别为1.35和2.43。而较高的HDL-C水平和AST/ALT比值则是保护性因素。
- 4.
亚组与中介分析:按性别、年龄和BMI分层的亚组分析显示,MCH与MAFLD的正向关联在所有亚组中均保持一致且显著,未发现显著的交互作用。这提示MCH对MAFLD的风险效应在不同人群中具有稳健性。中介分析进一步揭示,TyG指数在MCH与MAFLD的关联中起到了部分中介作用,中介比例约为10.89%。这表明MCH可能部分通过影响胰岛素抵抗(以TyG指数表征)来增加MAFLD风险。但交互作用分析未发现MCH与TyG指数对MAFLD风险存在显著的协同或拮抗效应。
讨论与意义
本研究首次在临床人群中联合探讨了循环MCH与TyG指数对MAFLD的预测价值。MCH是一种由下丘脑分泌的神经肽,在动物研究中已被证实可促进摄食、降低能耗、诱导肥胖和胰岛素抵抗,并能通过影响固醇调节元件结合蛋白-1c(SREBP-1c)等通路直接促进肝脏脂肪生成。TyG指数则是评估全身性胰岛素抵抗的简便、有效指标。研究发现二者均是MAFLD的独立风险标志物,且逻辑回归模型展现出卓越的预测性能。这提示,整合反映中枢能量调节(MCH)和外围代谢状态(TyG指数)的指标,可能更全面地捕获MAFLD的复杂病理生理网络。尽管中介效应比例不大,但仍支持了MCH可能部分通过加剧胰岛素抵抗来促发肝脂肪变性的假说。研究构建的列线图为临床医生和营养师提供了一个直观、实用的初步筛查工具,有助于在资源有限的情况下,优先识别出需要进一步深入检查(如肝脏弹性扫描)或强化生活方式干预的高风险个体。然而,本研究作为单中心横断面研究,无法确定因果关系,且模型缺乏外部验证。未来需要在更大规模、多中心的前瞻性队列中进行验证,并探索MCH在MAFLD发生发展中的具体分子机制,以评估其作为治疗靶点的潜力。
结论
综上所述,血清MCH水平和TyG指数均与MAFLD独立相关。基于此构建的机器学习(逻辑回归)预测模型具有良好的区分度、校准度和临床实用性,为MAFLD的早期无创风险分层提供了新的潜在工具。该模型可在临床或营养筛查场景中作为辅助决策工具,帮助优化资源配置,但其在广泛人群中的适用性仍需更大规模的前瞻性研究加以验证。