基于脂肪酸、氨基酸谱与临床特征联合筛选,构建肥胖与2型糖尿病的诊断模型

《Diabetes, Metabolic Syndrome and Obesity》:Diagnostic Model for Obesity and Type 2 Diabetes Mellitus Based on Feature Selection from Fatty Acids, Amino Acids, and Clinical Characteristics

【字体: 时间:2026年03月04日 来源:Diabetes, Metabolic Syndrome and Obesity 2.8

编辑推荐:

  本文通过整合血清脂肪酸、氨基酸谱与临床特征,运用LASSO、RFE、RF等多种机器学习算法联合筛选,成功构建了一个基于7个关键特征(Ala, His, Gln, IL-10, 年龄, FBG, AHR)的支持向量机(SVM)诊断模型。该模型在训练集与验证集中均表现出卓越的区分效能(AUC分别为0.998和0.958),不仅为肥胖与2型糖尿病(T2DM)的精准诊断提供了新工具,也揭示了Ala、His、Gln与抗炎因子IL-10在两者共同病理机制中的潜在作用,提示了新的治疗靶点。

  
摘要
肥胖与2型糖尿病(T2DM)是两种普遍存在的代谢性疾病,共享复杂的病理生理机制,严重危害人类健康。本研究旨在从脂肪酸、氨基酸和临床特征中筛选关键指标,建立针对这两种疾病的诊断模型。
材料与方法
这项前瞻性研究纳入了山西省中医院代谢疾病门诊的139名患者,包括33名健康对照者、81名肥胖患者和25名T2DM患者(其中7人同时患有肥胖)。研究收集了患者的人体测量学和实验室数据。利用液相色谱-串联质谱(LC-MS/MS)法检测了血清中的氨基酸和脂肪酸水平。所有样本按7:3的比例被随机分为训练集和测试集。在训练集中,首先通过单变量逻辑回归分析从所有变量中筛选出与疾病诊断显著相关的变量。随后,联合使用最小绝对收缩和选择算子(LASSO)、递归特征消除(RFE)和随机森林(RF)三种算法,从这些显著变量中进一步筛选最优特征变量。最后,基于筛选出的最优特征,使用支持向量机(SVM)算法构建诊断模型,并在训练集和验证集中评估其性能,以受试者工作特征曲线下面积(AUROC)作为主要评价指标。
结果
  1. 1.
    差异变量筛选:在最初检测的63个变量中,有54个在对照组、肥胖组和T2DM组之间存在显著差异。值得注意的是,与健康对照组相比,肥胖或T2DM患者的血清丙氨酸(Ala)水平显著升高(p值分别为5.1e-14和1.3e-12),而肥胖与T2DM患者间的Ala水平无显著差异(p值=0.67)。
  2. 2.
    最优特征选择:单变量逻辑回归分析确定了44个与疾病诊断显著相关的变量。LASSO、RFE和RF算法分别筛选出17、10和16个最优变量,三种算法的交集最终确定了7个共同的最优特征变量:丙氨酸(Ala)、组氨酸(His)、谷氨酰胺(Gln)、白细胞介素-10(IL-10)、年龄、空腹血糖(FBG)和腹臀比(AHR)。
  3. 3.
    诊断模型性能:基于这7个特征构建的SVM诊断模型表现优异。在训练集中,模型的综合AUC值高达0.998;在独立的验证集中,模型的AUC值也达到了0.958,显示出强大的泛化能力和稳健的诊断性能。
  4. 4.
    特征水平比较与相关性:与健康对照组相比,肥胖或T2DM患者的血清Ala水平和AHR值显著升高,而Gln、His和IL-10水平则显著降低。此外,糖尿病患者的年龄和FBG水平也更高。相关性分析进一步揭示,Ala水平与AHR呈正相关(相关系数Cor = 0.602, p值 < 0.001),而Gln和His的水平均与IL-10水平呈正相关(Cor分别为0.46和0.48, p值 < 0.001)。
讨论
本研究首次整合脂肪酸、氨基酸和临床特征,并运用机器学习算法,成功构建了一个基于7个特征变量的肥胖与T2DM诊断模型。该模型在训练集和验证集中均取得了优于以往多数报道的AUC值,这可能归因于多维特征(氨基酸、炎性细胞因子、人体测量学参数和人口统计学因素)的全面整合以及LASSO、RFE、RF算法的严格联合特征筛选,确保了所选特征能充分捕捉两种疾病共享的病理生理特征。
从生物学机制角度看,本研究的发现与现有知识相互印证并提供了新见解。升高的Ala及其与AHR的正相关性,支持了Ala是这两种代谢紊乱的促成因素。血清His和Gln水平在患者中降低,提示它们可能在疾病病理生理中起抑制作用。尤其重要的是,Gln和His水平均与抗炎因子IL-10呈正相关,这暗示调节IL-10可能是Gln和His抑制肥胖与T2DM发展的一个潜在机制。此外,年龄、FBG和AHR这三个临床因素也证实了其诊断价值。这些结果表明,Ala、His、Gln和IL-10可能通过调节炎症参与肥胖和T2DM的共同潜在机制,有望成为治疗这两种疾病的新靶点。
当然,本研究也存在一些局限性,包括样本量有限(特别是T2DM样本)、需在更大的验证数据集中确认模型的诊断效能,以及机器学习得出的结果需要进一步的临床实验验证其功效并阐明更具体的下游机制。
结论
综上所述,本研究通过整合氨基酸、脂肪酸与临床特征,并借助机器学习算法,建立了一个基于7个特征变量(Ala, His, Gln, IL-10, FBG, 年龄, AHR)的肥胖与T2DM诊断模型。该模型具有优异的诊断性能,为理解两种疾病间的病理生理联系提供了新视角,并提示Ala、His、Gln和IL-10可能是有吸引力的治疗候选靶点。未来需要进一步的研究来提高模型的效能和准确性。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号