机器学习揭秘个体脂肪酸对全因死亡率的影响:超越传统脂肪分类的精准膳食评估

《Food Research International》:Machine learning assessment of individual fatty acids and related dietary factors on all-cause mortality risk

【字体: 时间:2026年02月14日 来源:Food Research International 8

编辑推荐:

  为厘清脂肪摄入与健康风险的争议,本研究基于NHANES大数据,采用机器学习生存模型,评估了19种个体脂肪酸(FAs)及相关膳食因素与美国成人全因死亡率的线性和非线性关联。研究发现,α-亚麻酸(PUFA 18:3)、二十二碳六烯酸(DHA)等特定脂肪酸具有保护作用,而棕榈油酸(MUFA 16:1)、硬脂酸(SFA 18:0)等则与风险升高相关。该研究凸显了超越SFA、MUFA、PUFA等宽泛分类,进行个体化FA评估对制定精准膳食建议的重要性。

  
长期以来,“脂肪”在公众营养认知中常常被简单地贴上“好”或“坏”的标签。传统膳食指南通常将脂肪酸(Fatty Acids, FAs)笼统地分为饱和脂肪酸(Saturated FAs, SFAs)、单不饱和脂肪酸(Monounsaturated FAs, MUFAs)和多不饱和脂肪酸(Polyunsaturated FAs, PUFAs),并普遍建议减少饱和脂肪的摄入。然而,随着科学研究的深入,这种“一刀切”的分类方式正面临挑战。越来越多的证据表明,即便是同一大类脂肪酸,其家族内的不同成员对健康的影响也可能大相径庭。例如,同为饱和脂肪,不同碳链长度的SFA其生理效应可能截然不同。同时,饮食本身是复杂的混合物,食物中各成分之间的相互作用远未被充分认识。因此,关于脂肪摄入,尤其是具体到每一种脂肪酸与长期健康结局(如死亡率)之间的关系,在科学界仍存在诸多争议和未解之谜。为了解开这些谜团,将膳食研究推向更精细、更个性化的层面,一项发表在《Food Research International》上的研究另辟蹊径,利用大数据和前沿的机器学习技术,深入探究了19种个体脂肪酸及相关膳食因素与美国成年人全因死亡率之间的复杂关联。
为了系统地回答上述问题,研究团队构建了一个探索驱动的机器学习生存建模框架。研究的核心数据来源于1988-2018年美国国家健康与营养调查(National Health and Nutrition Examination Survey, NHANES)中58,929名成年参与者的数据,这些数据与来自美国国家死亡指数(National Death Index, NDI)的死亡率结局相关联。研究采用了两种数据集:子数据集A(仅包含19种个体脂肪酸及人口统计学变量)和子数据集B(在A的基础上增加了能量、蛋白质、膳食纤维、胆固醇、维生素等可能与之交互的膳食因素)。在此基础上,研究人员应用了三种模型进行对比分析:两种惩罚性的Cox比例风险回归模型(分别采用LASSO和自适应弹性网AENET惩罚)以评估线性及平方项关联,以及随机生存森林(Random Survival Forests, RSF)模型以捕捉变量间复杂的非线性关系和交互作用。研究还通过最小深度、变量重要性度量(VIMP)和SHAP值等方法评估了各变量的预测重要性,并绘制了蜘蛛图可视化不同摄入百分位下的死亡风险比(Hazard Ratios, HRs)。
研究结果
3.1. 识别影响死亡率最重要的脂肪酸和膳食因素
通过随机生存森林模型评估变量重要性发现,无论是在仅包含脂肪酸的模型(3A)还是在包含全部膳食因素的模型(3B)中,血清可替宁(吸烟标志物)都是预测死亡风险的最重要因素。在脂肪酸中,棕榈油酸(MUFA 16:1)、花生四烯酸(PUFA 20:4)、硬脂酸(SFA 18:0)和棕榈酸(SFA 16:0) consistently 显示出较高的重要性排名。当加入其他膳食因素后,维生素A、钠、膳食纤维和视黄醇也成为重要的预测变量。SHAP值分析进一步揭示了这些变量的作用方向:较高的棕榈油酸(MUFA 16:1)、硬脂酸(SFA 18:0)和棕榈酸(SFA 16:0)摄入与死亡风险增加相关;而较高的收入贫困比(PIR)、α-亚麻酸(PUFA 18:3)、二十碳烯酸(MUFA 20:1)和膳食纤维摄入则与风险降低相关。
3.2. 死亡率风险:膳食因素摄入模式下的风险比
惩罚性Cox回归和随机生存森林模型的结果总体一致,揭示了个体脂肪酸作用的异质性。
  • 具有保护作用的因素:在仅含脂肪酸的模型中,二十碳烯酸(MUFA 20:1)、α-亚麻酸(PUFA 18:3)、二十碳五烯酸(EPA, PUFA 20:5)、二十二碳五烯酸(DPA, PUFA 22:5)、短链饱和脂肪酸(shortSFA,为4:0至14:0 SFA的总和)以及油酸(MUFA 18:1)的较高摄入与较低的死亡风险相关。在包含全部膳食因素的模型中,除了上述多数脂肪酸,二十二碳六烯酸(DHA, PUFA 22:6)也显示出保护作用。在所有模型中,膳食纤维 consistently 是最具保护性的膳食因素。
  • 具有危害作用的因素:棕榈油酸(MUFA 16:1)、硬脂酸(SFA 18:0) consistently 与死亡风险增加相关。值得注意的是,棕榈酸(SFA 16:0)在仅含脂肪酸的模型中显示出危害性,但在调整了其他膳食因素(模型B)后,其危害性大幅减弱甚至消失。在添加的膳食因素中,胆固醇淀粉类蔬菜的摄入与风险升高显著相关。棕榈油酸(MUFA 16:1)还表现出U型关联,即在摄入量非常低或非常高时风险增加,风险最低点出现在第5至第25百分位数之间。
3.3. 风险比的统计显著性
通过bootstrap法计算风险比(HR5th→95th)及其90%置信区间,并评估显著性概率。分析确认了几个具有高置信度的核心发现:
  • 危害性因素:胆固醇在所有模型中均显示出显著的有害效应(概率>90%)。棕榈油酸(MUFA 16:1)在仅含脂肪酸的模型中危害显著,但在全模型中置信区间略跨过1。硬脂酸(SFA 18:0)和淀粉类蔬菜也显示出较强的有害信号。
  • 保护性因素:膳食纤维、二十碳烯酸(MUFA 20:1)和α-亚麻酸(PUFA 18:3)在所有模型和数据集中均表现出显著的保护效应(概率>90%)。短链饱和脂肪酸(shortSFA)也显示出保护性,但其显著性稍弱。
3.4. 敏感性分析
一系列敏感性分析(包括处理缺失数据、评估方差膨胀因子、多重检验校正、亚组分析、排除已有疾病参与者等)表明,主要研究结论是稳健的,模型性能在不同人群亚组和不同数据处理方式下保持稳定。
结论与讨论
本研究通过整合大型队列数据和先进的机器学习生存模型,成功地将膳食脂肪与健康关系的研究从传统的宽泛分类推进到个体脂肪酸层面。核心结论强调,对脂肪酸的健康效应评估需要超越“饱和脂肪有害、多不饱和脂肪有益”的简单范式。
研究发现,同为饱和脂肪酸,长链的硬脂酸(SFA 18:0)与死亡风险增加相关,而中短链饱和脂肪酸(SFA 4:0-14:0)的总和却显示出保护作用。在多不饱和脂肪酸内部也存在异质性:α-亚麻酸(ALA)和二十二碳六烯酸(DHA) consistently 表现有益,而花生四烯酸(AA)的作用则不确定,模型结果存在矛盾。在单不饱和脂肪酸中,棕榈油酸(MUFA 16:1)表现出明显的危害性,而二十碳烯酸(MUFA 20:1)则 consistently 具有保护作用。这些发现清晰地表明,将脂肪酸按大类加和评估可能会掩盖其内部成员截然不同的生物学效应。
此外,研究强调了在膳食背景中评估营养素的重要性。例如,棕榈酸(SFA 16:0)的负面效应在考虑整体饮食结构后减弱,提示其危害可能与其他共存的不利膳食因素有关,而非其独立作用。同时,膳食纤维的保护作用和胆固醇、淀粉类蔬菜的危害作用在所有模型中均非常突出, reaffirming 了已知的健康膳食原则。
在方法论上,研究对比了线性模型(惩罚性Cox回归)和非线性模型(随机生存森林)。两者结论大体一致,验证了核心发现的可靠性。同时,RSF模型也揭示了一些线性模型未能捕捉的复杂关系(如MUFA 16:1的U型曲线),展现了机器学习在挖掘高维、交互式数据中的独特价值。
这项研究的意义在于,它为未来的营养流行病学研究和公共卫生政策制定提供了新的视角和工具。它呼吁在膳食指南和个性化营养建议中,逐步考虑特定脂肪酸而非大类的作用。通过采用数据驱动的机器学习方法,研究者能够更精细地剖析复杂饮食模式与健康结局之间的黑箱,朝着实现真正精准营养的目标迈出了重要一步。研究结果提示,优化脂肪摄入的质量——即关注具体脂肪酸的种类和来源,而不仅仅是总量或大类——可能对降低人群死亡风险具有关键意义。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号