生活方式与膳食因素对类风湿关节炎因果效应的整合研究:孟德尔随机化、机器学习与疾病负担动态及健康不平等评估

《Food Science & Nutrition》:Causal Effects of Lifestyle and Dietary Factors on Rheumatoid Arthritis: An Integrated Analysis Combining Mendelian Randomization, Machine Learning, and Evaluation of Burden Dynamics and Health Inequality

【字体: 时间:2026年02月24日 来源:Food Science & Nutrition 3.8

编辑推荐:

  本文整合了孟德尔随机化(MR)、机器学习(ML)和全球疾病负担(GBD)数据分析,系统性探究了生活方式与膳食因素对类风湿关节炎(RA)的因果影响、个体风险预测及全球疾病负担趋势。研究发现肥胖、吸烟、失眠、禽肉摄入和额外食盐是RA的显著风险因素,而从不吸烟、摄入猪肉和奶酪则具有保护作用。基于随机森林(RF)算法构建的预测模型性能优异,年龄是关键预测因子。全球RA负担呈现性别与地区差异,且预计将持续增长至2050年,主要受人口增长和老龄化驱动。该研究为RA的精准预防、高危人群筛查及公共卫生政策制定提供了多维度证据。

  
1 引言
类风湿关节炎(RA)是一种以对称性多关节炎为主要临床表现的慢性自身免疫性疾病,全球患病率在0.24%至1%之间。随着疾病进展和年龄增长,RA导致的慢性疼痛和关节畸形对生活质量和生产力的影响日益加剧,已成为严峻的公共卫生挑战。尽管RA的确切病因尚不完全清楚,但大量证据表明,生活方式因素(如吸烟、肥胖、睡眠障碍)和饮食习惯(包括高盐摄入、微量营养素摄入)是影响RA发病和进展至关重要的可调节因素。然而,现有研究多基于观察性设计,难以得出确切的因果结论,限制了其发现的可靠性。
孟德尔随机化(MR)分析作为随机对照试验的有力补充,通过遗传工具变量评估暴露对特定结局的因果效应,可有效减少观察性研究中的混杂偏倚。在此基础上,整合来自美国国家健康与营养检查调查(NHANES)的高质量、大规模、具有全国代表性的数据,开发多种机器学习(ML)预测模型,有望提升RA的早期识别和个性化干预能力。同时,明确RA在人群层面的负担差异具有重要意义。2021年全球疾病负担(GBD)研究提供了发病率、患病率和伤残调整生命年(DALYs)等关键指标,是评估RA在不同地区、不同人群间疾病负担差异和健康不平等现象的重要依据。因此,本研究创新性地整合了MR方法、NHANES数据和GBD数据库,系统性地评估了生活方式与膳食因素对RA发病的因果影响,并分析了其在全球层面的疾病负担特征,为RA的早期干预、精准预防和策略制定提供了理论与数据支持。
2 方法
本研究构建了一个整合多源数据的三阶段分析框架,以系统评估生活方式、膳食因素与RA之间的潜在因果关系,并探讨疾病负担趋势与健康不平等。
2.1 研究设计
首先,采用单变量双样本MR方法,分析了42个暴露因素与RA的因果关系。这些因素涵盖了身体质量指数(BMI)、不同级别的肥胖、吸烟、饮酒和咖啡摄入、额外食盐、体力活动、久坐行为和失眠等生活方式因素,以及红肉、鱼类、蔬菜、水果、乳制品摄入,和铜、镁、钾、叶酸、维生素A、B6、B12、C、D、E等微量营养素摄入。其次,将与RA显著相关的因素优先纳入基于NHANES数据的预测模型。通过最小绝对收缩和选择算子(LASSO)回归进行关键变量筛选,并构建和评估9种ML模型的性能,利用SHAP(Shapley Additive Explanations)方法解释特征重要性。第三,引入健康不平等评估,结合前沿分析、分解分析和贝叶斯年龄-时期-队列(BAPC)模型,动态评估RA的疾病负担,识别不同人群间的健康不平等特征及其驱动因素,并预测未来30年的负担变化趋势和潜在改善空间。
2.2 数据来源与统计分析
MR分析所需数据来自公开的IEU开放全基因组关联研究(GWAS)数据库。研究筛选了满足MR三大核心假设的单核苷酸多态性(SNP)作为工具变量(IVs),主要采用逆方差加权(IVW)法进行推断,并以MR-Egger回归、加权中位数法等作为补充。同时进行了敏感性分析以评估结果的稳健性。
机器学习策略基于NHANES(2007-2014年)四个周期的数据,共8446名参与者(RA患者823人,非RA者7623人)。通过LASSO回归筛选变量后,纳入了7个变量用于模型开发。为处理类别不平衡问题,采用了类别权重调整策略。研究评估了随机森林(RF)、梯度提升决策树(GBDT)、XGBoost、LightGBM(LGBM)、极端随机树(ET)等9种ML算法,并以受试者工作特征曲线下面积(AUROC)为主要评估指标。
全球疾病负担与健康不平等分析的数据来源于GBD研究。计算了1990年至2021年RA年龄标准化患病率(ASPR)和DALYs率(ASDR)的估计年度百分比变化(EAPC)。采用社会人口指数(SDI)评估不同发展水平国家和地区的RA负担差异,并通过斜率不平等指数(SII)和集中指数(CI)量化健康不平等程度。此外,还应用了前沿分析、分解分析和BAPC模型来评估负担动态并预测至2050年的趋势。
3 结果
3.1 生活方式和膳食因素与RA的因果关系
通过双样本MR分析,共纳入了3674个与生活方式和膳食因素相关的SNP。所有SNP的F统计量均大于10,排除了弱工具变量的影响。IVW方法的结果显示,BMI(OR=1.299)、2级肥胖(OR=1.100)、当前吸烟(OR=2.100)、失眠(OR=1.747)、禽肉摄入(OR=1.881)以及额外食盐(OR=1.657)与RA风险呈显著正相关。相反,从不吸烟(OR=0.555)、猪肉摄入(OR=0.413)和奶酪摄入(OR=0.733)与RA风险降低显著相关。敏感性分析未检测到异质性或水平多效性。
3.2 基于机器学习的RA风险预测
基于NHANES数据,LASSO回归最终筛选出7个关键变量:年龄、性别、家庭贫困收入比(PIR)、BMI、吸烟状况、是否存在睡眠障碍以及膳食镁摄入量。在评估的9种机器学习模型中,随机森林(RF)模型表现最优,其测试集的AUROC达到0.908,并在敏感性(0.661)和特异性(0.923)之间取得了最佳平衡,F1分数为0.558。决策曲线分析表明,RF模型在约2%至40%的风险阈值范围内提供了正的临床净收益。
利用SHAP方法对最优的RF模型进行解释发现,年龄是对预测影响最大的因素,具有最强的正向贡献。女性、镁摄入不足、存在睡眠障碍、BMI异常、吸烟以及较低的PIR与较低的RA预测风险相关。部分依赖图进一步揭示了这些变量与预测结果之间的非线性关系。
3.3 RA负担的全球趋势与健康不平等
2021年,全球RA患病人数达1792万,DALYs为308万。1990年至2021年间,ASPR和ASDR均呈上升趋势。年龄和性别特异性分析显示,2021年RA患病和DALYs的高峰年龄组分别为55-59岁和65-69岁,且女性负担显著高于男性。病例数最高的地区是东亚,而过去30年间ASR增长最快的地区是安第斯拉丁美洲。在国家层面,中国、印度和美国的病例数最高,而患病率和DALYs率增长最快的国家分别是赤道几内亚和巴林。
健康不平等分析显示,SII从1990年的22.65/10万增至2021年的24.02/10万,CI在同期为负值,表明不同SDI水平国家间的RA负担存在绝对和相对不平等。前沿分析表明,许多低SDI国家的ASDR更接近前沿线,而高SDI国家如爱尔兰、新西兰等与前沿存在较大差距。分解分析指出,1990年至2021年间全球RA负担的增加主要归因于人口增长(56.89%)和人口老龄化(45.13%),流行病学变化贡献为-2.03%。基于BAPC模型的预测表明,到2050年,全球RA患病和DALYs预计将持续增长,分别达到2111万和336万,且女性负担依然更重。
4 讨论
本研究首次建立了一个系统化、多层次的分析框架,从因果推断、风险预测和负担评估多个维度,全面探究了生活方式与膳食因素在RA发生发展和流行病学中的作用。MR分析为生活方式、膳食暴露与RA之间的关联提供了更稳健的因果证据。机器学习模型则基于NHANES个体数据,验证并扩展了因果推断发现的实用性,构建了有效的RA风险预测工具。GBD数据分析从人群层面揭示了疾病负担与健康不平等,形成了从因果识别到风险预测再到负担预估的闭环研究路径。
MR分析提示,肥胖可能通过诱导低度全身性炎症和促炎细胞因子水平升高来增加RA风险。吸烟是明确的RA风险因素,其风险在戒烟后仍可能持续数年。失眠与RA的正向关联,可能与RA活动期关节疼痛、功能限制及药物使用有关,但有效治疗失眠也可能改善患者的炎症相关功能损伤。过量盐摄入可能激活促炎通路,加剧自身免疫性疾病中的炎症反应。因此,促进公众身体活动意识、实施戒烟干预可作为RA的一级预防和非药物策略,改善睡眠质量和限制盐摄入则可作为支持性干预手段。
研究发现猪肉摄入与RA风险呈负相关,而禽肉摄入呈正相关,这与强调禽肉、限制红肉的地中海饮食框架有所不同。猪肉可能通过锌、硒、B族维生素等营养素发挥保护作用。禽肉的正面关联则可能与高温油炸、重调味等烹饪方式促进慢性炎症反应有关。MR中使用的遗传工具通常反映个体对某类食物的长期摄入倾向,而非具体的加工方式。此外,研究还观察到奶酪摄入对RA的保护性关联,这可能归因于奶酪中的益生菌成分。
在机器学习预测模型中,通过LASSO回归筛选出的7个变量均与RA的流行病学和生物学机制一致。SHAP分析显示年龄是最具影响力的预测因子,可能与年龄相关的免疫细胞功能衰退有关。尽管镁摄入在MR分析中未显示明确的因果关系,但在预测模型中成为重要因素,提示其可能通过调节炎症介质等非遗传机制影响RA风险。
全球RA负担存在显著的性别和年龄差异,女性及老年人群负担更重。不同地区间的负担差异可能与吸烟、肥胖等生活方式因素、环境污染暴露以及遗传易感性有关。健康不平等和前沿绩效分析表明,部分低SDI国家与前沿线的差距较小,可能部分反映了其医疗基础设施和疾病监测能力的局限性。预测显示至2050年全球RA负担将持续增长,凸显了在全球范围内实施综合RA控制策略的紧迫性。
5 结论
本研究利用MR分析识别了与RA存在因果关联的生活方式与膳食因素,并开发了高效的个体水平RA风险预测模型。全球负担分析揭示了RA相关疾病负担的性别差异和健康不平等。未来RA的预防与控制策略应聚焦于高危人群的针对性生活方式干预和营养优化,重点关注BMI管理、戒烟、改善睡眠和健康饮食实践。此外,将RA的一级预防整合到慢性病管理中,建立“预防-筛查-控制”的综合框架,可能是减轻全球RA负担的一条可行路径。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号