《BMC Cardiovascular Disorders》:Machine learning prediction of cardiovascular disease risk progression from sulfur dioxide exposure in longitudinal population studies in China
编辑推荐:
空气污染物与心血管疾病关联研究:基于CHARLS和CHAP数据库的多变量回归及机器学习模型分析表明,二氧化硫(SO?)浓度每增1单位,心脏病风险比(OR=1.040,95%CI 1.027-1.054,p<0.00001)。随机森林模型AUC最佳(训练0.794,测试0.726),SHAP分析证实SO?影响最大,且与户籍类型存在显著交互效应(p<0.05)。建议深入探索SO?致心肌损伤机制并优化预测模型应用。
摘要
心血管疾病(CVD)是一个全球普遍存在的健康问题,也是导致死亡的主要原因之一。年龄增长和空气污染是公认的心血管疾病风险因素。本研究旨在探讨空气污染物(二氧化硫、一氧化碳、PM1、PM2.5、二氧化氮、臭氧)与心脏病风险之间的关联。利用中国健康与退休纵向研究(CHARLS)和中国高空气污染(CHAP)数据库的数据,我们采用多变量调整的逻辑回归方法来分析这些污染物与心脏病之间的关系。此外,还使用了六种二元分类机器学习算法——AdaBoost、决策树(Decision Tree)、LightGBM、XGBoost、随机森林(Random Forest)和GBDT——来构建预测模型。这些模型以空气污染物浓度(如SO?、CO、PM1等)为核心特征,并结合了性别、年龄和高血压等协变量。数据被分为80%的训练集和20%的测试集,并通过交叉验证来确保模型的稳健性。多变量回归分析显示,在调整了包括BMI、血糖和其他污染物在内的多个协变量后,SO?浓度每增加1个单位,患心脏病的风险比(OR)为1.040(95%置信区间[CI]:1.027–1.054,p?0.00001)。在各种机器学习模型中,随机森林的表现最佳,其在训练集上的AUC为0.794,在测试集上的AUC为0.726。SHAP分析证实SO?是影响最大的污染物。亚组分析表明SO?与户籍类型之间存在显著交互作用(p?0.05)。未来的研究应进一步探讨SO?引起心脏损伤的机制,并优化预测模型的适用性。
心血管疾病(CVD)是一个全球普遍存在的健康问题,也是导致死亡的主要原因之一。年龄增长和空气污染是公认的心血管疾病风险因素。本研究旨在探讨空气污染物(二氧化硫、一氧化碳、PM1、PM2.5、二氧化氮、臭氧)与心脏病风险之间的关联。利用中国健康与退休纵向研究(CHARLS)和中国高空气污染(CHAP)数据库的数据,我们采用多变量调整的逻辑回归方法来分析这些污染物与心脏病之间的关系。此外,还使用了六种二元分类机器学习算法——AdaBoost、决策树(Decision Tree)、LightGBM、XGBoost、随机森林(Random Forest)和GBDT——来构建预测模型。这些模型以空气污染物浓度(如SO?、CO、PM1等)为核心特征,并结合了性别、年龄和高血压等协变量。数据被分为80%的训练集和20%的测试集,并通过交叉验证来确保模型的稳健性。多变量回归分析显示,在调整了包括BMI、血糖和其他污染物在内的多个协变量后,SO?浓度每增加1个单位,患心脏病的风险比(OR)为1.040(95%置信区间[CI]:1.027–1.054,p?0.00001)。在各种机器学习模型中,随机森林的表现最佳,其在训练集上的AUC为0.794,在测试集上的AUC为0.726。SHAP分析证实SO?是影响最大的污染物。亚组分析表明SO?与户籍类型之间存在显著交互作用(p?0.05)。未来的研究应进一步探讨SO?引起心脏损伤的机制,并优化预测模型的适用性。