基于机器学习模型的公共营养教育项目流失预测研究:提升EFNEP项目参与率的新策略

《The Journal of Nutritional Physiology》:Predicting Attrition in a Public Nutrition Education Program: A Machine Learning Approach

【字体: 时间:2026年02月08日 来源:The Journal of Nutritional Physiology

编辑推荐:

  本研究针对美国扩展食品与营养教育计划(EFNEP)年均超过20%的参与者流失问题,开发了基于机器学习的前瞻性预测模型。研究团队通过分析2013-2022年全国339,335名成人参与者的数据,采用极端梯度提升(XGBoost)算法构建预测模型,实现了70%的召回率和0.68的F1分数。研究发现合作推广区域、资金层级和家庭收入等是关键预测因子,为营养教育项目的精准干预提供了数据支撑。

  
在美国公共卫生领域,一个持续存在的难题引起了研究者的关注:尽管联邦政府每年投入7000万美元资助"扩展食品与营养教育计划"(EFNEP),但这个旨在改善低收入家庭营养状况的重要项目,却长期面临着参与者流失的困扰。数据显示,2023年EFNEP的成人参与者流失率高达23%,相当于每年有超过1.1万人未能完成全部6-10次的课程,造成约300万美元的公共资源浪费。
这一现象背后隐藏着复杂的成因。既往研究表明,交通不便、育儿压力、家庭责任等实际困难,以及文化程度、对营养教育价值认知不足等知识障碍,都可能导致参与者中途退出。然而,传统的回顾性分析方法难以在项目早期精准识别潜在的流失风险,使得干预措施往往滞后于实际需求。
在这一背景下,南达科他州立大学管理经济学院的Rohini Daraboina等研究者开展了一项创新性研究,尝试将人工智能技术应用于营养教育领域。他们提出一个关键问题:能否在参与者刚加入项目时,就通过机器学习算法预测其流失风险,从而实现早期干预?这项研究成果近期发表在《The Journal of Nutritional Physiology》上。
研究团队采用了几项关键技术方法:通过信息自由法案请求获取2013-2022年全国EFNEP项目数据,包含339,335名成人参与者的27个变量;使用蒙特卡洛交叉验证(80/20训练测试分割)评估模型性能;比较逻辑回归、随机森林和XGBoost三种机器学习算法;采用基于对数损失的变量选择方法处理类别不平衡问题;通过SHAP分析解读预测因子间的交互作用。
研究结果
模型性能比较
XGBoost模型在预测性能上表现最优,测试集准确率达到0.65,F1分数为0.68,召回率为70%。相比之下,逻辑回归和随机森林的F1分数分别为0.65和0.67。值得注意的是,XGBoost在保持较高召回率的同时,实现了精度与特异性的最佳平衡,这对处理流失率约20%的类别不平衡问题尤为重要。
关键预测因子识别
通过变量重要性分析,研究者识别出前10位关键预测因子:合作推广区域(Cooperative Extension region)、EFNEP资金层级(funding tier)、入学年份、家庭收入、年龄、种族、居住地、子女数量、24小时膳食回顾中的食物种类数以及体力活动水平。其中程序特征因素(区域、资金层级)的影响强度超过了人口统计学因素。
预测因子交互作用
SHAP分析揭示了区域与资金层级间的显著交互作用。在西部和南部地区,参与资金层级较高(1-4级)项目的个体流失风险较低,而参与资金层级较低(5-7级)项目的个体风险升高。中北部和东北部地区则未观察到明显的资金层级交互效应。
与传统因素对比
研究发现,EFNEP核心评估的四个领域(膳食质量、食物资源管理、食品安全和食物安全)并未进入前10位预测因子,而基线体力活动水平和膳食摄入指标显示出更强的预测能力。较高的基线体力活动水平与较高的流失风险相关,而24小时膳食回顾中记录的食物种类较多则与较低的流失风险相关。
研究结论与讨论表明,机器学习模型在营养教育场景中的应用能够揭示传统方法难以发现的流失模式。特别值得注意的是,程序组织因素(区域差异、资金分配)对流失风险的影响超过了个体特征因素,这提示政策层面的调整可能产生更大影响。
该研究的实际意义在于为EFNEP administrators提供了数据驱动的决策支持。基于预测结果,项目可以考虑采取区域协作机制,让流失率较高的中北部和东北部地区向表现较好的西部和南部地区学习经验;同时优化资金分配策略,特别是加强对西部地区低资金层级项目的支持。
然而,研究者也指出模型的局限性。现有国家项目数据未能包含地方评估中已识别的某些关键因素(如交通、育儿等实际障碍),这可能影响模型的预测精度。此外,机器学习模型的"黑箱"特性要求必须结合项目专家的领域知识来解读结果,才能制定出有针对性的干预措施。
从更广阔的视角看,这项研究代表了人工智能在公共卫生项目优化中的创新应用。通过将预测分析技术引入营养教育领域,不仅为EFNEP项目的精准管理提供了新工具,也为其他类似公共教育项目的效果提升提供了可借鉴的方法论。未来研究可着重于验证预测因子的作用机制、探索未纳入数据集的潜在影响因素,以及开发将预测结果转化为具体干预措施的实施指南,从而真正实现"预测-干预-评估"的闭环管理,最大化公共营养教育项目的社会效益。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号