人口健康的生态框架：将公众信任作为影响美国预期寿命和COVID-19死亡率的驱动因素

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Public Health in Practice》：The ecological framework of population health – Adding public trust as a forcing factor for U.S. life expectancy and COVID-19 mortality

【字体：大中小】 时间：2026年05月04日 来源：Public Health in Practice 1.9

编辑推荐：

　　罗斯竞技场|王帅杰|科林·伍德亚德|坦维·巴特|尼古拉斯·P·普朗克伊利诺伊大学芝加哥分校物理治疗系，美国伊利诺伊州芝加哥 **摘要** **研究目的** 是什么因素决定了美国（U.S.）的健康状况和结果？这个复杂的问题很少被全面地考虑过。本研究采用人工智能分

　　罗斯竞技场|王帅杰|科林·伍德亚德|坦维·巴特|尼古拉斯·P·普朗克
伊利诺伊大学芝加哥分校物理治疗系，美国伊利诺伊州芝加哥

**摘要**
**研究目的**
是什么因素决定了美国（U.S.）的健康状况和结果？这个复杂的问题很少被全面地考虑过。本研究采用人工智能分析方法，评估在人口健康生态框架中加入社会资本（即公众信任）这一指标，对预测美国县级预期寿命和COVID-19死亡率的有效性。

**研究设计**
描述性、横断面、回顾性分析。

**方法**
本研究使用了多个美国县级数据集，这些数据集代表了人口健康生态框架，包括文化、政治、政策、社会经济状况、生活方式行为以及慢性疾病风险因素和诊断等信息。此外，还加入了一个基于社交媒体生成的社会资本指数（即公众信任）作为跨领域变量，以确定其在预测县级预期寿命和COVID-19死亡率方面的有效性。研究采用了非线性人工智能统计方法。

**结果**
分析显示，公众信任指数在预测预期寿命（R2 = 0.803）和COVID-19死亡人数（R2 = 0.548）方面具有显著意义。最佳模型分别使用了27个和12个特征。在最终模型中，公众信任指数分别位列第五和第六重要的预测因素。

**结论**
本研究通过展示从社交媒体帖子中提取的公众信任指标的潜在效用，并将其整合到人口健康生态框架中，扩展了探索影响人口健康因素的研究领域，有助于预测美国重要的县级健康结果。

**1. 引言**
是什么因素决定了美国（U.S.）的健康状况和结果？这是一个复杂的问题，在当前的公共卫生环境中很少被全面考虑[1]。在慢性非传染性疾病的背景下，健康监测、公共卫生举措和医疗服务主要集中在不良健康行为上——缺乏运动、不良饮食和吸烟是主要的不利行为[2]。旨在改变不健康生活方式行为的公共卫生信息和医疗干预措施随后将注意力转向从健康风险因素到慢性疾病的线性序列[3]。此外，这种反应性的二级预防模式主要是管理而非预防不健康的生活方式行为、风险因素和慢性疾病[2]。
为了实现向积极的一级预防的转变——所有利益相关者都认为这是改善人口健康的关键——我们需要更好地理解影响健康行为的因素；是什么促使个人或社区中的某些群体选择某种健康行为而非另一种？人口健康生态框架有助于探讨这一问题[4]。该框架提出了影响健康行为的顺序性因素，其中文化、政治、政策和社会经济状况被视为核心驱动因素。框架还提出了两个重要的贯穿主题：权力动态和社会资本[4]。关于该框架的详细介绍已发表[4]，随后的人工智能分析对其提出的上游影响因素进行了初步验证[5]。
人口健康生态框架是一个不断发展的模型，目前正在进行评估，以确定代表关键驱动因素的指标。Giorgi等人[6]使用基于语言的通用信任评估方法，分析了2009年至2015年间收集的16亿多条推文，创建了美国县级的公众信任指数。公众信任被广泛认为是社会资本的基础要素和主要指标，社会资本“表现为人们在多元社会中集体生活的关系网络”[4]。公众信任具体代表了人们相信个人、群体和机构会以可预测和公平的方式行事，从而促进社会的良好运作[7]。与信任相关的词汇与疾病控制中心收集的健康改善指标相关[6]。一个有效的公众信任指标可以为Pronk等人[4]开发的人口健康生态框架增添重要的预测价值。本研究采用人工智能分析方法，评估在人口健康生态框架中加入基于社交媒体生成的公众信任指数后，对预测美国县级预期寿命和COVID-19死亡率的有效性。

**2. 方法**
本研究使用了多个美国县级数据集来实现研究目标。表1列出了研究中使用的独立变量和因变量的来源数据。通过所有数据集中都有的邮政编码标识符将这些来源数据链接起来，创建了一个用于分析的合并数据集。表1中列出的四层美国国家模型的定义特征如下：
- **积极社区主义地区**建立了强大的机构、社会服务，并通过较高的财富、收入、财产和商业税收来资助监管环境；
- **被动社区主义地区**在这些方面的建设程度较低；
- **积极个人主义地区**的机构较少且较弱，监管制度也较弱，提供的公共服务也较少；
- **被动个人主义地区**在这些方面较为灵活，但仍力求保持公共部门的精简。
所有用于本研究的数据集均可通过表1提供的链接公开获取，并可以通过每个数据集中的FIPS代码进行合并。

**表1. 独立变量和因变量的来源数据**

**独立变量分组及具体指标**
| 分组 | 指标 |
|---------------|-----------------------------------------------------------------------------|
| 美国国家模型 | 4个层次分组：
| | • 积极个人主义（南部深处和大阿巴拉契亚）
| | • 被动个人主义（远西部）
| | • 被动社区主义（中部地区、埃尔诺特）
| | • 积极社区主义（扬基领地、新尼德兰、左海岸和原住民地区） |
| | https://www.nationhoodlab.org/the-american-nations-and-the-50-states/
| | https://osf.io/jxsz8/overview?view_only=968233c39a594d14bed3f201b24ec0f8 |
| 公众信任 | 使用计算语言学分析量化个体和县的通用信任 |
| | https://osf.io/ap8rx/overview |
| 政治 | 2022年MRP意识形态指数 |
| | https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/BQKU4M |
| 2020年美国总统选举投票年龄在18岁及以上的公民比例 | https://www.countyhealthrankings.org/health-data/methodology-and-sources/data-documentation |
| 政策 | 2019-2022年国内生产总值 |
| | https://www.bea.gov/data/gdp/gdp-county-metro-and-other-areas |
| 2020年人口普查中自我回答的所有家庭比例 | https://www.countyhealthrankings.org/health-data/methodology-and-sources/data-documentation |
| 2021年公民机会指数 | https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/TCXRTM |
| 社会、物理和经济环境 | 2022年社会脆弱性指数子主题得分（1-4） |
| | https://www.atsdr.cdc.gov/place-health/php/svi/index.html |
| 行为 | 2022年调整后的无休闲时间体力活动、吸烟、饮酒和睡眠时间短的比例（2024年发布） |
| | https://www.cdc.gov/places/Health Risk Factors |
| 肥胖、糖尿病、高血压、高胆固醇、抑郁症、关节炎、认知障碍、任何残疾、频繁的心理和身体痛苦以及健康状况评分（2024年发布） | https://www.cdc.gov/places/Social Capital |
| 社会关联率 | 每10,000人口中的会员协会数量 |
| | https://www.countyhealthrankings.org/ |

**因变量分组及具体指标**
| 分组 | 指标 |
|---------------|-----------------------------------------------------------------------------|
| 结果 | 2020-2022年平均预期寿命（2025年发布） |
| | https://www.countyhealthrankings.org/health-data |
| 县级累计COVID死亡人数（每10万人） | https://healthdata.gov/Health/COVID-19-Community-Profile-Report/gqxm-d9w9/about_data |

**2.1. 主题保护**
Partners Institute研究主体保护计划确定，由于本研究涉及对现有公开数据集的分析，因此免于IRB审查和45 CFR Part 46的持续监督。

**2.2. 机器学习**
**2.2.1. 预处理**
在模型训练之前，进行了几个必要的预处理步骤，包括处理缺失数据、删除重复项、编码分类变量和缩放数值特征。在预测变量和结果中都检测到了缺失值。由于样本量（n = 1996）相对于特征数量（n = 32）足够大（每个特征有超过60个观测值），使用Pandas中的dropna函数删除了包含任何缺失值的样本。使用drop_duplicates函数检测并删除了重复项。经过这些步骤后，用于预期寿命和COVID死亡率预测的最终数据集分别为1919个样本。它们的县级分布和对应的直方图分别显示在图1和图2中。所有预测变量都使用StandardScaler方法进行了标准化，以确保数据尺度的一致性。尽管基于树的模型不需要特征缩放，但为了在初步分析中评估的各种候选模型之间保持一致性，所有预测变量都进行了标准化。

**2.2.2. 模型选择**
基于我们对所有32个特征的初步评估，选择了LightGBM作为主要算法。我们比较了六种广泛使用的机器学习回归器：支持向量机（SVM）回归器、Adaboost回归器、随机森林回归器、XGBoost回归器、LightGBM回归器和Extra trees回归器[[9], [10], [11], [12], [13], [14], [15]]。在这些模型中，LightGBM取得了最低的平均绝对误差（MAE），且没有过拟合的迹象。通过比较训练集和独立测试集上的表现来评估过拟合情况。模型在两个数据集上的MAE值相当，表明没有显著的过拟合。作为基于决策树算法的梯度提升框架，LightGBM以其高计算效率、低内存使用和强大的预测性能而著称，特别适合大规模数据集的回归任务。

**2.2.3. 模型训练**
数据集被分为训练集（70%）和测试集（30%）。使用随机搜索和5折交叉验证对LightGBM回归器进行了超参数优化，调整的参数包括树的数量、树的最大深度、学习率、叶子数量、L1正则化和数据实例的子采样比例以及列的子采样比例。最后三个参数有助于防止过拟合。每个模型都采用反向特征选择方法进行训练。从所有32个特征开始，逐步移除重要性最低的五个特征，直到只剩下七个特征。重要性分数是使用LightGBM的特征重要性属性计算得出的。这一过程保留了最具预测性的变量，同时逐步降低了维度，提高了模型的泛化能力和可解释性。

**2.2.4. 模型评估**
为了评估模型性能，计算了MAE（平均绝对误差）、均方根误差（RMSE）和决定系数（R2）。在保留的测试集上评估了最终模型的性能，以评估样本外的泛化能力。计算MAE和RMSE的公式如下：
MAE = 1/n ∑(yi ? ypred,i)
RMSE = 1/n ∑(yi ? ypred,i)2
其中ypred,i是第i个观测值的预测值，yi是实际值，n是样本总数。在这项工作中，MAE被用作评估和比较不同特征集（7到32，间隔为5）模型性能的主要指标。使用特征-MAE曲线选择了在不同特征数量下的最佳模型，并通过R2和RMSE进行了交叉验证。较低的MAE表示更好的预测性能，有助于识别在准确性和模型复杂性之间取得最佳平衡的模型。

**2.3. 特征重要性**
使用训练数据集计算了每个特征和特征交互作用的Shapley（SHAP）值[16]，并使用测试数据集计算了排列重要性[17]。SHAP分析量化了模型在生成预测时对每个预测因子的依赖程度。使用训练集而不是测试集来保持解释性的一致性，并准确反映模型编码的关系。相比之下，使用测试集估计排列特征重要性，以获得每个特征对模型泛化影响的无偏测量。对于每个特征，我们在保持其他特征不变的情况下改变了其值，从而得到排列重要性（即从模型中移除该特征信息后的预测性能下降）。

**3. 结果**
对于预期寿命，特征-MAE曲线表明，随着特征数量从7增加到27，然后从27减少到32，LightGBM模型的性能显著提高（图3a）。因此，选择了具有最佳性能的27特征模型作为预期寿命预测的最佳模型。对于COVID死亡率，随着特征数量从7增加到12，然后在12到27之间波动，模型性能也有显著提高（图3b）。因此，选择了具有最佳性能且复杂度较低的12特征模型作为COVID死亡率预测的最佳模型。R2和RMSE值也显示出类似的模式，进一步支持了最佳模型的选择（表2）。最优模型以粗体标示。特征 # 预期寿命 COVID死亡率 R2 RMSER2 RMSE 320.79 31.55 0.549 104.72 270.80 31.51 40.549 104.68 220.80 21.51 70.555 103.94 170.80 01.527 0.544 105.25 120.79 61.539 0.548 104.76 70.766 1.65 10.529 107.01 图例：COVID，冠状病毒疾病。最优预期寿命模型展示了强大的预测能力，解释了80.3%的方差（表2中的R2 = 0.803）。测试数据集中各个样本的实际值和预测值表现出很强的一致性（图4a），只有两个极端值（>90岁）显示出较大的差异。最优COVID死亡率模型的表现中等，R2为0.548（表2），表明该模型只能解释约55%的COVID死亡率方差。预测值和实际值之间也可能观察到较大的差异（图4b）。下载：下载高分辨率图片（488KB）下载：下载全尺寸图片图4. 实际结果与预测结果的比较 a) 最优预期寿命预测模型（特征数量=27），以及 b) 最优COVID死亡率（每10万人死亡数）预测模型（特征数量=12）。图例：COVID，冠状病毒疾病。特征重要性通过SHAP值（图5）和排列重要性（图6）进行评估。对于最优预期寿命模型和COVID死亡率模型，前5个特征在这两种方法中的排名相似，尽管SHAP是在训练集上计算的，而排列重要性是在测试集上计算的。对于最优预期寿命模型，前5个特征是高血压患病率、中风患病率、SVI-Subtheme 2、COPD患病率和公众信任指数。对于最优COVID死亡率模型，前5个特征是MRP意识形态指数、没有闲暇时间的身体活动患病率、频繁的身体不适患病率、SVI-Subtheme 2和关节炎患病率。只有SVI-Subtheme 2同时出现在预期寿命和COVID死亡率模型的前五名中，这表明预期寿命和COVID死亡率受不同特征的影响。值得注意的是，公众信任指数被包含在两个模型中，其SHAP值在预期寿命模型中排名第5，在COVID死亡率模型中排名第6（图6），表明公众信任在预测性能中起着重要作用。下载：下载高分辨率图片（603KB）下载：下载全尺寸图片图5. a) 最优预期寿命预测模型（27个特征中的前20个）和 b) 最优COVID死亡率预测模型（所有12个特征）的Shapley（SHAP）值。正的SHAP值表示对增加预测结果（更高的预期寿命或COVID死亡率）有贡献，而负的SHAP值表示对降低预测结果有贡献。较大的绝对Shapley值表示对模型输出有较大的影响。特征按平均绝对Shapley值降序显示。水平小提琴图表示训练集中所有样本的SHAP值分布。图例：BP，血压；COPD，慢性阻塞性肺疾病；COVID，冠状病毒疾病；GDP，国内生产总值；SVI，社会脆弱性指数。下载：下载高分辨率图片（384KB）下载：下载全尺寸图片图6. a) 最优预期寿命预测模型（特征数量=27）和 b) 最优COVID死亡率预测模型（特征数量=12）的排列特征重要性。较大的排列值表示对模型输出有较大的影响。特征按排列值降序显示。图例：BP，血压；COPD，慢性阻塞性肺疾病；COVID，冠状病毒疾病；GDP，国内生产总值；SVI，社会脆弱性指数。使用SHAP交互值估计了公众信任指数的交互效应。在最优预期寿命模型中，公众信任指数的SHAP交互值接近0，表明涉及公众信任指数的交互项对预期寿命预测的贡献很小。对于最优COVID-19死亡率模型，只有公众信任指数和MRP意识形态指数之间的交互显示出有意义的效果。如图7所示，这种交互显示当MRP意识形态指数较低时，较高的公众信任指数与较低的COVID-19死亡率相关，而当MRP意识形态指数较高时，较高的公众信任指数与较高的COVID-19死亡率相关。下载：下载高分辨率图片（420KB）下载：下载全尺寸图片图7. 公众信任指数与其他特征之间交互作用的最优COVID死亡率预测模型的最高Shapley（SHAP）交互值。图例：COVID，冠状病毒疾病。4. 讨论整个美国的健康状况，从人口层面的公共卫生努力到个人、从业者与患者之间的医疗服务互动，都将从新的视角中受益。鉴于关于健康行为、慢性疾病和预期寿命的令人不安的监测数据，有充分的理由采用新的方法来扭转长期趋势，并基于当前的趋势进行未来预测[[18]，[19]，[20]，[21]，[22]]。当前研究中评估的《人口健康生态框架》[4]为这一复杂问题提供了一种必要且新颖的方法，对该研究领域做出了重要贡献。为了开发更好的健康信息和传递方法，有必要识别出健康行为上游的重要驱动因素，并为当前和未来的从人口到个人层面的状况奠定基础。《人口健康生态框架》[4]通过识别不同的美国区域文化来解释观察到的区域政治、政策和社会经济地位的差异[1，[23]，[24]，[25]]，从而为此做出了贡献。这些驱动因素被认为会促进下游的生活方式健康行为，当这些行为不利时，会显著增加慢性疾病的风险并降低预期寿命。两个因素，权力动态和社会资本，可能影响框架的每个阶段。框架各层次之间的复杂互动不适合线性预测评估，这就是为什么我们采用了复杂的人工智能分析来测试该框架的潜在预测能力[5,26]。通过识别一些驱动美国健康的因素，我们希望为健康信息和干预模型的重新构想做出贡献。然而，这项工作仍处于初级阶段，该框架需要进一步探索和完善，以确定最有用的驱动因素及其影响的测量方法。Giorgi等人[6]着手“量化”美国个人和县的“普遍信任”。为了创建一个公众信任指数，他们评估了超过16,000名Facebook用户的言语观察结果以及一个普遍信任得分（自我报告）。然后，他们的团队使用这些数据分析了2009年至2015年间产生的超过16亿条带有地理标签的推文，对美国2000多个县的公众信任进行了估计。在县级层面，Giorgi等人[6]发现，在个人级别的推文中包含更多积极语言（如“爱、我们和朋友们”）且较少负面语言（如“仇恨和愚蠢”）的地方，普遍信任最高。通过绘制可用县的地图，作者展示了相对社会信任的明显区域模式。利用县级CDC监测数据，作者发现较高的信任与较长的寿命和较低的自我评估健康状况、肥胖率和吸烟率显著相关。作者得出结论，这项工作提供了一个有效的模型，可以用来在人口层面上跟踪美国的普遍信任。当前分析将Giorgi等人[6]提出的普遍信任度量的验证和潜在价值扩展到了预测人口健康结果的领域。公众信任度量与某些健康行为和结果之间的初步相关性支持了Giorgi及其同事的发现[6]。鉴于这些关系的复杂性，孤立的线性回归和相关性无法正确衡量这些因素的相互作用，因此无法确定因果关系。在这里，使用了一种复杂的人工智能方法来全面评估《人口健康生态框架》结合所提出的普遍信任度量在预测县级预期寿命和COVID-19死亡率方面的能力。这些发现表明，这种公众信任度量为生态框架的两个评估结果都增加了显著的预测价值。特别是在县级预期寿命方面，它在最终模型中的排名是27个预测因子中的第5位。这个预期寿命模型还包括了来自所有生态框架类别的测量指标，其预测准确率超过了80%。虽然COVID-19死亡率模型也具有显著性，但其最佳预测准确率为55%，表明存在其他未识别的因素。值得注意的是，政治意识形态和普遍公众信任都是COVID-19死亡率的重要预测因子。较低的COVID-19死亡率明显与较高的疫苗接种率相关[27]，这受到政治观点和对联邦政府公共卫生信息传递的信任的影响[28]。我们的发现进一步支持了公众信任与政治意识形态之间的这些观察到的联系。实际上，就COVID-19死亡率而言，公众信任指数和MRP意识形态指数之间的交互作用是当前分析中唯一的显著观察结果。这表明应在政治归属和观点的背景下进一步探索地区间的公众信任差异。此外，缺乏身体活动与不良的COVID-19结果有关[29]，以至于CDC将这种不健康的生活方式行为认定为COVID-19感染者的一个重要风险[30]。本研究发现，缺乏身体活动是仅次于政治意识形态的第二重要的COVID-19死亡率预测因子。尽管国家已经度过了COVID-19健康危机，但在未来可能发生的病毒大流行中仍有重要的经验教训需要学习。当前研究的发现可能为如何应对未来的健康危机和优化结果提供见解。十年前的先前工作强调了社交媒体在健康监测和推广方面的潜在价值。2014年，Young[31]强调了使用社交媒体“大数据”追踪健康行为的潜在价值和局限性。Young指出，未来使用社交媒体“大数据”进行健康监测和干预需要：1) 跨学科的合作团队；以及2) 大规模、易于获取且定期更新的数据集。最近的出版物综合回顾了支持使用社交媒体帖子进行健康行为评估的证据，发现它们作为一个总体概念仍然具有前景[32]，尽管在应用中仍存在挑战（例如，来自帖子类型和可接受性对频率和内容的影响的估计偏差[33]）。2022年，Hunt和Linos[34]呼吁CDC和其他州和地方机构“继续优化并严格评估社交媒体在健康促进中的使用”。当前分析评估了社交媒体的总体积极或消极态度作为公众信任指标预测美国县级重要健康结果的能力。这种方法与Pronk等人[4]的《人口健康生态框架》非常一致，在该框架中，文化差异和观点是下游健康行为和结果的基础。虽然多年来人们一直对社交媒体内容在追踪和影响健康行为方面的效用感兴趣，但Young[31]提出的“大数据”监测机制尚未实现。未来需要努力标准化和验证能够有意义地捕捉人口层面健康行为重要预测因子的社交媒体指标。一旦开发出来，应在美国（例如县级）每年测量社交媒体指标，并与其他健康监测数据相结合。跨学科团队可以使用这些综合数据集进一步提高健康监测的准确性，并构思出更有效的针对独特区域/社区特征的公共卫生信息宣传活动。除了使用社交媒体内容进行人口层面健康监测外，通过这一平台提供健康干预的机会也非常重要。证据表明，社交媒体健康干预具有潜力[35,36]，尽管需要更多的研究来确定最佳的交付和信息传递模式。当前研究中评估的公众信任指数为确定社交媒体健康干预的优化提供了示例，因为信息传递的有效性可能会因地区文化、信仰系统和观点而异。需要探索在区域/社区层面产生共鸣的社交媒体信息传递方式——一种适用于所有情况的社交媒体健康干预方法不太可能成功。鉴于当前分析的发现，探索如何开发能够与社交媒体消极程度较高、公众信任较低的美国地区产生共鸣的健康信息和干预措施尤为重要。当前研究存在一些固有的局限性。首先，只有1919个县拥有足够的公众信任数据，可以纳入分析。图1展示了数据可用性差距最为明显的地区。尽管我们的发现表明通过社交媒体来衡量公众信任具有潜在的价值，但未来需要使用更完整的县级数据集来验证此处提出的结论。此外，公众信任指数是基于2009年至2015年间收集的社交媒体数据得出的，这为美国各地区的评估提供了一个历史视角，而当前研究中使用的其他独立和依赖性指标的数据收集时间是在2019年至2023年之间。然而，公众信任指数很可能反映了类似于美国国家文化框架[8]中的行为模式。主导区域文化的核心价值观和规范并不会每年、每十年甚至每百年发生根本性变化。在这种情况下，假设有助于解释区域差异（即公众信任）的潜在价值观在十年时间跨度内并不会在不同地区之间发生显著变化。然而，为了进一步理解在人口健康背景下衡量公众信任的重要性，需要进行更新的计算。2014年，Young[31]提出应将社交媒体模式的人口层面数据及时提供并定期更新，类似于其他专注于健康的联邦机构目前收集的监测数据集。本研究通过展示公众信任作为社会资本的一种衡量方式的潜在效用（这种信任是从社交媒体帖子中得出的，并整合到人口健康生态框架[4]中），来预测美国县级层面的重要健康结果（本例中为预期寿命和COVID-19死亡率）。未来需要使用扩展和更新的数据集进行进一步分析，以优化该模型在人口健康监测和信息传播中的应用。

作者声明：所有作者均可以访问数据。RA准备了手稿的初稿。RA和SW负责数据分析。所有作者对手稿草稿提供了重要的修订和新内容。

伦理声明：HealthPartners研究所的研究对象保护计划确定，由于本研究涉及对现有公开数据的分析，因此无需经过IRB审查和45 CFR Part 46规定的持续监督。

资金来源：无。

联系信箱：

粤ICP备09063491号

热点排行