机器学习方法识别中国上海成年人孤独感的性别特异性风险和保护因素

《Discover Public Health》:A machine learning approach to identify the gender-specific risk and protective factors of loneliness among adults in Shanghai, China

【字体: 时间:2026年06月07日 来源:Discover Public Health

编辑推荐:

  研究人员旨在识别和排序中国成年人孤独感的性别特异性风险和保护因素。方法:研究人员采用机器学习(ML)与传统统计方法相结合,比较了2022年中国上海3220名18岁以上成年人(平均年龄34.4[标准差10.9];48.5%为女性)的34个潜在风险和保护因素。孤独

  
研究人员旨在识别和排序中国成年人孤独感的性别特异性风险和保护因素。方法:研究人员采用机器学习(ML)与传统统计方法相结合,比较了2022年中国上海3220名18岁以上成年人(平均年龄34.4[标准差10.9];48.5%为女性)的34个潜在风险和保护因素。孤独感采用UCLA孤独感量表测量(得分≥7表示孤独)。预测因素涵盖人口学、就业、财务、心理社会、生活方式和健康领域。研究人员比较了多种ML算法(支持向量机、梯度提升、朴素贝叶斯、随机森林和K近邻[KNN]),并选择KNN分类器因其优越性能。利用KNN模型的Shapley加法解释(SHAP)值,研究人员识别了最重要的孤独感预测因素,随后通过逐步逻辑回归量化解释方差并计算最显著预测因素的比值比(OR)。结果:睡眠质量差、自评健康差和社会资本低成为最强的风险因素,共同解释了女性孤独感变异的19.8%和男性孤独感变异的17.1%。在女性中,睡眠质量差(OR 1.61;95% CI 1.30–2.00)、自评健康差(OR 1.39;95% CI 1.15–1.69)和社会资本低(OR 1.35;95% CI 1.13–1.61)与孤独感显著相关。在男性中观察到相似模式。性别特异性因素包括女性社交接触较少和男性亲密伴侣暴力。COVID-19相关的收入损失显著增加了孤独感风险,尤其在男性中。结论:在34个预测因素中,睡眠质量差、自评健康差和社会资本低是跨性别的稳健孤独感风险因素。这些结果强调了采用性别特异性方法应对这一日益增长的健康问题的重要性。
孤独感(loneliness)是指期望与实际社会关系之间存在令人痛苦的差距,已被日益视为全球健康优先事项和重大政策问题。现有研究表明,孤独感与抑郁、睡眠障碍、认知衰退、功能残疾及过早死亡等不良健康结局密切相关,且COVID-19大流行进一步加剧了该问题。尽管既往研究识别出性别、失业、经济不稳定、慢性疾病等风险因素,但传统统计模型在全面测试因素间的交互作用及确定其相对重要性方面存在显著局限。为克服这一瓶颈,研究人员采用机器学习(machine learning, ML)与传统统计相结合的方法,旨在识别并排序中国上海成年人孤独感的性别特异性(gender-specific)风险和保护因素,并量化各因素的贡献。该研究发表于《Discover Public Health》。

研究人员于2022年对上海16个区的3220名成年人(平均年龄34.4岁,48.5%为女性)开展横断面研究,以UCLA孤独感量表(得分≥7表示孤独)评估孤独感,并纳入34个潜在预测因素,涵盖人口学、就业与财务、生活方式、社会网络、心理社会、COVID-19相关因素及健康状况七大类别。通过比较五种ML算法,研究人员选定性能最优的K近邻(K-Nearest Neighbors, KNN)分类器,利用Shapley加法解释(Shapley Additive Explanations, SHAP)值量化各因素对模型输出的贡献,进而按重要性排序。随后,根据SHAP排序进行逐步逻辑回归,以Tjur’s系数D(R2Tjur)评估解释方差,并计算显著预测因素的比值比(odds ratio, OR)及95%置信区间(confidence interval, CI)。主要结论显示:睡眠质量差、自评健康差(self-rated poor health)和社会资本低是跨性别最强的孤独感风险因素,共同解释女性孤独感变异的19.8%和男性的17.1%;性别特异性因素包括女性社交接触较少(视频通话和短信)和男性亲密伴侣暴力(intimate partner violence, IPV);COVID-19相关收入损失显著增加孤独感风险,尤其在男性中。这些发现强调了针对性别差异进行干预的重要性,为社区健康政策和临床实践提供了循证依据。

关键技术方法方面,研究人员采用了结合机器学习与传统统计的两阶段分析策略。第一阶段,通过对比随机森林(Random Forest)、支持向量机(Support Vector Machine)、梯度提升机(Gradient Boosting Machine)、朴素贝叶斯(Na?ve Bayes)和K近邻(KNN)五种算法,选定KNN分类器(最优超参数:k=7,欧氏距离,距离加权投票),并利用SHAP值实现变量重要性排序。第二阶段,依据KNN排序结果,对女性和男性分别进行逐步逻辑回归(步进阈值ΔR2Tjur≥0.01),以量化解释变异并计算OR与95%CI。样本来源于2022年上海16个区采用目的抽样选取的3220名成年人(每区200名居民,10%过采样),数据通过在线问卷平台收集。

研究结果部分如下:

**3.1 参与者特征(Participants’ characteristics)**:通过描述性统计与双变量分析发现,女性较男性更易报告孤独感(18.3% vs 14.3%),女性更年轻(平均年龄32.1 vs 36.7岁),独居比例更低,收入和教育水平更高,因COVID-19失业或收入损失更少。健康方面,女性自评健康更优但睡眠质量更差,既往精神诊断比例更高,且社会资本和社会支持更高。

**3.2 KNN结果(KNN results)**:基于SHAP值的重要性排序显示,跨性别的最主要预测因素包括较低的社会资本、较少的视频通话或短信社交接触、自评健康差、经历IPV、睡眠质量差。其他重要因素包括低收入、COVID-19相关收入损失、年龄较大和失业。KNN分类器对女性和男性的交叉验证准确率分别为92.0%和92.7%。

**3.3 孤独感风险的累积解释变异百分比(Cumulative % explained variation in loneliness risk)**:逐步逻辑回归识别出女性14个、男性10个显著预测因素(ΔR2Tjur≥0.01)。睡眠质量差、自评健康差和社会资本低共同解释了孤独感变异的大部分(女性19.8%,男性17.1%)。自杀意念额外解释女性3.8%和男性2.0%的变异。性别差异方面,女性社交接触(视频通话和短信)分别额外解释4.7%和3.9%的变异,而男性仅分别解释1.3%和1.4%;IPV在男性中解释3.4%的变异,女性仅1.1%。

**3.4 逻辑回归结果(Logistic regression results)**:在女性中,睡眠质量差(OR 1.61; 95% CI 1.30–2.00)、自评健康差(OR 1.39; 95% CI 1.15–1.69)、既往精神诊断和自杀意念是显著风险因素;高社会资本(OR 0.74; 95% CI 0.62–0.89)、频繁视频通话(OR 0.70; 95% CI 0.57–0.87)和短信(OR 0.79; 95% CI 0.62–0.99)是保护因素。在男性中,睡眠质量差(OR 1.36; 95% CI 1.10–1.68)、自评健康差(OR 1.40; 95% CI 1.17–1.68)、COVID-19收入损失(<50%: OR 2.10; 95% CI 1.25–3.51; ≥50%: OR 2.52; 95% CI 1.49–4.27)和IPV经历(OR 1.32; 95% CI 1.17–1.49)是风险因素;高社会资本(OR 0.65; 95% CI 0.55–0.78)是保护因素。

讨论部分指出,本研究是首批结合ML与传统统计方法比较34个因素预测中国成年人孤独感的研究之一,KNN模型提供了最优预测精度。性别特异性模式(女性社交接触、男性IPV)和COVID-19收入损失对男性的突出影响,提示需要定制化干预策略。研究结论翻译如下:孤独感是一种可预防和可改变的健康问题。通过ML方法识别出睡眠质量、自评健康和社会资本是降低中国成年人孤独感风险的关键因素;性别特异性影响(如男性IPV和女性频繁数字社交接触)凸显了定制干预的必要性。这些发现为促进社会连接、减少孤独感的临床和社区干预提供了重要指导。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号