《BMC Global and Public Health》:Coordinated outcome-wide analytic methodology for multi-wave analyses of the global flourishing study
编辑推荐:
本文中,研究人员描述了用于协调性结果广泛分析集的分析设计,该分析利用全球繁荣研究(Global Flourishing Study,GFS)的数据检验纵向关联,涉及一个跨国和多学科的研究群体。研究人员讨论了结果广泛分析的优势,并提供了以下细节:使用主成分控制高
本文中,研究人员描述了用于协调性结果广泛分析集的分析设计,该分析利用全球繁荣研究(Global Flourishing Study,GFS)的数据检验纵向关联,涉及一个跨国和多学科的研究群体。研究人员讨论了结果广泛分析的优势,并提供了以下细节:使用主成分控制高维混杂因素、考虑复杂抽样设计、插补缺失数据、对未测量混杂进行敏感性分析、对来自各国的关联估计进行元分析以及报告结果。研究人员通过估计波1掌握感与波2多种结局的关联,提供了一个简单的示例性结果广泛分析操作。该示例说明了结果如何对分析决策敏感,例如预测变量的不同编码策略和所包含主成分的数量。研究人员最后概述了所采用方法的主要优势和局限性。
**论文解读:全球繁荣研究的协调性结果广泛分析方法**
**研究背景与现存问题**
全球繁荣研究(Global Flourishing Study,GFS)是一项综合性跨国面板研究项目,旨在探究人类繁荣与福祉的多维度模式、影响因素及其关联。该项目涵盖来自22个国家和1个地区的超过20万名参与者,地理与文化背景多样。尽管繁荣概念在心理学、经济学和公共卫生领域日益受到关注,但现有文献大多反映西方观点,全球范围内的福祉研究仍不充分。GFS的跨国设计为通过多文化视角审视繁荣提供了独特机会,但需要合适的方法学框架来挖掘其纵向数据潜力。当前,GFS已有波1和波2数据,可开展多种纵向分析路径。其中,结果广泛分析(outcome-wide analytic design)可一次聚焦单个暴露变量,同时检验其与多个后续结局的关联,从而更全面地评估暴露对繁荣的多方面影响。然而,分析中面临高维混杂控制、复杂抽样设计、缺失数据处理、跨国家异质性以及测量误差等挑战。为此,研究人员开发了一套协调性的定量分析方法,以系统、透明地处理上述问题。
**研究内容与结论**
研究人员利用GFS波1和波2数据,设计并实施了一套标准化的结果广泛分析方案。该方案由跨国和多学科团队协作完成,所有分析按国家分别进行,使用国家代表性样本,再通过随机效应元分析汇总各国结果。以波1掌握感(sense of mastery)预测波2多种结局为例,研究人员展示了该方法的执行流程和结果解读。主要结论包括:掌握感与后续的复合繁荣指数及心理福祉结局的汇总关联较强,与品格/亲社会特质及社会福祉/困扰指标的关联较中等,与身体健康、健康行为及大多数社会经济指标的关联较小但方向有利,而与社会参与因子、某些健康行为及缓慢变化的结构性状态(如教育程度、当前就业)的关联基本为零。通过敏感性分析发现,若对单条目测量的平均信度设定为中等水平(λ=0.55),部分原本无关联的结局可能显现非零关联。未测量混杂敏感性分析显示,主效应模型(模型1)的E值多在1.0至1.70之间,表明需要中等强度的未测量混杂才能解释观察到的关联。该研究发表在《BMC Global and Public Health》。
**主要关键技术方法**
主要关键技术方法包括:① 使用主成分分析(Principal Components,PCs)降低高维潜在混杂变量的维度,选取前7个主成分(解释约41%~58%的变异)纳入回归模型;② 采用国家特异性多重插补(Multiple Imputation,MI),通过链式方程预测均值匹配(Predictive Mean Matching)处理缺失数据,并使用逆概率加权(Inverse Probability Weighting)进行保留权重分析;③ 应用加权线性回归(近似连续结局)和加权修正泊松回归(二元结局)估计关联,同时纳入抽样设计变量(初级抽样单元、分层、抽样权重);④ 采用随机效应元分析(Paule-Mandel估计量)汇总国家特异性结果,并报告异质性τ和全局p值;⑤ 计算E值评估结果对未测量混杂的敏感性,并使用校准法(以性别为基准)辅助解读;⑥ 探索单条目测量的差分项目功能(Differential Item Functioning,DIF),采用惩罚异质有序Probit模型(Penalized Heteroskedastic Ordered Probit,HETOP)进行初步评估。样本队列来源为GFS,包含22个国家和1个地区(N=207,919),数据通过盖洛普(Gallup)收集,波1于2022年3月至2024年1月间收集,波2于2024年1月至2024年12月间收集。
**研究结果**
1. **测量不变性检验**:通过对12条目安全繁荣指数(Secure Flourishing Index)进行调节非线性因子分析和多组验证性因子分析,发现在国家、年龄和性别上存在部分度量和标量不变性,其中年龄对某些因子载荷有显著调节作用。对PHQ-4(4条目患者健康问卷)的两因子模型(抑郁和焦虑)进行分国家CFA和多组CFA,发现各因子载荷近似跨国相等(度量不变性),RMSEA<0.06(以色列除外),CFI=0.997,TLI=0.997,SRMR=0.009。对单条目测量的DIF分析显示,印度、肯尼亚和坦桑尼亚可能存在低区分度(非均匀DIF),日本和波兰可能存在反应倾向(均匀DIF),但总体上多数国家项目功能相似。
2. **缺失数据、插补与保留权重**:波1至波2的总体保留率为62%(香港23%至中国90%)。通过FMI计算,最大需17个插补数据集,实际使用20个。插补模型包含抽样权重、年龄、性别、教育、收入、就业、婚姻、种族(如可能)、城乡状况及童年期回顾性特征。保留权重通过逻辑回归估计保留概率,并纳入波1的诸多福祉指标作为预测因子。
3. **回归分析**:采用两种模型:模型1仅控制人口学和童年期变量;模型2额外加入7个主成分(代表波1所有其他结局指标的基线值)。主成分分析显示,7个主成分平均解释51.0%的变异。二元结局使用修正泊松回归估计风险比(Risk Ratio,RR),避免Logistic回归带来的比值比误解。
4. **元分析**:对22个国家和1个地区的标准化回归系数进行随机效应元分析,使用Paule-Mandel估计量。报告汇总估计值、95%置信区间、异质性τ和全局p值。当暴露与协变量高度共线时,可能严重低估异质性(τ
2<0.01),此时通过森林图和Q统计量提供额外信息。同时报告留一国家汇总估计、学生化残差和Cook‘s D类统计量。
5. **敏感性分析**:信度敏感性分析假设平均信度λ分别为0.40、0.55、0.70,对标准化效应进行纠正。示例中,掌握感对安全繁荣指数的效应在λ=0.40时可达0.502(95% CI: 0.466, 0.539)。未测量混杂敏感性分析计算E值,并采用性别校准(性别与暴露的RR=1.1,与结局的RR=1.20)辅助解读。对于连续结局,同时使用Cinelli和Hazlett的R
2方法绘制等高线图。
6. **分析决策敏感性**:以掌握感为例,比较不同二分法编码(如“从不”对比“任何正面频率”、“一贯”对比“其他”)及将四分类视为近似连续方式,结果发现效应估计的方向和显著性基本一致,但强度有所变化。主成分数量敏感性显示,使用1个、2个、固定7个或按国家达到最小方差解释比例,结果高度一致。
**讨论与结论总结**
讨论部分指出该协调性分析的主要优势:① GFS涵盖22个多样国家,代表约三分之二世界人口,提供独特的跨文化比较机会;② 结果广泛分析提供暴露与多结局的整体关联视图,标准化分析计划减少研究者自由度和发表偏倚;③ 数据和分析代码完全公开,每篇实质论文均预注册,增强透明度和可重复性。局限性包括:① 观察性数据无法完全排除未测量混杂;② 仅有两个波次的数据无法进行因果推断;③ 单条目测量存在较低信度和可能的跨国家测量不等性;④ 保留率差异大可能导致偏倚,尽管多重插补和保留权重部分缓解;⑤ 分析忽略结局间相关性;⑥ 纵向测量不变性随时间可能漂移。未来波3数据发布后,可采用暴露在波2、结局在波3、协变量在波1的三波设计,更好地控制时间顺序,避免控制中介变量或碰撞偏倚。
**结论(翻译)**:本文描述了用于利用GFS波1和波2数据报告纵向结果广泛分析稿的方法,这些文稿构成一组协调性的文集,提供了跨越广泛焦点暴露的详细结果。基于早期利用波1数据记录繁荣各指标分布、社会人口学相关因素及童年期预测因子的协调分析(https://www.nature.com/collections/eaeicjffaf),本组计划的分析提供了独特机会,探索在代表约三分之二全球人口的23个地理和文化多样背景中预测众多繁荣指标的因素。尽管存在局限性和注意事项,但这一协调性努力所产生的集体发现,可在国家和国际层面塑造以促进繁荣为导向的政策和实践。