采用月度PROMIS?计算机自适应测验(Computerized Adaptive Testing, CAT)追踪美国人群生活质量相关结局的测量质量评估

《Quality of Life Research》:Tracking quality of life-related outcomes in the U.S. population with monthly PROMIS computerized adaptive testing

【字体: 时间:2026年06月07日 来源:Quality of Life Research 2.7

编辑推荐:

  目的:本研究旨在评估在大型全国代表性互联网_panel中,每月重复施测简短患者报告结局测量信息系统(Patient-Reported Outcomes Measurement Information System, PROMIS?)计算机自适应测验(Compu

  
目的:本研究旨在评估在大型全国代表性互联网_panel中,每月重复施测简短患者报告结局测量信息系统(Patient-Reported Outcomes Measurement Information System, PROMIS?)计算机自适应测验(Computerized Adaptive Testing, CAT)的可行性、信度及敏感性。方法:对"理解美国研究(Understanding America Study, UAS)"中相同12,231名美国成年人,连续13个月每月施测愤怒(Anger)、生命意义感(Meaning in Life)和积极情感(Positive Affect)三个领域的PROMIS CAT,每领域限3个条目以减轻应答负担。研究人员评估了测量精度、等级顺序稳定性(rank-order stability)、PROMIS各指标总体水平及月际变异性的预测因子,并采用时间序列分析检验PROMIS得分是否对每月报告的急性健康事件敏感。结果:三条目CAT在较宽分数范围内达到较强测量精度(信度≥0.80),并显示中等等级顺序稳定性(组内相关系数 Intra-Class Correlation, ICC=0.67–0.79)。被试间分析显示,慢性病数量越多与平均PROMIS得分越差及月际变异性越高相关。被试内分析显示PROMIS得分对急性健康事件有反应:愤怒和积极情感对多数健康事件出现当月显著变化,生命意义感反应性较低;事件相关变化通常在1–2个月内消退。结论:简短PROMIS CAT可在保持心理测量严谨性的前提下每月施测。这种高频评估方式能同时评估健康的平均水平和时间动态,揭示慢性病与急性健康事件的影响新见解,支持PROMIS量表在纵向群体健康研究中的应用。
论文解读:采用月度PROMIS?计算机自适应测验追踪美国人群生活质量相关结局的测量质量评估
本研究发表于《Quality of Life Research》。既往患者报告结局测量信息系统(Patient-Reported Outcomes Measurement Information System, PROMIS?)多用于横断或低频纵向设计,难以捕捉心理幸福感(psychological well-being)的动态变化及急慢性疾病对其时空特征的影响。传统PROMIS计算机自适应测验(Computerized Adaptive Testing, CAT)常推荐4–7个条目,长期高频施测存在较高应答负担。此外,个体内(intraindividual)生活质量波动本身是否具健康指示意义尚待在大样本中验证。因此研究人员开展此项研究,旨在验证将每领域限为3个条目的简短PROMIS CAT每月施测于全美代表性成人样本的可行性、心理测量学属性及对急性/慢性健康状态的敏感性,并探讨其用于群体健康动态监测的价值。
为开展研究,研究人员采用的关键技术方法如下:数据来源于理解美国研究(Understanding America Study, UAS)——一个基于地址抽样、具全国代表性的美国成人互联网固定样本panel,向无网络者提供平板与宽带。2024年3月至2025年3月共13个月,对同一panel成员每月在线施测PROMIS CAT测评愤怒(Anger,题库22题)、生命意义感(Meaning in Life,题库37题)、积极情感(Positive Affect,题库34题),CAT使用R mirtCAT包在NubiS平台实现,初试θ为0、期望后验(Expected A Posteriori, EAP)估计、按最大后验加权信息(Maximum Posterior Weighted Information, MPWI)选题,强制终止于3题。慢性病(糖尿病、癌症、肺病、心脏病、卒中、关节炎)采用健康与退休研究(Health and Retirement Study, HRS)模块自评"医生曾告知患某病",计0–≥3种分层。每月记录19类急性健康事件(意外损伤、攻击、流感、肺炎、COVID-19、带状疱疹、关节置换术、新诊断癌症/糖尿病/心脏病/肾病/慢阻肺/关节炎/骨质疏松/痴呆或严重记忆障碍/高血压/情绪或精神疾病/睡眠障碍/其他)为二分类时变变量。排除仅完成1波(n=651)的受访者后最终分析N=12,231。测量精度由项目反应理论(Item Response Theory, IRT)标准误换算为信度(reliability=1-SE2/100,PROMIS T分SD参照=10)。等级顺序稳定性用无条件多层模型计算组内相关系数(Intra-Class Correlation, ICC=被试间方差/(被试间方差+合并被试内方差))。慢性病对均值(location)及月际变异性(scale)的影响采用多层位置—尺度模型(multilevel location-scale model)并以对数尺度建模个体残差异方差,控制年龄、性别、种族、教育。急性健康事件对PROMIS的即时与滞后效应采用多层时间序列模型(multilevel time-series model / dynamic structural equation model),事件指标做个体均值中心化(person-mean centered)以分离被试内效应,加入一阶自回归(first-order autoregressive, AR(1))项,用Mplus8.11贝叶斯估计并在R通过MplusAutomation调用,假定随机缺失(Missing At Random, MAR)。
测量精度与等级顺序稳定性(Measurement precision and rank-order stability)
通过IRT测试信息函数计算每波T分标准误并转为信度。结果显示三条目CAT在大部分常用分数段信度≥0.80——愤怒T=40–80(覆盖91%观测值,平均信度0.84),生命意义感T=20–60(83%,平均0.85),积极情感T=20–65(86%,平均0.86)。表明简短CAT可恢复长版短表的绝大部分信息。无条件多层模型得出ICC:愤怒0.67、生命意义感0.79、积极情感0.70,即有约21%–33%方差来自月际被试内波动,证明中等等级顺序稳定性且存在有意义的时间内变化,有无慢性病亚组ICC相近。
PROMIS得分平均水平与个体内变异性的预测因子(Predictors of average levels and intraindividual variability in PROMIS scores)
以位置—尺度多层模型分析人口学及慢性病数对location(平均T分)和scale(月际变异性iSD)的影响并控制协变量。结果发现:年龄越大愤怒越低、生命意义感与积极情感越高,且三领域月际变异性均更小;女性愤怒更低、生命意义感更高但三领域变异性更大;非西班牙裔白人愤怒更高、生命意义感和积极情感更低;教育越高各领域得分越优且变异性越小。与无慢性病相比,慢性病数越多关联于更高愤怒、更低生命意义感与积极情感(>3种病:愤怒↑约4分、生命意义感↓约4分、积极情感↓约7分),且月际变异性显著增大——>3种病者愤怒个体内方差增49%(iSD从3.96升至4.84)、生命意义感方差增98%(iSD从2.96升至4.18)、积极情感方差增50%(iSD从3.20升至3.91),呈近似单调趋势(积极情感变异性在恰好3种病时不显著升高)。单独疾病分析效应较小,提示疾病累积负荷(cumulative disease burden)更利于捕捉心理幸福感水平与波动。
对急性健康事件的敏感性(Responsiveness to acute health events)
以多层时间序列模型检验任意急性健康事件(二分类时变、个体均值中心化)对当月及滞后1–4月PROMIS得分的影响,控制AR(1)。当月的健康事件使愤怒显著升高(b=0.78,95% CI [0.64, 0.91]),生命意义感降低(b=-0.31,[-0.46, -0.19]),积极情感降低(b=-1.70,[-1.90, -1.52]);仅积极情感存在微弱1月滞后效应(b=-0.37,[-0.58, -0.13]),更长滞后不显著。脉冲响应函数(Impulse Response Function, IRF)示愤怒当月升近1 T分、影响延续≤2月,积极情感当月降>1.5 T分、约3月回基线,生命意义感微降约0.3 T分且无延滞。分层按人口学交互仅受教育程度略缓冲健康事件引发愤怒升高。分事件分析:愤怒在遭受攻击(b=1.81)、新诊情绪/精神疾病(b=1.30)、患带状疱疹(b=1.89)时升幅最大;生命意义感在痴呆/严重记忆障碍诊断时降幅最大(b=-1.88);积极情感在攻击(b=-2.64)、关节置换术(b=-2.26)、癌症新诊断(b=-1.94)时降幅最大,19种事件中16种显著升愤怒、9种显著降生命意义感、14种显著降积极情感。
讨论与结论总结(Conclusions)
本研究表明,即便限制为每领域3个条目,PROMIS CAT在美国全国代表性成人panel中每月重复施测仍可保持强测量精度(信度≥0.80)与中等等级顺序稳定性(ICC=0.67–0.79),支持其在群体纵向研究中的可行性。首次在大样本证实慢性病负担不仅关联更差的平均PROMIS水平,且关联更大的月际心理幸福感变异性——后者可能是健康脆弱性与疾病影响的潜在标志,提示单时点测评可能遗漏慢性病群体的动态特征。PROMIS CAT对多数急性健康事件当月的情绪改变敏感,其中愤怒与积极情感反应性强、生命意义感较稳定(更接近特质性幸福感/eudaimonic well-being),事件相关偏移多在1–2月消退。不同领域对不同健康事件(攻击、新诊断精神病、带状疱疹升愤怒;攻击、手术、癌症降积极情感;认知障碍诊断降生命意义感)呈现领域特异性反应模式。研究局限含观察性设计无法确立因果、慢病与健康事件为自陈报告、仅三领域且每波三题,更长CAT可进一步提升精度但需权衡panel负担。结论:简短PROMIS CAT可维持心理测量学严谨性并实现月度施测,该高频评估能同步捕获情感幸福感的平均水平与时间动态,揭示慢病与急性健康事件的作用,支持将PROMIS量表整合入纵向群体健康研究。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号