《European Journal of Pain》:Enhancing High-Resolution Assessment in Pain Disorders: Development of an Adaptive Real-Time Version of the Pain Catastrophizing Scale
编辑推荐:
为适应生态瞬时评估(EMA)对疼痛相关认知进行高分辨率实时监测的需求,本研究基于德国版13项PCS,通过最小语言修改开发了适用于瞬时评估的版本。研究利用项目反应理论(IRT)分析条目特性、验证单维性,并构建了三套4项简表以实现高效、平衡的评估。计算机自适应测试(CAT)模拟结果显示,自适应管理在初始评估中提高了效率,但因条目库有限,重复使用时精度下降。该研究为在临床和移动健康研究中实现基于PCS的疼痛相关认知的高分辨率监测提供了方法学基础。
疼痛是全球性的重大健康问题,它不仅带来身体上的折磨,还伴随着沉重的情绪和社会经济负担。在理解疼痛体验的复杂画卷中,一个关键的心理因素——疼痛灾难化(Pain Catastrophizing)——逐渐成为研究焦点。它被定义为“在疼痛经历中一种夸大的负面心理定势”。通常,我们使用疼痛灾难化量表(Pain Catastrophizing Scale, PCS)这把“尺子”来测量它,这个包含13个条目的自评问卷评估了沉思、放大和无助感三个维度。更高的PCS分数 consistently与更剧烈的疼痛感知和更差的治疗结果相关联。
然而,传统的PCS通常作为一种特质水平的测量工具施测,它捕捉的是一个人相对稳定的倾向,却无法捕捉一天之内疼痛相关认知的细微波动。这就像只用一张年度平均气温图,无法了解一天中的天气变化。越来越多的证据表明,PCS反应受到近期疼痛经历和回忆过程的影响,这意味着它既有特质样成分,也有情境性成分。随着通过生态瞬时评估(Ecological Momentary Assessment, EMA)进行实时监测的兴趣日益增长,我们迫切需要可靠且高效的工具,它们既要适合重复使用,又不能引起反应疲劳或偏差。
频繁的评估带来了心理测量学的挑战。EMA中的个体水平推断需要很高的测量精度(信度 ≥ 0.9),而静态的、特别是简短的测量通常难以达到这个要求。项目反应理论(Item Response Theory, IRT)可以通过自适应的条目选择来提高精度。但重复的EMA施测引入了额外的挑战,包括条目暴露偏差,即相同条目的重复呈现可能因疲劳、参与度降低或习得的期望而扭曲反应。
鉴于这些概念和方法学的考量,本研究迈出了开发用于评估疼痛相关认知的自适应EMA工具的第一步。研究旨在开发一个德语版的瞬时PCS,并利用自适应评估方法,在提高测量精度的同时限制条目的重复暴露,从而将其性能与传统的PCS进行比较。
为了开展这项研究,研究人员主要运用了以下几种关键技术方法:研究基于柏林夏里特大学医学院心身医学科的住院和门诊患者的横断面现实世界数据收集。采用了德国版PCS及其为瞬时评估而修改的EMA版本。通过验证性因子分析(Confirmatory Factor Analysis, CFA)和基于IRT的Graded Response Models (GRM) 分析了量表结构、条目参数和测量精度。研究利用TestDesign R包通过迭代选择开发了三个平衡覆盖PCS子域的4项简表。此外,使用mirtCAT R包模拟了多轮计算机自适应测试(Computer-Adaptive Testing, CAT),在施加条目排除和内容平衡等约束的条件下,评估了重复自适应使用的预期测量精度和条目暴露效应。
3 结果
3.1 样本特征
PCS样本(n=691)和EMA-PCS样本(n=1440)的人口学特征相似,平均年龄约43岁,主要为女性,多数具有高中学历且在业。
3.2 PCS向EMA版本的适应
通过对条目指导语和措辞进行最小修改,强调当前的疼痛相关体验,并将反应量表调整为“完全不”到“完全”,以适应瞬时报告。
3.3 IRT模型估计与比较
CFA显示,无论是传统PCS还是EMA-PCS,单因子模型拟合不佳,但双因子模型显示出强大的本质单维性(ECV > 0.60, OmegaH > 0.80)。基于GRM的IRT分析表明,EMA-PCS条目具有高区分度参数(a值范围1.27-3.95),阈值参数在潜在特质连续体上分布良好,支持其单维校准。
3.4 与PROMIS健康领域的关联
PCS和PCS-EMA分数均与PROMIS疼痛干扰、抑郁、焦虑、疲劳呈中度至强正相关,与身体功能、认知功能、社会角色参与能力呈中度负相关,相关模式和强度高度相似,支持了EMA版本的结构效度和概念连续性。
3.5 PCS简表的创建
通过迭代选择,从EMA-PCS条目库中开发了三个4项简表(SF-1, SF-2, SF-3),每个简表均至少包含来自无助感、放大、沉思三个子域各一个条目。重复测量方差分析显示三个简表的T分数无显著差异,表明它们可产生可互换的分数。
3.6 CAT模拟
CAT模拟显示,在第一次施测中,在较宽的潜在特质范围(θ ≈ -1 至 +1.5)内测量精度很高(边际信度 > 0.90)。在随后的第二、第三次施测中,由于可用条目池因排除约束而缩小,测量精度下降。与静态简表相比,CAT在第一、二次施测中精度更高,但在第三次施测中精度更低。条目使用分析显示,某些高区分度条目(如来自沉思子域的条目)在自适应过程中被频繁早期选中。
4 讨论
本研究开发并评估了德语版自适应瞬时PCS。EMA版本仅需对原版做最小调整,并表现出强大的心理测量特性。通过IRT分析确认了其本质单维性。开发的三套平衡简表能在减少作答负担的同时保持可接受的测量精度。CAT模拟证明了自适应方法在初始评估中的效率优势,但也凸显了在重复、密集的瞬时评估中,因条目库有限而面临的精度维持挑战。与PROMIS域的相关性模式支持了改编版本的结构效度。
这些发现代表了在临床和移动健康研究中,对基于PCS的疼痛相关认知实现高分辨率监测的方法学进步。自适应管理通过结合基于IRT的简表和CAT,在重复评估中提高了测量精度并减少了负担。这项工作为未来在真实世界EMA设计中验证其纵向性能、评估其预测效度和变化敏感性,以及探索其在适时适应性干预(JITAIs)中的应用潜力奠定了基础。
5 优势与局限性
优势包括首次开发并评估德语EMA版PCS,采用了结合双因子模型、IRT校准、简表构建和CAT模拟的综合框架,并使用了大样本。主要局限性在于研究基于横断面数据,CAT性能是在模拟条件下评估的,其实际纵向表现和捕获个体内部变化的能力尚待实证检验。患者伙伴未参与条目审阅,可能影响条目的生态效度。样本来源于心身医学科门诊,限制了普遍性。此外,CAT精度在后续施测中的下降凸显了为持续自适应评估构建足够大条目库的重要性。
6 结论
本研究利用基于IRT的简表和CAT模拟,对瞬时自适应PCS进行了初步心理测量学评估。虽然自适应评估在早期施测中提高了效率,但持续的精度受到条目库规模的限制。未来的工作应扩展条目库,并在真实世界的EMA设计中评估该工具,以确定其纵向性能和应用效用。