慢性腰痛患者两年内的疼痛发展轨迹及关键预测因素:一项前瞻性纵向队列研究
《The Journal of Pain》:Trajectories of pain and key predictors in two years of chronic low back pain: A prospective longitudinal cohort study
【字体:
大
中
小
】
时间:2026年05月07日
来源:The Journal of Pain 4.0
编辑推荐:
普亚·拉比埃(Pouya Rabiei)、米歇尔-皮埃尔·科尔(Michel-Pierre Coll)、皮埃尔·朗格万(Pierre Langevin)、马克-奥利维耶·杜贝(Marc-Olivier Dubé)、让-塞巴斯蒂安·罗伊(Jean-Sébastien Roy)、雨果
普亚·拉比埃(Pouya Rabiei)、米歇尔-皮埃尔·科尔(Michel-Pierre Coll)、皮埃尔·朗格万(Pierre Langevin)、马克-奥利维耶·杜贝(Marc-Olivier Dubé)、让-塞巴斯蒂安·罗伊(Jean-Sébastien Roy)、雨果·马塞-阿拉里耶(Hugo Massé-Alarie)
加拿大魁北克省拉瓦尔大学医学院
**摘要**
慢性腰痛(CLBP)非常普遍。了解其发展过程并识别相关预测因素对于指导其管理至关重要。本研究旨在描述两年内CLBP的演变轨迹,并确定这些轨迹的基线预测因素。分析了参与魁北克腰痛研究(Quebec Low Back Pain Study)的2,713名受试者的数据。这项研究从更大的队列(n=3,894)中抽取了分析样本,其中30.3%(n=1,181)的受试者因随访数据缺失而被排除在外。基线变量采用NIH最小数据集的加拿大改编版本进行收集。在入组后的第3、6、12和24个月对疼痛强度(0–10分)进行了评估。使用潜在类增长分析(Latent Class Growth Analysis, LCGA)来识别疼痛轨迹,并训练机器学习分类器以确定轨迹归属的基线预测因素。LCGA结果显示:疼痛稳定型(40%)、轻度稳定型(30%)、持续性高疼痛型(16.4%)和逐渐改善型(14.6%)四个群体。大多数CLBP患者经历了疼痛稳定,而逐渐改善型群体在两年内疼痛强度有所显著下降(平均疼痛强度从4.08分降至2.10分)。在所有群体中,疼痛强度、疼痛干扰、身体残疾和灾难化思维是关键的预后因素。这些因素的水平越高,属于高疼痛轨迹的可能性越大;反之则越可能属于低疼痛轨迹。一些因素仅见于特定群体,例如较年轻的年龄、较低的睡眠障碍和较短的疼痛持续时间与逐渐改善型轨迹相关。鉴于部分受试者数据缺失,这些发现需谨慎解读。
**视角**
通过对大规模CLBP患者队列的分析,我们确定了四种疼痛轨迹:持续性高疼痛、轻度稳定疼痛、中度稳定疼痛和逐渐改善疼痛。分析与每种轨迹相关的最重要因素有助于更好地理解疼痛稳定性或随时间的变化特征。
**引言**
腰痛(LBP)导致残疾和较高的医疗费用。其患病率在1个月内约为23%,1年内为38%,终生可达40-70%,其中相当一部分发展为慢性腰痛(CLBP)。尽管CLBP的预后看似较差,但实际上存在较大的个体间差异,部分患者可能有更好的长期预后。了解CLBP的不同临床轨迹对于判断个体预后和揭示潜在机制至关重要。纵向研究揭示了多种疼痛模式,包括持续性重度疼痛、持续性中度疼痛、疼痛缓解、疼痛波动以及无或偶尔的轻度疼痛。然而,大多数此类研究涉及不同疼痛持续时间的混合人群,且缺乏专门针对CLBP患者的研究。急性腰痛患者在发病初期几周内通常会有所改善,而CLBP患者的疼痛和残疾在一年内仍持续存在。最新荟萃分析表明,急性及亚急性腰痛在六周内会有明显改善,而CLBP患者的疼痛和残疾仅略有减少且长期保持稳定。这些证据表明,CLBP的疼痛趋势趋于停滞而非改善,而非慢性腰痛病例的改善更为迅速。因此,基于混合人群的疼痛轨迹分析可能主要受疼痛持续时间(急性 vs. 慢性)的影响,未能充分反映CLBP的长期发展过程。
尽管平均疼痛强度或残疾的轨迹可能掩盖个体差异,但测量个体特征有助于识别预后不良的预测因素(如长期疼痛/残疾)。与CLBP及非慢性腰痛相关的特征(如较长的疼痛持续时间、较高的基线疼痛强度和共病情况)已被证实是高疼痛轨迹的预测因素。此外,性别、社会心理因素(如有限的社会支持、睡眠障碍和倾向于被动应对策略)也与较差的长期预后相关。然而,这些关联是基于传统回归方法得出的,这些方法假设效应呈线性且可提前指定预测因子和交互作用。在轨迹分类方面,这些假设可能过于严格,因为CLBP的预后因素常常相互关联且与结果呈非线性关系,并可能在不同亚群中产生不同影响。此外,轨迹分析常导致类别分布不平衡,例如疼痛持续较高或显著改善的亚群代表性不足。
**机器学习方法**
机器学习提供了一种补充性的、数据驱动的方法框架,能够处理高维预测空间,捕捉非线性关系和复杂交互作用,无需显式指定,并通过成本敏感学习(cost-sensitive learning)、类别加权(class weighting)或重采样策略(resampling strategies)等措施解决类别不平衡问题。通过交叉验证(cross-validation)评估样本外的预测性能,机器学习特别适合于识别异质性和不平衡队列中的轨迹归属特征。
因此,本研究首先利用魁北克腰痛研究(QLBPS)的数据和潜在类增长分析(LCGA)来识别CLBP患者两年内的不同疼痛轨迹;其次,利用NIH最小数据集的加拿大改编版本中的基线生物心理社会特征来预测轨迹归属。为此,训练了机器学习分类器,并应用Shapley加性解释(SHAP)来确定影响轨迹归属的最重要预后因素。
**研究设计与方法**
本研究使用了2018年11月启动的QLBPS纵向前瞻性队列的数据(clinicaltrials.gov: NCT04791891)。QLBPS是一项在线研究,收集了自认为是急性或慢性腰痛的受试者在人口统计学、疼痛相关、一般健康、心理社会和职业领域的信息。由于参与者是根据自我报告的疼痛状态入组的,因此没有所有参与者共有的统一“时间起点”。该研究已获得麦吉尔大学研究伦理委员会批准(A06-M22-18A),所有参与者均签署了知情同意书。详细方法论可见于先前发布的QLBPS方案。研究数据来自2018年11月至2022年10月招募的参与者,其中2024年12月时已有两年随访数据。尽管招募期间参与者入组时间不均匀,但对每位参与者在基线后第三、六、十二和二十四个月进行了固定间隔的随访评估。报告遵循了潜在轨迹研究报告指南(GRoLTS)和流行病学观察性研究报告强化指南(STROBE)。
QLBPS通过社交媒体、报纸广告和诊所传单在加拿大魁北克全省招募受试者。纳入标准包括年龄≥18岁、英语或法语流利,以及在过去4周内有腰痛症状。本研究使用了QLBPS中确诊为CLBP的受试者数据。CLBP定义基于NIH标准:疼痛持续超过3个月且过去6个月内至少50%的时间有疼痛。CLBP分类基于NIH最小数据集中的两个筛查问题,涉及疼痛持续时间和频率。参与者若报告疼痛持续至少3个月且在过去6个月内至少一半时间有疼痛,则被归类为CLBP患者。
**数据收集**
在注册阶段,潜在参与者收到访问网站(backpainconsortium.ca/ 或 mybackhurts.ca/malaudos.ca)的邀请。完成所有信息并自我确认患有腰痛的参与者会收到电子邮件,获邀参与包含知情同意书的在线基线调查。研究数据采用REDCap软件收集和管理。基线和随访数据采用NIH最小数据集的加拿大改编版本。该数据集包含40个项目,涵盖疼痛特征、共病情况、手术干预史、疼痛干扰、治疗史(如阿片类药物使用、注射治疗、运动疗法和心理咨询)、与腰痛相关的工作场所问题、身体残疾、抑郁、睡眠障碍、恐惧运动和灾难化思维、物质滥用、生活质量、社会人口统计特征及吸烟和肥胖习惯等信息。
**潜在类增长分析**
为了识别两年随访期间的疼痛轨迹,采用了LatentGold(版本6.0)软件中的LCGA方法。该方法用于确定解释数据变化所需的最低类别数量,并将每位参与者分配到相应的类别。LCGA将基线及第3、6、12和24个月的重复疼痛强度测量值作为因变量,时间作为自变量。LCGA采用最大似然估计法,允许在随机缺失(MAR)假设下包含具有纵向数据的个体,无需数据插补。LCGA描述的是一种非正态连续轨迹分布,其中亚群是指遵循大致相同轨迹的个体集合。
**敏感性分析**
为分析退出风险,我们进行了单变量修正泊松回归模型,以基线变量为自变量计算风险比(RRs)。某些基线变量与退出相关(例如失业[RRs = 1.48]、性别[RRs = 1.22]和治疗性锻炼[RR = 1.18]),表明缺失并非完全随机(MCAR)。这些发现支持基于观察到的基线变量的MAR机制,但也不排除非随机缺失的可能性。在主要分析中,排除了仅回答基线问卷而未回答任何随访问题的参与者。尽管LCGA可以处理缺失数据,但潜在类别也基于随时间的变化模式,因此仅有一个数据点的参与者无法反映个体内部变化。考虑到仅有基线数据的参与者比例较高及其对类别划分的影响,决定将其排除在主要分析之外。在符合条件的3,894名参与者中,30.3%(n=1,181)因仅提供基线数据而被排除,剩余的69.7%(n=2,713)被纳入主要分析。通过比较不同类别数量的潜在类模型,评估了模型拟合度。AIC3和CAIC对模型复杂性的惩罚比AIC更严格,这有助于选择更简单的模型并降低过拟合的风险。具有最低AIC和BIC值的模型被认为是最佳拟合模型。实际考虑因素还包括高熵、属于每个簇的平均后验概率大于0.7、簇大小至少为10%,以及每个簇都有独特的疼痛进程。
为了评估识别出的疼痛轨迹的稳健性,进行了多项敏感性分析。首先,使用所有可用参与者的数据重新分析了LCGA——即包括仅有基线数据的参与者(称为完整数据集[n=3,894])以及所有随访数据完整无缺失的参与者(称为完整案例数据集[n=1,424])。这些分析可以在关于不完整随访的不同假设下评估识别出的轨迹结构的稳健性。其次,进行了性别分层LCGA,以评估过滤后的数据集中潜在的性别特异性轨迹结构差异。第三,为了考虑疼痛轨迹中的潜在非线性,使用立方增长项模型进行了额外的LCGA分析。在这项分析中,疼痛强度被指定为LCGA框架中的因变量,重复测量嵌套在个体内部(案例ID在受试者层面指定)。时间被建模为一个有序的数值预测因子,代表测量时间点(基线、3个月、6个月、12个月和24个月,编码为0-4)。为了允许非线性的轨迹形状,创建了立方时间项(time2和time3),并将其作为类内回归模型中的预测因子。这些项允许曲线和非单调的变化模式,例如早期改善后出现平台期或波动,而不强制轨迹必须是线性的。允许立方时间效应并没有改变最佳类别数量,总体轨迹形状和簇特征与主要分析中获得的结果在质量上相似(补充材料,eFigure 1)。
预后因素的确定是在将参与者分配到LCGA的轨迹类别后,在主要的过滤数据集中进行的。根据已建立的慢性疼痛和长期残疾的风险因素,识别出潜在的预后因素。这些因素包括从加拿大版本的NIH最小数据集中提取的变量:年龄、性别、体重指数(BMI)、就业状况、教育水平、接受治疗的历史、疼痛强度、疼痛持续时间、疼痛干扰、身体残疾、生活质量、共病、抑郁、睡眠障碍、疼痛影响、运动恐惧症和灾难化。使用成对相关性评估了这些因素之间的多重共线性,相关性系数≥0.8的因子被认为具有较强相关性并被排除在进一步分析之外。由于基线预测因子的缺失与用于LCGA的重复疼痛结果的缺失不同,因此在机器学习阶段分别处理。因此,为了处理缺失的基线预测值,应用了带有10轮插补的链式方程方法进行多重插补。对于性别、就业状况、接受治疗的历史、运动恐惧症和灾难化等分类因子,使用逻辑回归作为估计器。对于数值因子(年龄、BMI、教育水平、疼痛强度、疼痛持续时间、疼痛干扰、身体残疾、生活质量、共病、抑郁、睡眠障碍、疼痛影响),使用贝叶斯岭回归作为默认估计器。插补后,所有数值因子都被标准化为平均值0和标准差1。这一步确保了因素处于可比的尺度上,并提高了模型的收敛性和性能。随后,训练了四种类型的机器学习分类器,包括随机森林、逻辑回归、支持向量分类器和极端梯度提升(XGBoost),以预测簇成员身份。这种方法很重要,因为每种算法根据具体的数据特征提供独特的优势:不同类型的因素、高维度、缺失数据的存在、数据分布的潜力以及预后因素之间的关系。为了应对簇间的类别不平衡,应用了频率类权重(class_weight="balanced")。
数据集被分为测试集(20%)和训练集(80%)。通过训练集进行嵌套交叉验证来评估分类器的性能。对于每个分类器,数据集被分成五个外部折叠。对于每个外部折叠,数据进一步被分成五个折叠,其中一个折叠被保留用于最终模型评估,而其余四个折叠用于内部循环中的超参数调整,采用网格搜索方法。每个模型的超参数及其在网格搜索中的潜在值的全列表在补充材料,eTable 2中报告。通过在训练数据上使用网格搜索选择每个分类器的最佳超参数,并使用完整训练集重新拟合得到的最佳估计器。使用接收者操作特征曲线下面积(AUROC)、阳性预测值(PPV)和F1分数来量化分类器的性能。此外,还测量了平衡准确率(BA)和Matthews相关系数(MCC),因为这些指标可以处理二元和多类分类问题以及不平衡的数据集。使用概率校准图来评估模型校准,该图评估了预测类别概率与观察到的结果频率之间的一致性。
最佳分类器的结果被收集起来,并使用SHAP方法识别了整个样本和每个簇中预后因素的重要性。SHAP基于合作博弈论,通过将其与基线(预期)输出进行比较来属性每个因素对预测的贡献。它提供了局部和全局重要的因素,后者是从样本之间的平均绝对SHAP值得出的。
表1展示了包括的个体与被排除的个体的基线特征。主要过滤数据集中每个簇的参与者的基线特征在补充材料,eTable 3中表示。
基线数据
排除的参与者 包括的参与者
平均(SD) 或 百分比
所有簇(n=2240) 44.2(11.2) 56.1%
BMI 29.2(7.4) 29.1%
疼痛强度(0-10) 6.3(1.77) 6.1
疼痛持续时间 3-5个月 6-11个月 3-5年 > 5年
5.9% 8.5% 38.1%
3.9% 7.6% 33.8%
54.5% 8.6%
教育程度 无文凭 文凭 学士 硕士 博士
37.3% 30.3% 19.1% 8.6% 5.2%
32.5% 31.7% 17.1% 12.6% 2.7%
就业状况 全职 兼职 失业 退休 学生
60.2% 10.5% 7.4% 15.4% 6.6%
57% 10.2% 3.3% 23.4% 6.8%
疼痛分层 轻微 中等 严重 重度
43.3% 27.2% 29.4% 48.5% 27.7%
阿片类药物使用历史 过去使用 当前使用 未使用 23.8% 19.5% 56.7%
治疗性运动历史 过去使用 当前使用 未使用 31.7% 34.0% 34.3%
咨询治疗历史 过去使用 当前使用 未使用 8.7% 8.2% 82.7%
8.6%
总体疼痛轨迹在图1A中显示,两年内疼痛有轻微且渐进的下降,但这在临床上没有意义。使用适合度指数(表2)评估了具有两个到七个簇的模型。所有簇模型的对数似然值都有所增加,这意味着随着簇数量的增加,模型得到了改进。显著的BLRT表明,最多五个簇的解决方案提供了最佳的数据拟合(p < 0.05),而增加第六个簇并没有带来显著的改进(BLRT p = 0.06)。四簇模型的拟合指数达到最低分数(BIC=41216.30和CAIC=41278.30)。尽管随着更多簇的增加,AIC和AIC3继续下降,但超过四个簇的模型包含的簇少于样本的10%,这通常是推荐的最低簇大小标准。
下载:下载高分辨率图像(218KB)
下载:下载全尺寸图像
图1. 两年随访期间疼痛强度的轨迹。A:整个队列的平均疼痛强度得分。B:从LCGA中提取的CLBP患者两年随访期间的四簇疼痛强度轨迹。
表2. 2到7簇模型的适合度标准。
适合度标准
模型 2簇 3簇 4簇 5簇 6簇 7簇
顺序模型比较(K+1簇 vs K簇)
LL (K+1) -5 60 9.7 -5 56 6.0
-5 52 8.6 -5 51 5.6
-5 51 15.6 -5 51 11.0
-5 50 8.4 10.0 7.1
BLRT P值 <0.001 <0.001 <0.001 <0.001 0.001
-2 LL差异 29 9.9 10 8.6 37 2.8
12 38 21 10 0.7 17
信息量准则 BIC 42 34 44.8 14 62.6
AIC 42 16 7.5 41 90.9 40
85 0.07 40 75 8.2 40
68 9.5 40 68 41
25 40 68 41
AIC3 42 19 7.5 41 12 36.9 40
91 2.3 40 83 6.2 40
78 35 40 75 2.5
CAIC 42 37 41 50 8.6 41 27 8.3
41 38 79 41 14 2.3 33
熵 0.7 0.7 0.6 0.6 0.6
LL,对数似然;AIC,赤池信息量准则;
AIC3,AIC的修订版本;CAIC,一致性赤池信息量准则;
BIC,贝叶斯信息量准则;VLMR,Vuong-Lo-Mendell-Rubin检验用于评估k簇模型是否比k+1簇模型更适合数据;
-2LL差异,每次增加一个簇时LL的变化;
BLRT 2 LL差异(P值),(k+1)与k簇模型的自助法似然比变化;熵,模型提供良好分离簇的能力(范围:0-1,数值越高越好)。
综合考虑多种适合度标准(CAIC和BIC)、简洁性、适当的簇大小和临床可解释性,确定四簇模型是最优的。重要的是,这个解决方案产生了临床上具有意义的疼痛改善轨迹,而在更简单的模型中则无法清晰区分。五簇模型并没有产生新的独特簇,而是将较大的组别分为具有略微不同模式的子组,而主要模式保持相似。
四簇模型中的参与者分布如下:1085人(40%)被归类为中等稳定疼痛簇,814人(30%)被归类为轻微稳定疼痛簇,445人(16.4%)被归类为高持续疼痛簇,396人(14.6%)被归类为逐渐改善疼痛簇(图1B)。除了轻微下降疼痛簇的均值后验概率为0.78外,每个簇的平均后验概率都超过0.80(补充材料,eTable 4)。
高持续疼痛簇的参与者特征是在基线时疼痛强度较高(平均值约为8/10),并且在两年随访期间保持较高水平(平均值约为7.6/10),表明疼痛持续严重。在中等稳定疼痛簇中,初始疼痛强度得分为6.70,两年内仅略有下降至大约6.0,反映了总体稳定的疼痛进程。轻微稳定疼痛簇的参与者基线平均疼痛强度为5.30,在随访期间下降了近一个点至4.27,表明有适度改善。最后,逐渐改善疼痛簇在疼痛强度上有了更大的减少,基于建议的最低临床重要差异(MCID)约为2分(在0-10的疼痛量表上)。在这个簇中,疼痛强度从基线的4.08下降到两年随访时的2.10。
在LCGA中加入性别作为协变量时,其总体效应不显著(Wald = 5.29,p = 0.15),表明男性和女性在疼痛轨迹簇中的分布相似。每个轨迹簇内的性别组成也相当。女性约占中等稳定疼痛簇的65.1%,轻微稳定疼痛簇的62%,高持续疼痛簇的58.4%,以及逐渐改善疼痛簇的66.8%。
使用完整数据集、过滤数据集和完整案例数据集进行的敏感性分析得出了相同的四簇解决方案,各数据集的轨迹形状和相对严重程度相似(补充材料,eFigure 2A至C)。所有分析中分配簇的平均后验概率均为中等至高,且过滤数据集中的最高(补充材料,eTable 4)。此外,在按轨迹严重程度协调簇标签后,82%的参与者在所有数据集中被分配到相同的轨迹簇。这些结果表明,考虑到纳入标准和缺失数据处理方法,四簇轨迹结构是相对稳定的。
在过滤数据集上进行的性别分层轨迹分析也显示,在两年随访期间疼痛轨迹非常相似(补充材料,eFigure 2D和E)。敏感性分析的详细结果在补充文件中。
相关性分析显示,疼痛影响变量与疼痛干扰和身体残疾有很强的相关性(r ≥ 0.80)(补充材料,eFigure 3)。由于疼痛影响包括四个关于疼痛干扰和身体残疾的问题,并且是这两个因素与疼痛强度的总和,因此将其从分析中移除以避免多重共线性问题。机器学习分析中包含的每个预测变量的缺失数据描述性统计数据显示在表3中。在检查多重共线性后,对预测特征的基线测量和缺失值进行了处理。基线测量包括平均值(标准差)或比例(百分比范围:最小值–最大值)。缺失值的数量和比例如下:
| 性别 | 年龄(岁) | BMI | 工作状态 | 接受的治疗历史 | 教育水平 | 疼痛持续时间(月) | 疼痛强度(分) | 疼痛干扰 | 身体残疾 | 生活质量 | 并发症 | 痛苦恐惧症 |
|------|--------|------|---------|----------|------------|------------|------------|---------|---------|------|
| 男性 | 46.5 | 29.1 | 全职 | 治疗性运动 | 本科 | 3–5个月 | 5.9 | 12.6 | 9.6 | 4.9 | 9.5 | 同意 |
| 女性 | 35 | 29.1 | 兼职 | 阿片类药物 | 硕士 | 6–11个月 | 5.9 | 12.6 | 9.4 | 4.9 | 同意 |
| 总计 | 81 | 29.1 | 35.3 | 疗法多样 | 本科 | 3–5个月 | 5.9 | 12.6 | 9.4 | 4.8 | 同意 |
在进行嵌套五折交叉验证、超参数调整并收集性能指标后,随机森林(Random Forest)被选为表现最好的分类器,其总体区分四个结果簇的能力如下:AUROC = 0.874,PPV = 0.690,F1 = 0.676,BA = 0.685,MCC = 0.543(表4)。在按轨迹簇评估性能时,随机森林分类器在所有四个簇中的表现都是一致的(补充材料,eTable 5)。具体来说,对于中度稳定疼痛簇,随机森林的AUROC = 0.801,PPV = 0.750,F1 = 0.743,BA = 0.647,MCC = 0.548;对于轻度稳定疼痛簇,相应的值为AUROC = 0.808,PPV = 0.600,F1 = 0.631,BA = 0.653,MCC = 0.517;对于高持续性疼痛簇,AUROC = 0.935,PPV = 0.718,F1 = 0.733,BA = 0.764,MCC = 0.571;对于逐渐改善的疼痛簇,AUROC = 0.893,PPV = 0.643,F1 = 0.636,BA = 0.746,MCC = 0.561。
表4. 机器学习分类器在最终测试集中的性能指标比较。
在嵌套五折交叉验证的每一折中,分类器的性能在补充材料中的eTables 6中有提供。每个簇中的校准曲线图和直方图以及每个分类器的混淆矩阵分别展示在补充材料中的eFigures 4和5中。需要注意的是,尽管随机森林在整体上表现出最强的区分能力,但逻辑回归(logistic regression)的校准曲线更紧密地跟随了各种簇中的身份线,表明预测概率与观察结果频率之间有更好的一致性。这种权衡对于临床预测建模很重要,因为准确的风险排名和可靠的概率估计可能有不同的目的。
使用SHAP分析来解释预后因素在队列中以及每个簇内对个体预测的贡献和方向性(图2)。在整个样本中,基线疼痛强度、疼痛干扰、身体残疾和灾难化被认为是最具影响力的因素,其次是教育水平和生活质量。在高持续性和中度稳定疼痛簇与轻度稳定疼痛和逐渐改善疼痛簇相比,疼痛强度、疼痛干扰、身体残疾和灾难化的特征表现出相反的方向效应。如图2中的SHAP beeswarm图所示,较高的疼痛强度、身体残疾、疼痛干扰和灾难化值正向预测了高持续性和中度稳定疼痛簇的归属,而负值则预测了轻度稳定疼痛和逐渐改善疼痛簇的归属。此外,较低的教育水平预测了高持续性和中度稳定疼痛簇的归属,而较高的教育水平预测了轻度稳定和逐渐改善疼痛簇的归属。
下载:下载高分辨率图像(429KB)
下载:下载全尺寸图像
图2. 通过SHAP Beeswarm图显示的特征重要性。每个点代表一个参与者。点的颜色反映了特征值(红色=高,蓝色=低),水平位置反映了该特征对模型输出的影响方向和大小。正的SHAP值表示属于相应簇的可能性增加,而负值则表示可能性降低。图中仅提供了前10个最重要的特征。
在特定簇的层面上,疼痛持续时间区分了轻度稳定疼痛和逐渐改善疼痛的轨迹:较长的疼痛持续时间预测了属于轻度稳定疼痛簇,而较短的疼痛持续时间则与属于逐渐改善疼痛簇相关。年龄是高持续性和逐渐改善疼痛簇的区分因素,年龄较大的人更可能属于高持续性疼痛簇,而年龄较小的人更可能属于逐渐改善疼痛簇。BMI仅与高持续性和轻度稳定疼痛簇相关,但在这两个轨迹中的方向效果相反。较高的睡眠干扰与所有稳定轨迹相关,而较低的睡眠干扰与逐渐改善的轨迹相关。
讨论
利用患有CLBP的个体队列,识别出了四个不同的疼痛轨迹簇。其中三个簇——中度稳定疼痛、轻度稳定疼痛和高持续性疼痛——在两年期间的疼痛水平变化很小,但在基线疼痛强度上存在显著差异。第四个簇代表逐渐改善疼痛组,在两年期间疼痛强度逐渐减少了2分(满分10分)。疼痛强度、疼痛干扰、身体残疾和灾难化是所有四个簇中疼痛轨迹归属的最重要基线预测因子。这些预后因素在高持续性和中度稳定疼痛簇与轻度稳定和逐渐改善疼痛簇中的效果相反。尽管如此,每个轨迹都有一组独特的影响因素。
男性和女性在疼痛轨迹簇中的分布相似。分性别的分析显示,男性和女性的轨迹模式相当,每个性别的簇的数量和形状也相同。尽管有这些相似之处,男性参与者更多地分布在中度稳定疼痛簇和高持续性疼痛簇中。女性更多地分布在轻度稳定疼痛簇中,而在逐渐改善疼痛簇中,两者的相对分布也相似(均为11.0%)。这些发现与先前的证据相反,先前的研究表明女性更可能报告较高的疼痛强度和更高的慢性疼痛风险。已有研究报道了性别与疼痛轨迹之间的关联。Tighe等人研究了年龄、性别和手术类型对术后疼痛轨迹的影响,发现男性的疼痛评分低于女性。然而,当前结果表明,在CLBP队列中,疼痛轨迹结构和相对簇分布可能在性别之间是可比的。这些发现强调了需要进一步的纵向研究来澄清性别分层的疼痛轨迹。
比较了因随访数据缺失而被排除在轨迹分析之外的参与者和被包括在内的参与者的基线特征。被排除的参与者略微年轻,男性比例较高,疼痛强度略高,更多报告疼痛持续了一到五年,失业者和“无文凭”的比例也较高;而被包括的参与者平均疼痛持续了五年以上。这些结果结合泊松回归(Poisson regression)证实数据没有多重缺失(MCAR)。这些差异表明存在选择性流失,可能会限制结果的普遍性。尽管如此,在完整数据集和完整案例数据集中重复进行LCGA时,仍然发现了相同的四簇结构和相似的轨迹形状。这种一致性表明,无论数据集是不完整还是完整的,轨迹都具有鲁棒性。然而,由于退出可能部分取决于未观察到的疼痛结果,因此不能排除信息性缺失,簇的普遍性或轨迹参数估计可能存在一些偏差。
本研究中使用的轨迹模型,特别是对于没有明显改善的簇,总体上与先前研究的发现一致。整个样本的疼痛轨迹在两年期间显示出轻微下降,这在临床上并不重要。Wallwork等人报告称,急性或亚急性LBP患者在最初的六周内往往会有显著改善,而CLBP患者则倾向于保持持续的高疼痛和残疾水平,且随时间变化很小。这与逐渐改善疼痛簇中基线疼痛持续时间较短的情况一致。尽管排除了急性 and 亚急性LBP患者,但较短的疼痛持续时间是一个预测逐渐改善疼痛簇的指标,这与较长疼痛持续时间的患者比例较高相符。
大多数参与者在两年内的疼痛轨迹都属于稳定疼痛簇(85%)。逐渐改善的疼痛轨迹虽然有一些改善,但所占比例相对较小,因此应谨慎解释。此外,由于随访期间接受的治疗没有得到控制,这一轨迹不应被解释为仅是自然改善的结果。最具影响力的预后因素似乎能够区分高疼痛强度簇和低疼痛强度簇的归属。那些疼痛强度较高、残疾严重和灾难化程度较高以及教育水平较低的人更可能属于高持续性和中度稳定疼痛簇,而相反情况的人则属于轻度稳定疼痛和逐渐改善疼痛簇。有研究表明疼痛强度、疼痛干扰和心理社会因素是疼痛轨迹的重要决定因素。较高的疼痛强度和残疾已被认为是慢性疼痛发展的潜在预测因子。最近的研究表明,在慢性疼痛患者中,虽然疼痛严重程度与死亡率无关,但经历较高疼痛干扰的人死亡率比没有疼痛干扰的人高33%。尽管许多因素影响了所有轨迹的归属,但每个轨迹似乎都有一组独特的影响因素。例如,较短的疼痛持续时间和较年轻的年龄特定于逐渐改善的疼痛簇。
灾难化、疼痛干扰和身体残疾在高疼痛簇与低疼痛簇中的相反方向效应似乎与恐惧-避免框架(fear-avoidance framework)部分一致。在这个模型中,较高的灾难化可能放大疼痛的感知威胁价值,促进避免和功能限制,从而导致疼痛持续。相反,较低的灾难化和较低的功能影响可能与持续参与活动和恢复更相关,这可以解释为什么这些因素与逐渐改善的疼痛簇呈相反方向的关系。然而,这种解释应谨慎进行,因为灾难化并未成为SHAP分析中最具影响力的预测因子之一。此外,灾难化和恐惧-避免是通过单项目分类问题评估的,而不是使用经过验证的多项目量表。具体来说,灾难化是通过问题“我认为我的腰痛非常严重,永远不会好转”来二分测量的(同意/不同意)。这个问题可能反映了一种特定于疼痛的负面评价或无助感,而不是灾难化的完整多维结构。它在SHAP分析中的重要性(每个轨迹的最重要预测因子之一)表明,适应不良的疼痛相关评价是区分不同轨迹的关键因素。然而,由于它是通过单一的二分问题测量的,其贡献可能低估了灾难化的广泛作用,或者仅仅反映了这种负面评价的重要性。
此外,教育水平与(慢性)疼痛之间的关联也已有研究,结果显示受教育程度较高的人可能有其他特征(如较高的社会经济地位或更好的医疗保健),这些特征可能导致较少的疼痛和较低的慢性疼痛风险。然而,社会经济地位的影响也应考虑在内。总的来说,影响疼痛的心理社会因素可能因个体的认知-行为特征而异,这可能解释了为什么相同的因素与不同的疼痛轨迹相关。
本研究的主要限制是由于随访数据不完整而排除了30.3%的参与者,这可能引入了选择偏差,并限制了结果对更广泛CLBP人群的普遍性。虽然这可能对潜在类别的估计产生偏差,但多次敏感性分析增加了我们对结果稳健性的信心。另一个限制是,研究的入组时间与COVID-19大流行导致的重大社会和医疗中断相吻合。在不同时间加入研究的参与者可能经历了截然不同的环境状况,例如医疗服务的获取变化、工作模式的变化、心理健康负担以及社交隔离。这些时期的影响可能会影响疼痛的发展轨迹、退出研究的情况以及基线的心理社会变量。此外,关于随访期间所接受干预或治疗的资料收集不足,这也可能影响疼痛的发展轨迹。参与者可能接受了多种药物、物理或心理治疗,但这些治疗的时间和强度并未被系统地记录下来。因此,观察到的疼痛变化至少部分反映了治疗效果,而非慢性下背痛(CLBP)的自然发展过程。需要指出的是,由于下背痛的诊断是自我报告的,没有进行临床分类,这可能导致自我选择偏差,从而难以区分特定类型和非特定类型的下背痛,增加样本的异质性。最后,尽管每个疼痛发展轨迹群都符合潜在类别分析的常见规模标准(至少占队列的10%),但群体规模的不平衡可能会降低分类的准确性,限制人们对少数群体轨迹归属的信心。
总之,虽然该队列中的大多数慢性下背痛患者在两年期间疼痛状况保持稳定,但有一小部分患者的疼痛有所改善。在疼痛强度较高和较低的疼痛轨迹群中,与疼痛相关的心理社会因素对群体归属的预测方向相反,这表明这些变量主要区分的是基线时的疼痛严重程度,而非疼痛轨迹随时间的具体变化形态。尽管如此,某些因素在各个群体中具有特异性:年轻年龄、较低的睡眠障碍和较短的疼痛持续时间仅与逐渐改善的疼痛轨迹相关。这个疼痛群体虽然规模较小(占15%),但在两年的随访期间出现了具有临床意义的疼痛减轻,但这种变化更多体现了疼痛的改善而非完全康复。总体而言,这项研究提供了关于慢性下背痛不同时间演变的新信息,并确定了其最具影响力的因素;然而,鉴于研究排除了仅具有基线数据的参与者,这些发现应谨慎解读。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号