《Neurology and Therapy》:Incorporating Patient Perspectives into a Composite Score for Measuring Disease Progression in Spinocerebellar Ataxia (SCA)
编辑推荐:
本研究探讨了将患者反馈纳入脊髓小脑共济失调(SCA)疾病进展复合评分(SCACOMS)的可行性。研究人员通过半结构化访谈获取了患者对SCACOMS各项目重要性的评估权重,并将其与通过偏最小二乘(PLS)回归建立的统计优化权重进行整合与对比。结果表明,纳入患者视角虽能提升量表的患者中心性与表面效度,但会降低其检测疾病进展变化的灵敏度,揭示了临床试验终点指标设计在统计效率与患者相关性之间的潜在权衡。
在罕见神经系统疾病的治疗探索中,如何精准、高效地评估疾病进展是药物研发的关键挑战。以脊髓小脑共济失调(Spinocerebellar ataxia, SCA)为例,这是一组由基因突变引起的、以运动协调功能进行性恶化为特征的疾病,目前尚无获批的疾病修正疗法。评估SCA的病情变化,临床研究者们手头有两类常用工具:一类是关注步态、姿势等具体症状的功能性共济失调评估和评定量表(functional Scale for the Assessment and Rating of Ataxia, f-SARA),另一类是依赖临床医生整体判断的临床医生整体印象变化(Clinician Global Impression of Change, CGI-C)。然而,f-SARA可能遗漏患者的细微变化或其他非共济失调症状,而CGI-C虽具个性化,但其灵敏度未经专门优化。为此,研究人员此前开发了一个名为SCA复合评分(SCACOMS)的工具,它通过一种名为偏最小二乘(Partial Least Squares, PLS)回归的统计方法,将f-SARA的四个子项目(步态、姿势、坐姿、言语)与CGI-C的评分融合起来,并根据它们对1年疾病进展变化的“响应度”分配了权重。这个“统计优化版”的SCACOMS在灵敏度上表现出色。
但这里浮现出一个深层问题:这个由冰冷算法计算出的最优权重,真的反映了患者亲身经历中最为困扰、最希望改善的症状吗?换言之,统计上的“高效”与患者感受的“相关”,哪个更重要?近年来,全球药品监管机构(如美国FDA)日益强调在临床试验中纳入“患者视角”,要求评估工具能够真正衡量患者“感受、功能和生存”的改善。那么,能否在SCACOMS中融入患者的意见,做到“鱼与熊掌”兼得?这正是本篇发表在《Neurology and Therapy》上的研究想要探索的核心:通过一种新颖的方法,将患者反馈整合进统计优化的SCACOMS项目权重中,并检验这种“融合”对量表灵敏度的影响。
为了回答上述问题,研究人员展开了一项结合定性访谈与定量分析的探索性研究。他们首先回顾了此前对16名轻中度SCA患者进行的半结构化访谈结果,该访谈旨在评估SCACOMS的内容效度。在这些访谈中,患者们被要求对构成SCACOMS的五个项目(f-SARA的四个项目和CGI-C)按其个人感知的重要性进行排序和权重分配。接着,研究者将这些“患者赋权”的权重与原始的“PLS优化”权重进行对比,并尝试了两种融合方案:第一种是简单地将两种来源的权重进行50/50平均;第二种则是响应患者访谈中反映的倾向(即更看重具体症状,而非医生的整体印象),将CGI-C的权重上限设定为20%,然后在此基础上对剩余四个项目的PLS权重和患者权重进行不同比例(如25/75、50/50、75/25)的混合。研究的关键评估指标是1年期“均值与标准差之比(Mean to Standard Deviation Ratio, MSDR)”,该比值越大,代表量表对疾病进展变化的灵敏度越高。最终,他们在一个合并了两个大型自然病史研究队列(CRC-SCA和EUROSCA)的全球数据集中,比较了不同权重方案下SCACOMS的MSDR表现,并计算了相应的临床试验所需样本量,以直观展示灵敏度的变化对研究效率的影响。
本研究主要运用了以下关键方法:1. 偏最小二乘(PLS)回归建模:用于从自然病史数据中推导出初始SCACOMS各项目的统计最优权重。2. 定性访谈与内容分析:通过半结构化访谈,从SCA患者处获取其对疾病各维度重要性的主观权重赋值。3. 权重整合与灵敏度分析:采用不同的数学组合方式(如平均、设定上限)将统计权重与患者权重融合,并使用“均值与标准差之比(MSDR)”量化评估不同权重方案下量表对1年、2年及3年疾病进展的检测灵敏度。4. 样本量估算:基于不同MSDR值,模拟计算在假定治疗效果(如减缓进展30%)和统计功效(80%)条件下,临床试验所需的分组样本量,以评估方法学选择对研究可行性的影响。研究所用患者数据来源于临床研究协作组-脊髓小脑共济失调(CRC-SCA)和欧洲脊髓小脑共济失调整合项目(EUROSCA)这两个自然病史队列。
结果
不同权重方案下项目贡献度的变化
研究通过图表直观对比了原始量表、PLS衍生量表、患者衍生量表以及不同组合方案下各项目的权重分配。如预期所示,当采用PLS权重与患者权重的50/50组合时,CGI-C的贡献度相较于纯统计衍生量表有所下降,尽管它仍然是最大的贡献者。这种下降导致权重被重新分配给其他项目,其中患者认为最相关的“步态”项目权重增加最为显著。“姿势”项目的权重在不同方法间保持相对稳定,反映了统计分析与患者赋值之间在该项目上的良好一致性。在将CGI-C贡献度上限设定为20%的方案中,步态、姿势、言语和坐姿等项目获得了比统计衍生量表更大的权重。例如,在CGI-C上限为20%的50/50组合中,步态的权重从PLS衍生量表的12.3%提升至27.3%。不同比例(25/75, 50/50, 75/25)分割方案下f-SARA各项目权重的分布相似。
不同权重方案下量表的灵敏度(MSDR)比较
结果显示,正如设计初衷,PLS衍生的SCA复合评分(SCACOMS)在1年时具有最高的MSDR(0.99),这表明其在典型的SCA临床试验期间对临床衰退具有最佳的灵敏度。单纯使用患者赋权的权重所得的MSDR(0.71)虽高于原始的f-SARA(0.50),但仍低于PLS衍生量表(0.99)和原始的CGI-C(0.96)。赋予PLS衍生权重和患者权重同等贡献(即50/50组合)的方法,保持了相对较高的MSDR(0.91)。将CGI-C的贡献上限设为20%并重新分配f-SARA项目权重的方案,将1年期MSDR降低至0.78。这虽然低于50/50组合,但仍优于原始的f-SARA和单纯的患者赋权量表。在CGI-C上限为20%的方案中,改变患者赋权与PLS衍生权重的混合比例对MSDR影响甚微(均为0.79),表明这些变化对量表疾病进展灵敏度的有限影响。这些结果暗示,CGI-C是量表响应度的主要驱动因素。在2年和3年的MSDR分析中也观察到类似的趋势。
不同疾病严重程度亚组的灵敏度分析
使用轻度患者权重和中度患者权重单独计算时,1年期MSDR分别为0.63和0.77。将CGI-C贡献上限设为20%并采用PLS与患者权重各半的组合时,无论使用合并权重还是按严重程度划分的特定权重,得出的MSDR都相似。
对临床试验样本量的影响
研究进一步考察了量表灵敏度变化对潜在临床试验的影响。假设治疗组与安慰剂组1:1随机化,药物治疗能使疾病进展减缓30%,并具有80%的统计功效,那么使用MSDR为0.99的量表(如PLS衍生的SCACOMS),每个治疗组需要179名患者。相比之下,使用MSDR为0.79的量表(如纳入患者相关性的SCACOMS),每个治疗组则需要281名患者,样本量需求增加了57%。
结论与讨论
本研究提出了一种增强统计衍生复合量表内容效度的新方法,即纳入患者视角,并评估了其对响应度的影响。研究展示了一系列整合两种来源证据的新方法,旨在平衡检测进展的统计优化与患者对相关性的评估。
研究揭示了一个核心的权衡关系。单独使用患者赋权会使PLS衍生量表的灵敏度降低30%。尽管其灵敏度远低于统计优化版本,但值得注意的是,患者赋权的复合量表仍比原始的f-SARA灵敏度高出40%,这表明设计基于直接患者反馈且具有更高响应度的量表是可行的。为了调和这种差异,将两种方法等权重结合,所产生的MSDR仅略低于完全统计优化的SCACOMS,同时更大程度上与患者的优先关切保持一致。这些发现表明,在旨在开发更贴近患者生活经历和价值观的量表时,适度的灵敏度权衡可能是可以接受的。这构成了一个折中方案:一端是适用于疾病修正疗法试验的最高效量表,另一端是能识别症状性治疗最佳目标的量表。融入患者偏好与维持研究统计功效之间的权衡,应在具体研究的可行性和背景中予以考量。虽然由此产生的复合量表可能并非理想地适用于对变化的响应度(统计衍生)、患者中心性(患者衍生)或跨试验可比性中的任何单一目标,但本研究应用的新方法试图弥合监管机构所指出的差距。这样的量表可能有助于提高临床试验的效率,同时通过在其构建中增加患者意义而获得支持,这为其在治疗作用机制或持久性不确定时被选为终点指标增加了信心。
研究进一步探讨了量表响应度对临床试验样本量的影响。从高响应度的统计衍生指标转向调整为患者权重的复合量表(其对变化的灵敏度较低),每个研究组所需的样本量增加了超过100名参与者。这凸显了转向灵敏度较低的量表时预期的试验效率下降;这一权衡必须与使项目权重与患者优先级保持一致的目标进行协调。更大的样本量需求可能会推迟有效疾病修正疗法的可及性,从而可能影响患者的福祉。这突显了权衡存在于两个相互竞争的患者优先事项之间:快速识别并推广有效治疗,以及确保治疗集中于对患者最重要的症状和影响。
本研究的优势在于尝试整合患者声音,以提高先前已验证的统计量表的可用性和相关性。据我们所知,这是首个将定性研究结果整合到为评估疾病进展而定量开发的复合量表中的研究。然而,本研究也存在局限性。患者赋权权重来源于对美国SCA 1、2、3型患者的定性访谈,其结果可能无法推广到其他表型或不同地理、社会文化背景的患者。此外,研究继承了原始PLS衍生SCACOMS研究的方法学限制,即依赖CGI-C作为锚定量表,而非患者整体印象变化(PGI-C)。尽管后者本可通过纳入患者报告的变化印象来增强SCACOMS的患者中心性,但在用于推导复合量表的数据集中无法获得这些数据。最后,CGI-C权重20%的上限设定具有一定随意性,其目的是反映定性研究中患者倾向于给予该项目低于统计模型权重的意见。
总之,这项研究探索了一种将患者视角纳入统计衍生复合量表的新途径,其动机在于提高量表与SCA患者生活经历的一致性。研究结果表明,将患者视角融入SCACOMS的采纳和推导过程,可以提高这一优化用于检测疾病进展的指标的患者中心性,可能增强其接受度和采纳度。然而,这一更新在提升患者中心性的同时,也伴随着检测疾病进展的灵敏度下降和试验效率降低的代价。因此,根据计划的使用情境,决定通过纳入患者偏好来降低研究检测疾病进展的统计功效时,应与研究可行性方面的考量进行权衡。