《ESMO Real World Data and Digital Oncology》:Registry-based randomised phase II study of Enzalutamide versus Abiraterone: assessing cognitive function in eLderly patients with metastatic castration-resistant Prostate cancer (REAL-Pro)
编辑推荐:
本综述围绕REAL-Pro研究展开,这是一项在真实世界临床注册数据库中开展的实用性随机对照试验,旨在比较两种雄激素受体通路抑制剂(ARPI)——恩杂鲁胺与阿比特龙——对高龄(≥75岁)转移性去势抵抗性前列腺癌(mCRPC)患者认知功能(BOMC量表)、抑郁(GDS量表)及跌倒风险(FRQ量表)等患者报告结局的影响。研究发现,恩杂鲁胺组在12周时有认知、抑郁及跌倒风险评分恶化的趋势;同时,基线抑郁与跌倒风险评分与更短的治疗失败时间(TTF)及总生存期(OS)相关。研究强调了在老年患者启动ARPI治疗前进行个体化评估的重要性,并探讨了基于注册登记的随机化试验(RRCT)在真实世界研究中的优势与挑战。
引言
前列腺癌是全球男性中最常见的非皮肤恶性肿瘤,其发病率随年龄增长而增加。在澳大利亚,前列腺癌诊断的中位年龄为69岁。然而,年龄≥75岁的患者在传统临床试验中代表性普遍不足。尽管该年龄段患者占新发癌症诊断的30%,但在临床试验参与者中仅占12%。因此,在真实世界环境中治疗许多患者时,关于预期获益和不良事件(AE)风险的数据有限。
在澳大利亚的真实世界前列腺癌注册库中,43%被诊断为转移性去势抵抗性前列腺癌(mCRPC)的男性年龄≥75岁。这些老年患者通常接受雄激素受体通路抑制剂(ARPIs)治疗mCRPC,治疗选择常受基线合并症影响。虽然一些回顾性真实世界研究表明,与阿比特龙相比,恩杂鲁胺具有更高的前列腺特异性抗原(PSA)缓解率,在某些情况下还能改善生存,但在老年人群中尚无随机试验比较这两种药物。
由于不良结局风险升高,患者报告结局和生活质量在老年人群中尤为重要。既往研究显示,恩杂鲁胺治疗开始后3个月,即可观察到客观和主观认知功能指标的下降。与阿比特龙相比,年龄>75岁的患者接受恩杂鲁胺治疗也显示出较差的健康相关生活质量指标。尽管综合老年评估(CGA)已证明其有潜力预测老年癌症患者的毒性和预防住院,但其资源密集,尚未广泛融入常规肿瘤学实践。因此,指导老年人群治疗决策的最佳评估方法仍不明确。
基于注册登记的随机对照试验(RRCT)是一种新兴的方法学,它通过实用性设计和广泛的入组标准,能更好地代表真实世界人群,从而提高外部有效性和普适性。这对于与老年患者相关的问题尤其具有吸引力,他们在常规实践中接受研究药物治疗,却在标准试验中代表性不足。虽然临床注册库在肿瘤学中常用于收集真实世界数据、分析治疗模式和比较结局,但缺乏随机化会引入潜在的选择偏倚和混杂因素,从而影响结局。RRCT通过纳入随机化,允许在真实世界人群中进行高质量的前瞻性试验设计。这些试验嵌入现有的注册库中,因此成本和资源需求显著降低。
材料与方法
REAL-Pro研究是一项RRCT,利用现有的电子前列腺癌澳大利亚数据库(ePAD)进行前瞻性数据收集。年龄≥75岁、经治疗医师判断适合接受全剂量阿比特龙或恩杂鲁胺治疗的mCRPC患者被随机分配至任一治疗组。患者根据先前是否使用过多西他赛化疗进行分层。排除标准包括曾接受过多西他赛以外的mCRPC全身治疗,或无法完成电话评估。
在获得知情同意后,由中心研究协调员在治疗医师联系并确认资格后进行实时随机化。在基线(开始治疗后7天内)和12周(±7天)通过电话访谈进行评估,使用经过验证的工具:Blessed定向-记忆-集中测试(BOMC)、老年抑郁量表(GDS)和跌倒风险问卷(FRQ)。BOMC是一个用于评估认知功能的六项评分工具,产生连续分数,已通过电话验证。FRQ评分基于临床检查对跌倒风险具有高度预测性。GDS是一个15项自评工具,与抑郁症状高度相关。
主要目标是基于BOMC评分变化比较治疗组间的认知功能下降。次要目标包括比较GDS抑郁发生率、跌倒事件、严重不良事件、PSA50缓解率、治疗失败时间(TTF)和总生存期(OS)。PSA50缓解率定义为治疗期间PSA从基线下降≥50%的患者比例。TTF定义为从治疗开始到因疾病进展而停止治疗的时间。OS定义为从随机分组到死亡日期的时间。
结果
研究在2019年6月至2023年9月期间入组了76名mCRPC患者。最终因入组缓慢于2023年12月提前关闭。患者中位年龄为81岁。40名患者被随机分配至阿比特龙组,36名分配至恩杂鲁胺组。基线特征在两组间基本匹配,但阿比特龙组糖尿病患者比例更高(25% vs 3%)。76名患者中有56名(74%)完成了两次电话评估。
在12周时,两组间任何评估工具的基线或12周平均评分均无统计学显著差异。然而,在混合效应线性回归模型中,接受恩杂鲁胺治疗的患者在BOMC(+0.64 vs -0.51,P= 0.46)、GDS(+0.70 vs +0.06,P= 0.06)和FRQ(+1.4 vs -0.12,P= 0.06)的12周平均评分变化均呈数值上的升高(表明恶化趋势)。恩杂鲁胺组有更高比例的患者出现BOMC(39% vs 29%)和GDS(46% vs 29%)评分恶化。
两组在PSA50缓解率(阿比特龙50% vs 恩杂鲁胺39%)、TTF和OS方面均无统计学显著差异。不良事件发生率也相似(阿比特龙37.5% vs 恩杂鲁胺31%)。恩杂鲁胺组有6名(21%)患者发生跌倒,阿比特龙组为3名(11%)。12周FRQ评分与跌倒发生率显著相关。
单变量分析显示,较高的基线GDS评分与较短的TTF相关[风险比(HR) 1.3, 95%置信区间(CI) 1.05-1.6, P= 0.014],较高的基线FRQ评分也是如此(HR 1.12, 95% CI 1.09-1.22, P= 0.012)。较高的基线GDS评分也与较差的OS相关(单变量HR 1.4, 95% CI 1.12-1.76, P= 0.004),这在多变量分析中仍然成立(HR 1.37, 95% CI 1.02-1.85, P= 0.037)。年龄增加与较差的OS单变量相关。随机分配的ARPI种类或既往是否使用多西他赛与TTF或OS均无显著关联。
讨论
REAL-Pro是首个在晚期前列腺癌中开展的RRCT,也是首个比较老年mCRPC患者接受不同ARPI治疗结局的随机研究。尽管本研究样本量小且统计效能不足,但证明了简化评估工具用于指导临床实践的潜在适用性。年龄≥75岁接受恩杂鲁胺治疗的患者在ARPI治疗12周后FRQ评分数值更高,且BOMC、FRQ和GDS的基线至12周平均评分变化较阿比特龙组呈恶化趋势。单变量分析显示,基线GDS和FRQ评分与TTF和OS相关,而12周较高的GDS评分与TTF相关。12周FRQ评分也与跌倒发生率相关。
重要的是,本研究也凸显了进行RRCT面临的若干挑战(标准RCT亦常见),这些挑战最终导致研究提前关闭。我们的经验和见解将有助于改进未来的RRCT设计和实施。最近发表的COGCaP研究(一项非随机队列研究)同样显示了入组缓慢的问题。非随机ACE研究也显示了在所有年龄段mCRPC患者中,阿比特龙与恩杂鲁胺的复合认知结局相当,但恩杂鲁胺组疲劳、抑郁和感知认知缺陷更严重,这与我们的随机研究发现一致。
有大量数据支持使用CGA,证明其与治疗毒性和住院风险相关。国际指南建议对所有年龄>65岁的患者进行评估,但这些评估耗时耗力,因此在许多真实世界肿瘤环境中不可行。研究表明,CGA在<50%的老年癌症患者中使用,时间限制是常见障碍。因此,使用本研究采用的经过验证的工具进行筛查评估可能更实用,有助于优先识别需要进一步综合测试或监测的患者。
本研究中,两组间治疗疗效(包括PSA缓解率、TTF和OS)无显著差异。两项随机试验表明,在mCRPC中,恩杂鲁胺比阿比特龙具有更高的PSA缓解率,但疾病进展时间和OS相似。一些回顾性分析提示恩杂鲁胺比阿比特龙有更优的OS,这可能受到选择偏倚和心血管风险增加的影响。然而,一项针对老年患者的回顾性分析显示,与阿比特龙相比,恩杂鲁胺导致更多剂量减少和更早停药,但生存结局相似。
本研究中观察到的OS低于关键性PREVAIL和COU-AA-302研究,后者分别有35%和32%的患者年龄≥75岁。考虑到ePAD中43%的患者在诊断为CRPC时年龄≥75岁,这一真实世界人群中更多的合并症可能影响了生存。在PREVAIL和COU-AA-302的老年患者亚组中,不良事件发生率更高。本研究的跌倒发生率为17%,但总体不良事件率低于关键试验,这可能反映了注册库与临床试验定义上的差异。
优化RCT研究设计对于成功实施至关重要。REAL-Pro入组缓慢可能反映了临床均衡性的缺乏,因为真实世界中合并症和多药治疗的普遍存在导致患者或临床医生倾向于选择某一种ARPI。随后的ePAD数据回顾性分析强调,在ePAD患者子集中,72%的患者存在与阿比特龙潜在的合并症相互作用,14%与恩杂鲁胺存在;同时,44%的患者存在与阿比特龙有临床意义的药物相互作用,67%与恩杂鲁胺存在。
先前的研究表明,尽管疗效相似,恩杂鲁胺与所有患者更严重的神经认知缺陷以及年龄≥75岁患者更差的生活质量相关。我们的数据也表明,在我们的注册人群中,恩杂鲁胺的使用率高于阿比特龙。因此,我们旨在针对代表性不足的老年人群进行RRCT,以回答一个有临床意义的问题。我们的结果与这些先前的RCT和回顾性研究一致。
REAL-Pro的小样本量是一个重大的意外限制,源于治疗格局的变化以及入组期间新数据出现后临床均衡性的降低。这限制了统计效能,因此我们的许多数据显示了有趣的趋势但未达到统计学显著性。尽管如此,不同毒性特征的提示以及可将实际应用于临床实践的老年筛查测试进行整合的潜力,值得进一步研究。尽管随着ARPIs在激素敏感性前列腺癌(HSPC)环境中更常使用,入组受到治疗格局变化的限制,但我们的结果仍然具有相关性,因为毒性特征的差异以及对患者报告结局的影响在这种更早期的治疗环境中将越来越重要,因为患者更有可能接受更长时间的治疗。
另一个限制是患者报告结局评估工具可能不够灵敏,无法检测到细微但重要的差异。本研究中使用的工具已在肿瘤学环境中得到验证,并作为本实用性研究设计的一部分被选用,具有整合到真实世界临床护理中的潜在可行性。虽然更耗时,但CGA可能涵盖更多健康相关生活质量评估的领域。例如,BOMC不测试执行功能,而执行功能可能是影响生活质量的早期细微认知障碍迹象。此外,尽管先前的研究表明认知变化可以早期检测到,但累积效应可能会在本研究时间范围之外进一步影响认知和生活质量。然而,尽管存在这些限制,本研究中检测到的趋势以及某些评分与TTF和OS的关联,凸显了这些工具在真实世界环境中筛查脆弱患者的潜在价值。
结论
我们的研究结果表明,在真实世界老年男性mCRPC队列中,不同ARPI的毒性特征存在差异。较低评分与长期结局的关联凸显了在老年男性开始ARPI治疗前和治疗期间,对认知、抑郁和跌倒风险进行个体化评估的重要性。
虽然基于注册登记的试验具有实用性,并且在提高这一代表性不足人群的包容性和普适性方面具有若干优势,但我们在进行REAL-Pro过程中的经验也凸显了在实施和招募方面可能面临的挑战。REAL-Pro入组缓慢可能与治疗选择缺乏临床均衡性有关。计划进行的定性亚研究将增加对临床医生和患者观点的理解,以识别障碍并制定策略,改进未来的RRCT设计和实施。