《Frontiers in Pharmacology》:A comparative review of economic evaluations for immune checkpoint inhibitors in early stage and advanced stage cancer: focusing on pembrolizumab
编辑推荐:
本文系统比较了早期与晚期癌症中免疫检查点抑制剂(ICIs)经济学评估方法的差异,聚焦帕博利珠单抗(pembrolizumab)在黑色素瘤、三阴性乳腺癌(TNBC)及肾细胞癌(RCC)中的应用。研究发现早期癌症评估更常采用马尔可夫模型(Markov model)、更长的时间跨度及治愈假设(cure assumption),且成本效益结论更优(p < 0.05)。同时揭示了技术评估(TAs)与学术文章在时效性假设等方法学上的分歧,呼吁建立分期特异性建模指南。
引言
免疫检查点抑制剂(ICIs)通过阻断免疫细胞(如T细胞)与癌细胞表达的免疫检查点蛋白发挥作用,包括程序性死亡蛋白1(PD-1)、程序性死亡配体1(PD-L1)及细胞毒性T淋巴细胞相关抗原4(CTLA-4)抑制剂。这类药物最初多用于无法手术的晚期或转移性疾病,但近年来逐渐作为辅助治疗应用于适合根治性治疗的早期癌症患者。
早期与晚期癌症在疾病进展、治疗手段及预后上存在显著差异:早期癌症通常采用根治性手术联合围术期治疗,预后较好但存在局部复发(LR)或远处转移(DM)风险;晚期癌症则难以手术,依赖全身治疗,生存结局较差。这些临床差异提示,在卫生经济学评估中,不同分期可能需要差异化的模型结构、时间跨度及关键假设。
自2018-2019年ICIs获批用于早期癌症辅助治疗以来,针对早期癌症的ICIs经济学评估逐渐涌现,但既往系统综述多聚焦于晚期癌症,缺乏对早期癌症的专门探讨,更鲜见分期特异性方法学的对比研究。此外,提交给卫生技术评估(HTA)机构(如英国国家卫生与临床优化研究所[NICE]的技术评估[TAs])的学术文章与TAs本身在经济评估方法上的一致性也缺乏证据。鉴于帕博利珠单抗已在多种癌症类型及分期中获得监管批准,本研究以其为例,比较早期与晚期癌症的经济学评估差异,并分析TAs与学术文章在各分期的方法学异同。
方法
癌症类型选择
纳入同时满足以下条件的癌症类型:1)截至2024年7月,帕博利珠单抗获美国FDA批准用于早期辅助(术前/术后)及晚期一线/后续治疗;2)至少被NICE、加拿大药品局(CDA-AMC)或澳大利亚药品福利咨询委员会(PBAC)之一评估过早期与晚期适应症。黑色素瘤、非小细胞肺癌(NSCLC)、三阴性乳腺癌(TNBC)及肾细胞癌(RCC)均符合条件,但因NSCLC早期TAs缺失,最终选定黑色素瘤、TNBC及RCC。
已发表经济学评估文章的系统性文献综述
检索PubMed、Embase及Cochrane Library数据库,检索策略涵盖癌症类型、帕博利珠单抗及经济学评估关键词。经去重后,按预设纳入排除标准进行两步筛选:第一步通过标题摘要排除无关文献,第二步通过全文评估纳入符合标准的文章。纳入标准包括:1)针对选定癌症类型的经济学评估;2)采用成本效用分析(CUA)并报告增量成本效用比(ICERs,以每质量调整生命年[QALY]增益的成本表示);3)英文发表。排除标准为:未报告详细方法与结果、评估多治疗序贯方案、摘要或海报展示。两名研究者独立筛选,分歧由第三名研究者仲裁。检索遵循Cochrane协作网及PRISMA指南,方案注册于PROSPERO(CRD42025646192)。
采用卫生经济学评估标准(CHEERS)清单评估文章方法学质量与报告透明度,涵盖研究视角、时间跨度、贴现率、健康结局测量与赋值、不确定性处理及模型假设透明度等维度,结果用于解释结论而非排除文章。
技术评估(TAs)的选择
回顾NICE(最终指南、草案指南及委员会文件,含制造商提交数据与证据审查组[ERG]评估)、CDA-AMC(2021年前经济指南报告,2021年后含临床、药物经济学及利益相关方输入的整合报告)及PBAC(按产品与会议日期整理的公共摘要文件)截至2024年7月的TAs,仅纳入采用CUA(排除成本最小化或价格比较)且针对选定癌症类型的评估。
数据提取
从已发表文章与TAs中提取基例分析数据,排除仅出现在情景分析的数据。文章提取内容包括:癌症分期(早期/晚期)、适应症、模型类型(马尔可夫模型/分区生存模型[PSM])、模型健康状态、时间跨度与研究视角;治疗效应衰减(waning)、治愈假设、效用方法(基于进展/基于至死亡时间[TTD])、模型中是否纳入后续治疗、帕博利珠单抗疗程、相对剂量强度(RDI)考量及治疗成本效益结论。TAs提取内容包括:癌症分期、适应症、干预与对照、模型类型、健康状态、时间跨度、治愈假设、治疗效应衰减、效用方法、RDI考量、是否推荐及推荐时机。未明确报告治愈假设、治疗效应衰减或RDI的项目归类为“未应用”。
已发表文章中早期与晚期癌症的比较
比较早期与晚期癌症文章在模型类型、健康状态、时间跨度、视角、治疗效应衰减、治愈假设、效用方法、后续治疗、帕博利珠单抗疗程及RDI的应用差异,并对比成本效益结论。统计学比较采用卡方检验(显著性水平5%),若>20%期望频数<5则用Fisher精确检验,所有分析通过IBM SPSS完成。
已发表文章与TAs的比较
分别针对早期与晚期癌症,比较已发表文章与TAs在模型类型、健康状态、时间跨度及TAs频繁讨论的关键方法学要素(治愈假设、治疗效应衰减、效用方法、RDI)的差异,并分析这些方法学要素对文章成本效益结论的影响。
结果
已发表文章与TAs的检索结果
共识别黑色素瘤228篇、TNBC 45篇、RCC 134篇文章,经筛选最终纳入黑色素瘤17篇(早期9篇,晚期8篇)、TNBC 6篇(早期4篇,晚期2篇)、RCC 18篇(早期3篇,晚期15篇)。TAs方面,黑色素瘤12项(NICE 4项,CDA-AMC 3项,PBAC 5项)、TNBC 7项(NICE 2项,CDA-AMC 2项,PBAC 3项)、RCC 6项(NICE 3项,CDA-AMC 3项)。纳入文章CHEERS清单依从性中等至较高,详细质量评估结果见补充材料。
已发表文章中早期与晚期癌症的比较
表1总结了黑色素瘤、TNBC及RCC的已发表文章特征。模型类型方面,早期癌症更多使用马尔可夫模型(93.8% vs 40.0%,p < 0.001),晚期癌症则以PSM为主(56.0% vs 0%)。早期文章更常纳入≥4个健康状态,细分局部复发(LR)与远处转移(DM)(93.8% vs 0%,p < 0.001);晚期文章则普遍采用3个健康状态(无进展[PF]、进展[PD]、死亡)(100% vs 6.3%,p < 0.001)。早期文章时间跨度更长,虽≤20年的比例在晚期更高(56.0% vs 18.8%,p=0.056),但无统计学显著性。治疗效应衰减在两期均未应用。晚期文章均无治愈假设,而约38%的早期文章采用了该假设(p=0.002)。效用方法上,晚期文章约25%使用TTD-based效用,早期文章均未使用(p=0.021)。
后续治疗中,早期文章均纳入全身治疗(100% vs 60.0%,p=0.003),37.5%纳入手术(vs 0%,p=0.002),18.8%纳入放疗(vs 0%,p=0.053);晚期文章则更多纳入最佳支持治疗(32.0% vs 12.5%,p=0.265)及其他治疗(32.0% vs 0%,p=0.014)。帕博利珠单抗疗程方面,晚期文章多采用“直至进展或最长2年”(76.0% vs 0%,p<0.001),早期文章则以1年为主(56.3% vs 0%)。RDI在治疗成本计算中,早期文章应用比例显著高于晚期(68.8% vs 16.0%,p<0.001)。成本效益结论显示,早期癌症中帕博利珠单抗更易被评为具有成本效益(87.5% vs 36.0%,p=0.003)。
已发表文章与TAs的比较
黑色素瘤
早期黑色素瘤中,所有TAs与8/9文章使用含复发-free(RF)、LR、DM、死亡的马尔可夫模型。时间跨度方面,NICE接受46年与40.7年,CDA-AMC与PBAC分别为5-25年与10年;多数文章(不同于CDA-AMC/PBAC建议)采用46年、40.7年或无具体期限的终生(lifetime)。一篇采用5年短时限的文章得出非成本效益结论,而其他长时限文章均认为具有成本效益。NICE与CDA-AMC建议在10年时应用治愈假设,多数文章也在≥10年时应用,模式相似。CDA-AMC与PBAC建议治疗效应衰减,但文章均未应用。所有TAs与文章均采用基于进展的效用方法。RDI方面,仅NICE在TAs中接受,CDA-AMC与PBAC不接受;9篇文章中5篇应用RDI,4篇未应用。
晚期黑色素瘤中,NICE与PBAC接受含PF、PD、死亡的PSM,所有文章均采用PSM。时间跨度上,NICE接受30年,CDA-AMC与PBAC为5-10年;所有文章均采用20-40年或终生。治愈假设与治疗效应衰减在两期TAs与文章中均未涉及。NICE接受TTD-based效用,CDA-AMC与PBAC推荐基于进展的效用;8篇文章中4篇使用TTD-based效用,均得出成本效益结论。RDI同样仅NICE接受,2篇应用RDI的文章显示成本效益,未应用的更多认为非成本效益(表2)。
TNBC
早期TNBC中,所有TAs与文章使用含事件-free(EF)、LR、DM、死亡的马尔可夫模型。时间跨度方面,NICE与CDA-AMC接受51年,PBAC接受30年;所有文章均采用51年或32年,与TA建议一致。TAs与文章均未推荐或提及治愈假设。双方均采用基于进展的效用方法。治疗效应衰减被CDA-AMC与PBAC推荐,但文章均未实施。RDI被NICE与PBAC接受,且所有文章均应用。
晚期TNBC中,所有TAs采用含PF、PD、死亡的PSM;多数文章也包含这3个状态,但1篇使用马尔可夫模型。时间跨度上,NICE接受35年,CDA-AMC与PBAC推荐10-20年;两篇发表文章分别采用10年与20年,其中10年者认为非成本效益,20年者认为成本效益。NICE建议治疗效应衰减,但文章均未应用。NICE接受TTD-based效用,CDA-AMC与PBAC推荐基于进展的效用;两篇文章中,TTD-based效用者认为成本效益,基于进展者认为非成本效益。RDI被NICE接受,1/2文章应用且该文章显示成本效益,未应用的则否(表3)。
RCC
早期RCC中,所有TAs与2/3文章使用含EF/RF、LR、DM、死亡的马尔可夫模型,1篇文章使用不同健康状态划分。时间跨度方面,NICE与CDA-AMC接受51年,PBAC接受30年;2篇文章采用51年,1篇采用32年。TAs与文章均未推荐或提及治愈假设。双方均采用基于进展的效用方法。治疗效应衰减被CDA-AMC与PBAC推荐,但文章均未实施。RDI被NICE与PBAC接受,且所有文章均应用。
晚期RCC中,所有TAs采用含PF、PD、死亡的PSM,所有文章均采用PSM。时间跨度上,NICE接受30年,CDA-AMC与PBAC为10-20年;多数文章采用20年或30年,1篇采用10年。治愈假设与治疗效应衰减在两期TAs与文章中均未涉及。NICE接受TTD-based效用,CDA-AMC与PBAC推荐基于进展的效用;部分文章使用TTD-based效用,部分使用基于进展的效用。RDI同样仅NICE接受,部分文章应用且该部分更多显示成本效益(详细结果见表4)。
讨论
本研究首次系统比较了早期与晚期癌症中帕博利珠单抗经济学评估的方法学差异,并分析了TAs与学术文章的异同。结果显示,早期癌症评估更常采用马尔可夫模型、更长的时间跨度、细分复发与转移的健康状态、治愈假设及RDI,且成本效益结论更积极,这与早期癌症可能通过手术等根治手段实现长期生存甚至治愈的临床特征相符——更长的时间跨度能捕捉远期获益,治愈假设则反映了部分患者治疗后不再复发的可能性,而RDI的应用更准确反映了辅助治疗中剂量调整对成本的影响。
TAs与学术文章的差异主要体现在时间跨度与治疗效应衰减的建议上:NICE倾向于更长的时间跨度(如黑色素瘤早期的46年、晚期的30年),而CDA-AMC与PBAC推荐较短时限(如黑色素瘤早期5-25年/10年,晚期5-10年);部分TA机构(如CDA-AMC、PBAC)建议治疗效应衰减,但学术文章极少应用。这种差异可能源于TAs需平衡短期预算影响与长期健康获益,而学术研究更侧重模型的理论完整性。此外,效用方法的选择(TTD-based vs 基于进展)也影响了成本效益结论,这与不同方法对生存质量随时间变化的捕捉能力有关。
本研究也存在局限性:仅纳入三种癌症类型,且帕博利珠单抗的结果可能无法完全推广至其他ICIs;部分TAs与文章未详细报告方法学参数,可能影响比较的准确性。未来需开展更多分期特异性经济学评估,并推动HTA机构与学术界在模型假设(如治愈时间点、治疗效应持续时间)上的共识,以提升评估结果的可靠性与政策参考价值。
结论
早期与晚期癌症的帕博利珠单抗经济学评估在模型结构、时间跨度、健康状态划分及关键假设(如治愈假设、RDI)上存在显著差异,且TAs与学术文章在这些方面也存在分歧。本研究强调了建立分期特异性建模指南及提升方法学透明度的必要性,以支持早期与晚期癌症中ICIs稳健的经济学评估,为卫生决策提供更可靠的依据。