编辑推荐:
本研究针对晚期胰腺癌液体全面基因组测序(CGP)中循环肿瘤DNA(ctDNA)存在假阴性风险的问题,开发了一个基于常规临床变量的预测模型。该模型在独立测试队列中表现稳健,能够准确预估ctDNA可检测性,有助于优化液体CGP的检测选择和时机,提升其临床应用价值。
在精准肿瘤学时代,全面基因组测序(Comprehensive Genomic Profiling, CGP)已成为指导癌症治疗决策的关键工具,它能帮助识别出可以采取针对性治疗措施的基因突变。传统的CGP依赖于通过活检或手术获得的肿瘤组织,然而,对于无法获取足够组织样本的患者,利用血液中循环肿瘤DNA(circulating tumor DNA, ctDNA)进行液体活检的CGP技术,为他们打开了基因检测的大门。这种液体CGP技术具有微创的明显优势,但其诊断准确性受到ctDNA释放入血液量的限制。当ctDNA不足时,具有临床意义的基因组改变可能无法被检测到,从而导致假阴性结果。这种情况可能引发不恰当的临床决策、错失治疗机会,并造成医疗资源的无谓消耗。在诸多癌种中,胰腺癌以其进展迅速、预后极差而闻名,是侵袭性最强的恶性肿瘤之一。近年来,针对BRCA1/2突变、NTRK融合和微卫星不稳定性高(microsatellite instability-high, MSI-high)状态的分子靶向治疗,开始为一部分胰腺癌患者提供了新的治疗选择,这进一步凸显了CGP在该疾病中的重要性。然而,通过有创的肿瘤活检获取足够用于CGP的组织,在胰腺癌中仍然充满挑战。在此背景下,液体CGP提供了一个有前景的非侵入性替代方案。但由于ctDNA产量低、假阴性等已知局限性,需要审慎评估哪些患者是合适的候选者。因此,一种能够在CGP前可靠预测ctDNA可检测性的方法,将有助于指导最佳的检测策略,并提升液体CGP的临床价值。
为了应对这一临床挑战,一项基于日本真实世界数据的研究应运而生。研究团队旨在开发一种预测算法,利用采血前可获取的临床参数,来预估液体CGP成功检测到ctDNA的概率。这项研究成果最终发表在《ESMO Open》期刊上。
研究方法的关键技术路径
研究团队利用了覆盖日本99.6% CGP检测的全国性真实世界临床基因组数据库——癌症基因组学和先进疗法中心(Center for Cancer Genomics and Advanced Therapeutics, C-CAT)的数据,该数据库整合了CGP结果与临床信息。研究共纳入四个独立的晚期胰腺腺癌患者队列。为了建立预测模型,研究人员采用了逻辑回归(Logistic Regression)方法,并结合五折交叉验证(five-fold cross-validation)进行训练与验证。模型输入的特征包括采血前常规可用的临床参数,如年龄、性别、美国东部肿瘤协作组(Eastern Cooperative Oncology Group, ECOG)体力状态评分、转移部位、转移器官数量、当前治疗线数、对最近一次治疗的最佳总体反应以及从诊断到采血的时间间隔。模型性能使用布里尔评分(Brier score)和校准图进行评估。为了解释每个临床特征对预测结果的贡献,研究采用了SHapley可加性解释(SHapley Additive exPlanations, SHAP)方法进行特征重要性分析。
研究结果:从突变图谱到模型构建与验证
1. 胰腺腺癌的突变图谱及使用液体CGP评估ctDNA检测
研究首先利用组织CGP数据(队列1)评估了胰腺腺癌的突变图谱。在4110例病例中,98.5%的患者在KRAS、TP53、CDKN2A和SMAD4这四个关键驱动基因中至少存在一个突变,这表明这些基因的突变可作为肿瘤来源DNA的替代标记物。
随后,研究评估了液体CGP队列(队列2)中相同四个基因的突变情况。为了区分可能来自不确定潜能的克隆性造血(clonal hematopoiesis of indeterminate potential, CHIP)的TP53突变,研究者将仅检测到TP53突变的病例排除在ctDNA阳性定义之外。应用此标准,队列2中ctDNA的检出率为50.9%,显著低于组织CGP队列。此外,研究还发现,液体CGP中检测到ctDNA的患者,其从CGP时间点开始的总生存期显著短于未检测到的患者,这支持了ctDNA阳性定义的临床有效性。
2. 用于预测ctDNA可检测性的机器学习模型的开发与解释
基于队列2的数据,研究团队开发了一个机器学习模型。模型预测的ctDNA检测概率分布在ctDNA检出和未检出病例间显示出清晰分离。校准图表明预测概率与观察到的ctDNA检出率高度吻合,布里尔评分为0.210,证明了概率估计的可靠性。
SHAP分析揭示了各临床特征对预测的贡献:与转移相关的特征,如肝转移、骨转移和转移部位数量,对ctDNA检测概率有正向贡献。有趣的是,腹膜转移和肺转移则是例外,贡献为负值。ECOG体力状态评分也影响了预测:评分为0与ctDNA检测呈负相关,而评分为2则呈正相关。从诊断到采血的时间间隔较短、治疗线数较晚,均与更高的ctDNA可检测性相关。此外,对最近治疗的最佳总体反应也具有参考价值:部分缓解(partial response, PR)或疾病稳定(stable disease, SD)对ctDNA检测概率呈负贡献,而疾病进展(progressive disease, PD)则有强烈的正向影响。
3. 在独立测试队列中的性能测试及误分类病例分析
研究将模型部署为一个网络应用程序,并使用时序独立的测试队列(队列3)进行了性能测试。模型在此测试集中同样表现出良好的区分度和校准能力,布里尔评分为0.203。为了进一步评估模型的普适性,研究还使用了另一个独立队列(队列4,使用Guardant360平台进行检测)进行测试,模型取得了布里尔评分0.204,表明其在不同液体CGP平台间具有稳健的性能和良好的泛化能力。
对误分类病例的分析显示,在预测概率低(<0.25)却实际检出ctDNA的假阴性病例中,淋巴结转移的发生频率有低于真阴性病例的趋势,提示模型可能将无淋巴结受累解读为疾病负荷有限,但这些患者可能主要存在血行转移,从而促进了ctDNA的释放。
研究结论与意义
这项研究成功开发并验证了一个预测模型,能够仅凭采血前的常规临床信息,预估晚期胰腺癌患者通过液体CGP检测到ctDNA的可能性。该模型为解决液体CGP假阴性风险这一临床难题提供了实用的决策支持工具。通过识别ctDNA检测可能性低的患者,该模型可帮助临床医生判断进行液体活检的最佳时机,或考虑转而进行组织CGP,从而优化胰腺癌的基因检测策略,提高精准肿瘤学的效率。
研究的深入分析揭示了影响ctDNA可检测性的关键临床因素。肝转移、骨转移、更多转移部位、更晚的治疗线数以及疾病进展状态,都与更高的ctDNA检出概率相关,这很可能反映了更高的肿瘤负荷和疾病活动度。尤为重要的是,研究首次全面评估并比较了不同临床变量对胰腺癌ctDNA可检测性的相对贡献,其中肝转移显示出最强的正向预测作用。而腹膜或肺转移对ctDNA检测概率的负面影响,则提示不同转移部位的生物学特性和解剖微环境(如血管密度、组织间隙压力、引流模式)可能差异性地影响肿瘤DNA向体循环的释放。这些发现为理解疾病动态如何影响液体CGP的成功提供了新的见解。
尽管研究存在一些局限性,例如数据仅来源于日本患者,且由于医保政策限制无法获得匹配的组织与液体活检结果进行直接比较,但模型在独立测试队列中表现出的稳健性能,证明了基于常规临床参数预测ctDNA可检测性的可行性与潜在临床效用。该研究实现的预测工具,有助于减少不必要的检测,优化精准肿瘤学的实践路径,并最终改善胰腺癌等患者的临床照护。