《Molecular Biomedicine》:Noninvasive detection and prognostic stratification of biliary tract cancer using cell-free DNA fragmentomics: a model development and validation study
编辑推荐:
胆道癌(Biliary Tract Cancer, BTC)因缺乏有效筛查工具,多在晚期确诊,导致治疗选择有限、生存结局差。因此,亟需可实现早期检测与风险分层的非侵入性策略。细胞游离DNA(cell-free DNA, cfDNA)的片段组学分析可捕获反映肿瘤
胆道癌(Biliary Tract Cancer, BTC)因缺乏有效筛查工具,多在晚期确诊,导致治疗选择有限、生存结局差。因此,亟需可实现早期检测与风险分层的非侵入性策略。细胞游离DNA(cell-free DNA, cfDNA)的片段组学分析可捕获反映肿瘤相关染色质结构与基因组不稳定性的全基因组片段化模式,为非侵入性癌症检测提供了新途径。本研究开发了一种基于低深度全基因组测序(low-pass whole-genome sequencing, WGS)的BTC检测与术后风险评估框架。研究人员分析了血浆样本,提取了拷贝数变异(copy number variation, CNV)、片段大小分布(fragment size distribution, FSD)和启动子片段熵(promoter fragmentation entropy, PFE)三类片段组学特征,并将其整合至采用五折交叉验证训练的机器学习模型中。该模型在独立验证队列中表现出稳健性能,优于单一片段组学特征与传统血清生物标志物,并可准确区分BTC与良性胆道疾病。纵向分析显示,cfDNA片段组学风险评分可动态追踪肿瘤负荷与治疗反应。重要的是,术后风险评分与无病生存期独立相关,凸显了其预后价值。综上,这些发现确立了一种基于低深度WGS数据的、可扩展且经济高效的cfDNA BTC检测与监测框架,该方法在针对高危人群的靶向筛查以及指导BTC患者个性化术后监测与临床管理方面展现出巨大潜力。
研究背景
胆道癌(Biliary Tract Cancer, BTC)是一组起源于胆道上皮的异质性侵袭性恶性肿瘤,包含胆囊癌(Gallbladder Carcinoma, GBC)和胆管癌(Cholangiocarcinoma, CCA)。其中CCA进一步细分为肝内(intrahepatic, iCCA)、肝门周围(perihilar, pCCA)和远端(distal, dCCA)亚型。尽管BTC相对罕见,但其全球疾病负担因人口增长与老龄化显著上升,且多数患者确诊时已处于晚期,失去根治性手术机会,预后极差。当前临床诊断依赖影像学、内镜操作及糖类抗原19-9(carbohydrate antigen 19-9, CA19-9)和癌胚抗原(carcinoembryonic antigen, CEA)等血清标志物,但这些手段存在明显局限:影像学难以检出早期微小病灶并鉴别良恶性狭窄;内镜细胞学检查灵敏度低;血清标志物在早期诊断中准确性不足且易受良性胆道炎症干扰。因此,开发具有高灵敏度与特异度的非侵入性生物标志物至关重要。细胞游离DNA(cell-free DNA, cfDNA)片段组学通过分析由染色质结构和肿瘤相关基因组不稳定性塑造的全基因组片段化模式,已成为极具前景的非侵入性癌症检测手段。然而,单个片段组学标志物在BTC中的综合价值尚未得到全面评估。为此,研究人员开展了DECIPHER-CHOL研究,旨在开发和验证基于cfDNA片段组学的BTC检测与术后风险分层方法。
主要关键技术方法
本研究为多中心诊断研究。研究人员共纳入535名参与者,包括267名BTC患者与268名非肿瘤个体,构建了训练队列和两个独立的内部、外部验证队列。样本采集自复旦大学附属中山医院与中山大学附属第三医院的患者,包含BTC患者及健康对照与良性胆道疾病患者。研究人员从外周血血浆中提取cfDNA,进行低深度全基因组测序(low-pass WGS),平均测序深度为5×。基于测序数据,研究人员计算了拷贝数变异(CNV)、片段大小分布(FSD)和启动子片段熵(PFE)三类特征。随后,利用H2O AutoML框架整合五种机器学习算法(广义线性模型、梯度提升机、随机森林、深度学习、XGBoost)构建集成模型,并在训练队列中使用五折交叉验证进行优化,最终在独立验证队列中进行盲法评估。
研究结果
参与者特征
研究最终纳入196名训练队列参与者(97例BTC,99例非癌)、132名内部验证队列参与者(66例BTC,66例非癌)及167名外部验证队列参与者(82例BTC,85例非癌)。训练队列中81.4%的BTC患者为I/II期。外部验证队列包含更高比例的iCCA和分化差的肿瘤,且良性胆道疾病患者比例显著高于训练队列,增强了模型的泛化性测试。
cfDNA片段组学特征谱
全基因组CNV分析显示BTC患者存在显著的染色体改变,如1q、5p和6q的扩增以及4p、6p和8p的缺失,且晚期患者中更为明显。片段大小分布分析表明,BTC患者短cfDNA片段(100-150 bp)的归一化覆盖度显著高于非癌对照,且该富集程度随临床分期进展单调增加。启动子片段熵(PFE)评分在BTC患者中显著升高,且在训练与内部验证队列中表现一致。深度稳定性分析证实,即使在5×测序深度下,PFE特征仍保持高度稳定。富集分析提示PFE相关基因参与蛋白质代谢及小分子RNA加工等生物学过程。
模型性能评估
集成模型在训练集、内部验证集和外部验证集中的曲线下面积(Area Under the Curve, AUC)分别达到0.982、0.958和0.938。相比单一特征模型,集成模型在训练集中显著优于CNV(DeLong检验q=0.003),在验证集中也持续优于FSD和PFE。以训练集中95%灵敏度对应的阈值(0.427)计算,模型在各队列中均保持了高特异性(训练集0.889,内部验证集0.909,外部验证集0.906)。模型预测概率与观测结果总体一致。传统血清标志物CA19-9和CEA的AUC仅为0.613-0.668,显著低于集成模型,且联合使用血清标志物未能进一步提升模型性能。
各亚组性能评估
模型在区分BTC与健康对照及良性胆道疾病时均表现出色(AUC分别为0.944-0.963和0.927-0.957)。即使是诊断最具挑战性的I期BTC,模型在内部和外部验证集中的AUC仍分别达到0.919和0.800。风险评分在BTC患者中普遍高于非癌对照,且在外验证集中与临床分期呈正相关。不同解剖亚型间的评分差异主要受分期分布影响,未观察到稳定的生物学差异。
基于BTC风险评分的风险分层与疾病监测
术后cfDNA风险评分是BTC患者无病生存期(Disease-Free Survival, DFS)的独立预后因素(风险比Hazard Ratio, HR 4.09, 95% CI 1.69-9.90; P=0.002)。术前高风险评分患者的DFS和总生存期(Overall Survival, OS)显著短于低风险患者,而术后评分的预后关联更强。动态监测显示,术后风险评分持续处于高水平的患者预后最差,其生存率显著低于术后评分由高转低的患者,提示该评分可反映术后微小残留病(Minimal Residual Disease, MRD)负荷。
讨论与结论
本研究证实,整合多种cfDNA片段组学特征可通过微创液体活检实现BTC的稳健检测,尤其适用于高危人群的分流。与缺乏标准化筛查体系的现状相比,该模型填补了BTC早期筛查的空白。其核心优势在于不仅能区分肿瘤与健康人,还能有效鉴别BTC与常引发诊断困境的良性胆道疾病,且在I期患者中仍具高判别力。此外,cfDNA片段组学评分超越了诊断价值,术前评分反映肿瘤负荷,术后评分则作为MRD的分子指标,与复发风险和生存结局独立相关,为个体化术后监测提供了可能。尽管研究在多中心队列中进行了验证,但仍存在样本量有限、健康对照比例偏高及测序流程未跨实验室验证等局限。未来需开展更大规模的前瞻性研究,并结合多组学特征进一步提升效能。总之,该研究建立的基于低深度WGS的cfDNA片段组学框架,为BTC的早期检测、预后分层及术后管理提供了一种经济高效且可转化的非侵入性解决方案。