《Advanced Science》:Cancer-Like Fragmentomic Characteristics of Somatic Variants in Cell-Free DNA
编辑推荐:
本综述系统阐述了循环肿瘤DNA(cfDNA)中体细胞变异的片段组学特征及其在癌症液体活检中的价值。研究发现,即便在非癌个体中,携带体细胞变异的cfDNA分子也表现出类癌特征(如片段缩短、末端基序改变等),这些特征在癌症患者中更为显著。通过人工智能整合基因组(COSMIC突变特征)、片段组学(片段大小、末端基序)和表观基因组(DNA甲基化)特征,开发的FreeSV/FreeSV+模型在泛癌队列中展现出0.81-0.99的AUC值,凸显了多组学整合在癌症早诊中的潜力。
体细胞变异在低深度cfDNA数据中的基因组与片段组学特征
研究团队首先在肝细胞癌(HCC)队列(56例患者+24例对照)中分析了低深度(3-5×)cfDNA测序数据。通过严格过滤,每个样本获得10万-15万个体细胞变异位点。主成分分析(PCA)和无监督聚类显示,HCC样本的突变谱与对照存在系统性差异(如C[C>T]G、G[C>T]G等突变类型在HCC中显著富集)。通过将突变谱与COSMC数据库(共67个特征)及对照组背景特征进行解卷积,发现HCC样本的COSMC特征贡献度显著高于对照(P= 0.0052),其总贡献度与肿瘤DNA分数呈正相关(P= 6.8×10?4),SBS1、SBS12、SBS16等HCC相关特征尤为突出。
cfDNA携带体细胞变异的片段组学特征分析
对比变异等位基因(Mut-DNA)与参考等位基因(Wt-DNA)覆盖的cfDNA片段,发现Mut-DNA普遍更短(短片段比例更高,P< 10?10),且差异在HCC患者中更显著(Diff-size指标AUC=0.68)。末端基序分析显示,Mut-DNA中5’-CCCA末端基序和CT-5’-CC断点基序的使用率均降低(HCC样本中P< 0.001)。此外,Mut-DNA的E-index值(反映片段末端分布一致性)显著低于Wt-DNA(P< 10?10),且核小体内末端比例在HCC样本中更高(Diff-nucleosome指标AUC=0.68)。这些特征在小鼠模型和非癌人群(如克隆性造血来源变异)中同样存在,证实其与肿瘤起源无关而是cfDNA生物学固有特性。
多癌种验证与EM-seq数据拓展
在Liang等(含HCC、肺癌)和Bie等(7癌种+对照)公开数据集中,Mut-DNA的类癌片段组学特征(如缩短、基序异常)在泛癌种中重现。EM-seq数据进一步揭示Mut-DNA的DNA甲基化水平显著低于Wt-DNA(P< 10?8),且启动子、基因体等区域的甲基化差异(Diff-methylation)在癌组中更明显(基因体CpG的AUC=0.62–0.72)。
AI驱动的诊断模型构建与性能
基于上述特征,研究团队开发了FreeSV(仅用体细胞变异相关特征)和FreeSV+(整合全基因组特征)模型。在Bie等数据集中,FreeSV+在测试组达到99%特异性时,灵敏度达81.3%(显著高于THEMIS模型的74.4%),对早期癌(I/II期)的检测灵敏度提升至71.6%。模型特征重要性分析显示,片段大小差异(Diff-size)、CT-5’-CC基序变化(Diff-CTCC)和基因体甲基化差异(Diff-methylation)是关键贡献因子。
结论与展望
本研究首次系统揭示了cfDNA中体细胞变异的类癌片段组学特征,证实其可作为独立于肿瘤DNA分数的诊断标志。通过多组学整合与AI建模,为低深度cfDNA数据的癌症早诊提供了新范式,尤其适用于资源有限场景。未来需在更大队列中验证其临床适用性,并探索特征与特定生物学机制(如克隆性造血驱动片段化)的关联。