基于片段组学的液体活检实现乳腺癌早期检测、分子分型和淋巴结状态评估

《Nature Communications》:Fragmentomic liquid biopsy enables early breast cancer detection, molecular subtyping and lymph node assessment

【字体: 时间:2026年03月07日 来源:Nature Communications 15.7

编辑推荐:

  为解决现有乳腺癌筛查手段存在可及性、敏感性不足等问题,研究人员开展了一项基于全基因组游离DNA(cfDNA)片段组学特征(包括转录因子结合、重复元件、末端基序等多模态信息)的机器学习模型TuFEst的前瞻性多中心研究。结果显示,该模型在早期癌症检测中实现了高灵敏度(95%)和高特异性(78.3%),并可同时进行非侵入性分子亚型分型(TuFEst-MS)和淋巴结转移预测(TuFEst-LN),为乳腺癌的全面管理提供了一种集成化的液体活检策略。

  
乳腺癌,一个高悬于全球女性头顶的健康阴云,其早期发现是改善预后的关键。然而,传统的影像学筛查,如钼靶和超声,在现实中遭遇了“双面夹击”:一方面,成像设备在基层医疗机构的可及性有限,导致筛查覆盖面不足;另一方面,对于亚洲女性中常见的致密性乳腺,钼靶的敏感性大打折扣,存在一定的漏诊风险。在中国,数据显示仅有约22.3%的适龄女性接受了乳腺癌筛查,而高达24.1%的患者在确诊时已处于中晚期,显著影响了治疗效果并增加了医疗负担。这些挑战凸显了对一种标准化、不依赖于操作者经验的新型筛查工具的迫切需求。
近年来,液体活检,特别是基于循环游离DNA(cfDNA)的分析,展现出巨大潜力。然而,现有的基于cfDNA突变或甲基化的检测方法在早期癌症检测中各有局限:突变分析因早期肿瘤DNA含量极低而需超高深度测序,成本高昂;甲基化检测则存在DNA损伤、灵敏度有限及计算流程复杂等问题。在此背景下,cfDNA“片段组学”应运而生,它不关注DNA序列本身,而是分析cfDNA在血液中的片段化模式,包括片段大小分布、末端基序、断裂点模式等,这些特征能反映来源细胞的染色质结构和转录活性。这项发表在《自然通讯》(Nature Communications)上的研究,正是将这一前沿理念转化为临床解决方案的一次大规模实践。
为了应对早期乳腺癌检测的挑战,并探索片段组学在分子分型和淋巴结评估中的应用潜力,研究者们开展了一项前瞻性多中心病例对照研究。他们从中国七家医疗机构连续招募了503名经病理确诊的乳腺癌患者和289名良性对照,收集其外周血样本。通过低通量全基因组测序(Low-pass Whole-genome Sequencing, LP-WGS)获取cfDNA片段组学特征,并开发了名为TuFEst(Tumor Fraction Estimator)的机器学习框架。该研究不仅评估了TuFEst区分良恶性的效能,还将其扩展用于分子亚型分类(TuFEst-MS)和淋巴结转移预测(TuFEst-LN)。此外,研究还对79例配对肿瘤组织进行了转录组测序,以解析cfDNA癌症评分背后的生物学意义。
研究涉及几个关键的技术方法:首先是多中心队列的构建与标准化样本处理,所有血样按统一标准操作程序采集、处理和运输,确保了分析前的一致性。核心是低通量(~2×覆盖度)全基因组cfDNA测序与片段组学特征提取,这包括计算全基因组范围内的片段大小分布比值(S/L ratio)、系统量化4碱基对(bp)末端基序和6 bp断裂点基序的频率,以及分析Alu、长末端重复序列(LTR)等重复元件的片段化模式。机器学习模型构建与验证是关键环节,研究者系统比较了包括广义线性模型(GLM)、支持向量机(SVM)、极限梯度提升(XGBoost)和堆叠集成模型(Stacked Ensemble Model, SEM)在内的六种算法,并通过训练集、内部验证集和外部验证集进行严格评估。最后,通过整合染色质免疫共沉淀测序(ChIP-seq)公共数据(ReMap 2020数据库)进行转录因子(Transcription Factor, TF)结合位点覆盖度分析,并利用CIBERSORT、xCell、ESTIMATE等算法对配对肿瘤RNA-seq数据进行肿瘤免疫微环境(Tumor Immune Microenvironment)反卷积分析,将cfDNA特征与肿瘤生物学联系起来。
cfDNA片段化反映早期乳腺癌中的转录因子活性
通过对全基因组cfDNA片段化模式的分析,研究者发现,与良性乳腺病变个体稳定一致的片段化图谱相比,乳腺癌患者的cfDNA片段化景观随着肿瘤分期进展而变得越来越紊乱,这种现象在I期肿瘤中即可被检测到。通过将cfDNA片段化特征与ChIP-seq数据整合分析,他们鉴定出146个差异片段化基因组区域,对应844个潜在的转录因子。经过在乳腺癌细胞系(MCF-7和MDA-MB-231)中的验证,最终锁定148个高置信度的转录因子。通路富集分析显示,这些转录因子显著富集于肿瘤发生、内分泌治疗抵抗、雌激素信号传导等关键乳腺癌相关通路。其中,上调的转录因子如FOXA1ARRELA(NF-κB亚基)等与肿瘤进展和不良预后相关,而下调的如RESTCREB1等则具有肿瘤抑制功能。这表明cfDNA片段化模式能捕捉驱动早期乳腺癌发生的转录活性程序。
用于乳腺癌检测的TuFEst模型
研究者开发了TuFEst机器学习模型,集成重复元件片段化、定量片段化指数(如N-index, E-index)以及转录因子结合位点覆盖度等多模态特征。在六种算法中,堆叠集成模型(SEM)表现最优,在训练集、内部验证集和外部验证集中均展现出高且稳定的区分性能,曲线下面积(AUC)分别达到0.942、0.937和0.968。模型在外部验证集中实现了91.9%的阳性预测值和93.0%的阴性预测值。特别值得关注的是,在26例影像学评估为可能良性(BI-RADS 3)但后续病理证实为癌的“影像学漏诊”病例中,TuFEst以96.2%的准确率识别出了其中25例早期癌症,凸显了其弥补影像学不足的潜力。
cfDNA片段组学预测乳腺癌分子亚型
乳腺癌的治疗决策高度依赖于基于激素受体和HER2状态的分子分型。为此,研究者开发了TuFEst-MS模型,用于非侵入性预测三种主要分子亚型:ER+/PR+HER2-、HER2+和三阴性乳腺癌(TNBC)。该模型在训练和验证集中对所有亚型均表现出稳健的预测性能,AUC值在0.891至0.939之间。在21例寡转移患者中,TuFEst-MS基于血液预测的亚型与转移灶活检结果的一致性达到85.7%,即使在原发灶与转移灶分子亚型不一致的病例中,也达到了87.5%的准确率,为解决转移灶活检不可及时的治疗决策难题提供了新思路。
用于淋巴结转移检测的cfDNA片段组学
准确评估腋窝淋巴结状态对治疗方案制定至关重要,但现有影像学方法准确性欠佳。研究者开发的TuFEst-LN模型在训练集和验证集中分别取得了0.900和0.874的AUC值,显示出良好的鉴别能力。尽管在主要由早期淋巴结阳性(pN1)患者构成的队列中阳性预测值(PPV)相对中等,但其阴性预测值(NPV)在验证集中高达90.3%。更重要的是,在一个独立的、影像与病理结果不符的挑战性病例集中,模型对于影像学阳性但病理阴性的患者,其排除淋巴结转移的准确率高达97.6%。这表明TuFEst-LN在准确排除淋巴结转移方面具有突出优势,有望支持对临床淋巴结阴性(cN0)患者进行手术降级(如避免前哨淋巴结活检)的决策。
TuFEst癌症评分反映乳腺癌分子亚型侵袭性
分析显示,具有更高侵袭性的HER2阳性型和TNBC亚型的患者,其TuFEst癌症评分显著高于ER+/PR+HER2-亚型患者。这验证了该模型评分与已知的肿瘤侵袭性生物学行为相一致,能够在早期检测阶段即识别出高风险分子亚型。
转录组学分析将TuFEst衍生的癌症评分与乳腺癌生物学相关联
对79例配对肿瘤样本的转录组测序分析发现,癌症评分高的肿瘤表现出更高的免疫细胞浸润水平,特别是活化的细胞毒性免疫细胞(如T细胞、NK细胞、M1型巨噬细胞)。基因集富集分析进一步揭示,高分肿瘤显著富集于上皮-间质转化(EMT)、炎症反应、TNF-α/NF-κB信号通路、E2F靶点、G2M检查点等一系列与肿瘤增殖、转移和免疫微环境重塑相关的 hallmark 通路。相反,低分肿瘤则呈现出“免疫冷”微环境的特征。这从分子层面证实,TuFEst模型捕捉到的cfDNA片段组学特征,深刻反映了肿瘤内在的侵袭性生物学本质和免疫微环境状态。
研究结论与讨论
这项多中心研究证实,基于机器学习整合多维cfDNA片段组学特征的TuFEst模型,是实现乳腺癌早期检测的一种高灵敏度、高特异性的强大工具。其创新性在于,将液体活检的应用从单纯的“有无癌症”检测,成功扩展至分子亚型分型淋巴结转移预测,实现了“一管血”回答多个关键临床问题的集成化解决方案。
研究的意义深远。首先,它为解决当前乳腺癌筛查,特别是在医疗资源不均地区所面临的挑战提供了新的路径。cfDNA检测对操作者经验依赖小,易于标准化推广,可作为现有影像学筛查的重要补充,特别是用于识别影像学不典型或漏诊的早期病例。其次,TuFEst-MS和TuFEst-LN模型展示了液体活检在乳腺癌精准管理中的巨大潜力:非侵入性分子分型有助于快速指导治疗,尤其是在转移灶活检困难时;高阴性预测值的淋巴结评估模型,则为安全地实施腋窝手术降级、避免患者不必要的创伤和并发症提供了新的决策依据。最后,转录组学关联分析表明,cfDNA片段组学特征并非简单的生物标志物,它们与肿瘤的转录活性、侵袭性生物学行为及免疫微环境密切相关,为理解癌症生物学提供了新的窗口。
当然,研究也存在局限,如导管原位癌(DCIS)样本较少、未评估与特定基因突变(如BRCA1/2)的关联、且目前主要适用于已有影像学发现病灶的人群,在无症状人群筛查中的效能有待前瞻性研究验证。尽管如此,这项工作为基于cfDNA片段组学的乳腺癌综合管理奠定了坚实的证据基础,标志着液体活检向更全面、更精准的癌症诊疗时代迈出了关键一步。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号