《Nature Cancer》:M-PACT leverages cell-free DNA methylomes to achieve robust classification of pediatric brain tumors
编辑推荐:
本文介绍了一项名为M-PACT(基于甲基化的中枢神经系统肿瘤预测算法)的创新研究。研究人员针对儿童中枢神经系统(CNS)肿瘤脑脊液(CSF)液体活检中游离DNA(cfDNA)量少、突变负荷低、依赖基因组变异等挑战,开发了一种深度神经网络分类器。该模型利用低输入量(亚纳克级)的cfDNA甲基化组数据,不仅能对肿瘤进行高精度分类(在胚胎性CNS肿瘤队列中准确率达88%-92%),还能实现细胞组分去卷积并灵敏检测拷贝数变异(CNV)。这项研究为低输入、低肿瘤负荷样本的无创诊断和监测提供了蓝图,有望推动液体活检在神经肿瘤临床实践中的应用。
儿童脑肿瘤是儿童癌症相关死亡的主要原因,其诊断和监测一直是临床面临的重大挑战。传统的诊断方法依赖于组织活检,但许多肿瘤因其高风险位置(如脑干)而无法进行手术干预。此外,并非所有病例都能获得足够的组织样本,尤其是在转移或复发的情况下。近年来,液体活检,尤其是分析脑脊液中的循环肿瘤DNA(ctDNA),为中枢神经系统(CNS)肿瘤的无创诊断带来了希望。然而,现有技术面临多重瓶颈:脑脊液中ctDNA含量极低(常为亚纳克级)、cfDNA甲基化谱覆盖稀疏(CpG位点捕获不足)、肿瘤负荷低,并且第一代临床检测主要依赖基因组变异(如拷贝数变异或特定突变)作为生物标志物,这限制了其在肿瘤基因组平衡或缺乏已知驱动突变病例中的应用。为了突破这些限制,Smith等人开展了一项研究,旨在开发一种不依赖于特定遗传改变、能够从微量cfDNA中提取强大诊断信息的通用方法。他们的研究成果发表在《Nature Cancer》杂志上。
研究人员主要应用了以下几种关键技术方法:首先,他们优化了酶促甲基化测序(EM-seq)技术,用于从低输入的脑脊液cfDNA样本生成全基因组甲基化谱。其次,他们利用包含84种CNS肿瘤和13种非肿瘤实体的庞大DNA甲基化阵列参考队列,构建了一个基于网络回归扩散的模型,用于对测序中未捕获的甲基化值进行高精度插补。接着,他们通过模拟不同肿瘤比例和CpG稀疏度的组合,生成了大量用于训练和验证分类器的体外模拟样本。最后,他们开发并集成了名为M-PACT(methylation-based predictive algorithm for CNS tumors)的深度神经网络分类器,该分类器结合了CpG插补、肿瘤富集算法和基于甲基化的去卷积技术。研究的样本队列主要来自多个中心的儿童CNS肿瘤患者(n=156)和非恶性供体(n=58)的脑脊液cfDNA。
M-PACT:一种用于CNS肿瘤液体活检的甲基化分类器
为了应对cfDNA甲基化组中CpG稀疏度高的问题,研究团队首先创建了一个基于网络的回归扩散模型,用于插补测序未捕获的甲基化值。该插补网络在包含914个样本的中枢神经系统肿瘤DNA甲基化阵列参考队列上训练,即使仅提供10万个CpG位点的值也能实现高精度插补。研究人员通过引入不同水平的肿瘤负荷来模拟真实世界样本,生成了大量包含不同肿瘤比例和CpG稀疏度组合的体外模拟样本。三个神经网络(包括一个通用模型和两个专注于低肿瘤比例与稀疏CpG回收的模型)被集成到一个三层集合模型中,形成了M-PACT。通过β回归减去来自九种非恶性细胞类别的甲基化特征,增强了肿瘤信号和分类概率。成功进行DNA甲基化分类后,通过将甲基化谱分解为恶性和非恶性部分,估算了肿瘤负荷。
酶促甲基化测序(EM-seq)可从CSF液体活检中准确捕获全基因组CNV
研究人员将优化的EM-seq方法应用于cfDNA测序,即使cfDNA输入量极低(中位数:0.5纳克),也能捕获数百万个CpG位点。他们将EM-seq应用于268个cfDNA样本,结果表明EM-seq能够实现与低覆盖度全基因组测序(lcWGS)相当的稳健CNV检测。通过正交比较EM-seq和lcWGS数据,他们发现两种平台在全基因组CNV谱上表现出高度一致性,并且基于CNV估计的ctDNA分数在两种方法间显著相关。这些发现证明EM-seq能够实现可靠的、基于CNV的ctDNA检测。
使用cfDNA对M-PACT进行胚胎性CNS肿瘤分类的基准测试
研究团队使用ctDNA阳性的脑脊液样本对M-PACT进行基准测试。M-PACT表现出高分类准确率,73/79(92%)的cfDNA样本与患者来源的肿瘤组织甲基化阵列分类结果匹配。值得注意的是,大多数正确分类的样本cfDNA输入量都在亚纳克范围,突显了EM-seq/M-PACT工作流程的稳健性。样本错误分类主要由较低的ctDNA分数驱动。
M-PACT在儿童CNS肿瘤液体活检中的验证
研究团队随后将EM-seq/M-PACT工作流程应用于一个独立的验证队列,该队列包含来自48名胚胎性CNS肿瘤患者的58个CSF样本。M-PACT在51/58(88%)的cfDNA样本中实现了正确分类。为了将研究扩展到胚胎亚型之外,他们还在一个包含高级别胶质瘤、室管膜瘤、生殖细胞肿瘤、脉络丛肿瘤、脑膜瘤和具有BCOR改变的高级别神经上皮肿瘤的独立队列中评估了M-PACT的分类准确性。M-PACT正确分类了22/29(76%)的cfDNA甲基化组。
M-PACT在cfDNA分类中的跨平台应用
研究团队评估了M-PACT在纳米孔测序、全基因组亚硫酸氢盐测序(WGBS)和甲基化阵列分析等不同表观遗传分析平台上的兼容性。他们为基准测试队列中正确分类的21个cfDNA样本生成了样本匹配的纳米孔测序数据。CNV谱在EM-seq和纳米孔平台之间高度一致。使用M-PACT,18/21(86%)的纳米孔谱图被正确分类。当在cfDNA甲基化阵列谱图上正交比较M-PACT与金标准海德堡脑肿瘤分类器(MNP)的性能时,MNP正确分类了15/24(62.5%)的CSF样本,而M-PACT成功分类了20/24(83.3%)。
基于甲基化的二元分类增强了ctDNA检测灵敏度
尽管利用cfDNA甲基化组可以通过M-PACT进行精细的肿瘤分类,但二元结果(即肿瘤阳性与肿瘤阴性)可能提高ctDNA检测的灵敏度。为此,研究人员开发了一种算法,将CSF来源的cfDNA甲基化组与患者匹配的肿瘤组织甲基化阵列谱图、非恶性对照CSF和非恶性对照脑组织进行比较,进行加权相关分析。在所有CNV阳性的cfDNA样本中,二元分类算法在159/166(96%)的样本中检测到ctDNA,而M-PACT的检测率为146/166(88%)。
对肿瘤和非恶性cfDNA甲基化组进行去卷积分析
除了肿瘤样本,研究团队还为从58名未诊断恶性肿瘤的捐赠者(非恶性CSF)收集的CSF样本生成了EM-seq谱图。M-PACT正确地将所有剩余的40个样本分类为非恶性CSF。非恶性cfDNA甲基化组与各种参考细胞类别聚集在一起。应用细胞去卷积方法,可以估计九种非恶性参考细胞类别的相对比例。同样的去卷积方法应用于基准测试队列中正确分类的ctDNA阳性CSF样本,可以估计基于甲基化的细胞分数。
M-PACT流程在真实世界CSF液体活检中的临床效用
为了评估EM-seq/M-PACT的转化潜力,研究人员将分子cfDNA结果与儿童CNS肿瘤人群的疾病轨迹进行了整合。他们首先评估了从独立捐赠者术中收集的一系列五个CSF样本。来自CSF的全基因组CNV和M-PACT分类结果与肿瘤组织一致。这些结果表明M-PACT在诊断时间点具有实用性。在一些儿童CNS肿瘤中,基因组缺乏可辨别的CNV,这使得它们与依赖CNV的第一代液体活检检测不兼容。为了评估表观基因组基础的ctDNA检测在此类病例中的潜力,研究团队将EM-seq/M-PACT应用于一系列从肿瘤基因组平衡的参与者收集的CSF样本。值得注意的是,M-PACT准确分类了来自被诊断为MB, SHH、MB, G4和ATRT, SHH的患者的CNV阴性cfDNA谱图,且概率很高。治疗结束后,仅凭临床和影像学特征区分复发与继发性恶性肿瘤具有挑战性。为了在此背景下评估EM-seq/M-PACT,他们分析了从诊断不确定是复发还是继发性CNS肿瘤的参与者收集的CSF。EM-seq/M-PACT证实了继发性胶质母细胞瘤(GBM)的特征性遗传改变,并从术中CSF中进行了高置信度分类。在一系列纵向CSF的MB患者中,一名参与者沿着已知的MB, G3/4生物学连续体表现出亚组转换。此外,研究人员还评估了M-PACT性能和ctDNA分数在颅脑和腰椎采集的CSF之间是否存在差异。在两个解剖位置观察到了高度可比的M-PACT概率分数。
综上所述,这项研究建立了M-PACT这一高度灵敏的工作流程,克服了儿童神经肿瘤CSF液体活检中的关键挑战。该方法能准确分类多样化的CNS肿瘤实体,并具有区分原发性和继发性恶性肿瘤的附加价值。除了分类,该工作流程还支持基于甲基化的细胞去卷积和敏感的拷贝数变异检测。这为将DNA甲基化肿瘤分类从组织转化为液体活检奠定了重要基础,为未来的临床实施提供了蓝图。为了全面评估该CSF液体活检工作流程的临床效用,需要在前瞻性临床试验中进行验证。