《Annals of Hematology》:Assessment of long-read strategies for the enrichment of clinically relevant breakpoints in lymphomas: towards a diagnostic implementation
编辑推荐:
本研究针对淋巴瘤染色体易位断点检测的技术挑战,系统评估了基于CRISPR/Cas9的靶向富集与自适应采样(Adaptive Sampling)两种长读长测序策略。研究人员通过设计覆盖IGH、MYC、BCL2、BCL6、CCND1等关键基因的探针面板,在多种淋巴瘤细胞系中验证发现:Cas9切除法对已知易位检测灵敏度高、覆盖深度佳,适用于临床诊断;自适应采样则灵活性更强、通量更高,更适用于探索性研究。该研究为长读长测序技术融入淋巴瘤分子诊断路径提供了关键实验依据和决策算法。
染色体易位是血液系统恶性肿瘤的典型特征,准确检测其断点位置对淋巴瘤的诊断分型、治疗策略制定和疾病监测至关重要。然而,传统荧光原位杂交(FISH)技术分辨率有限,短读长测序(NGS)难以跨越重复区域,而免疫组化仅能间接反映基因过表达——这些方法在检测复杂结构变异或未知伴侣基因时存在明显局限。尤其值得注意的是,在滤泡性淋巴瘤和弥漫大B细胞淋巴瘤中,免疫球蛋白重链(IGH)基因的断点可能分布在相隔数百kb的Sμ或Sγ恒定区转换区域内,这进一步增加了检测难度。
为解决这一难题,研究团队将目光投向了牛津纳米孔技术(Oxford Nanopore Technologies)的长读长测序。该技术能够生成跨越数十kb的读长,轻松穿透重复序列区域,为精准定位断点提供了新可能。但全基因组测序成本高昂,在临床诊断中并不经济。因此,如何高效富集目标区域成为关键。本研究聚焦于评估两种主流富集策略:CRISPR/Cas9介导的靶向富集与纳米孔平台特有的自适应采样(Adaptive Sampling)技术。
研究人员设计了一套精心优化的实验方案:他们选取了9种涵盖不同淋巴瘤亚型的细胞系(包括DOHH-2、Maver-1、Ramos等),这些细胞系携带IGH::BCL2、IGH::MYC、IGH::CCND1等典型易位。通过设计特异性引导RNA探针,团队构建了一个覆盖淋巴恶性肿瘤常见易位热点区域的Cas9富集面板。实验设置了三种富集方案进行比较:单边Cas9读取、双边Cas9切除并支持多重测序、以及基于软件实时筛选的自适应采样。所有测序数据通过Dorado碱基识别和minimap2比对流程处理,并使用Sniffles2、NanoSV等工具进行结构变异检测。
主要技术方法概述
研究使用9株淋巴瘤细胞系和5例临床淋巴瘤样本,通过CRISPR/Cas9富集面板(覆盖IGH、BCL2、MYC、CCND1等基因)和自适应采样(靶向1320个癌症相关基因)两种策略进行纳米孔长读长测序。采用MinION R9.4.1和PromethION R10.4.1流动槽,通过Cas9切除法和自适应采样策略对比检测已知易位,并通过生物信息学工具验证断点检测效率。
Cas9富集在目标区域展现卓越覆盖深度
研究人员发现,Cas9富集策略在目标区域覆盖度方面表现突出。在测序运行#2中,目标区域平均覆盖深度达到231倍,显著高于其他方法。这种策略通过设计在预期易位两侧的引导RNA探针,能够实现双向断点捕获(对已知伴侣)或单向测序(对未知伴侣)。如图1A所示,该策略利用Cas9酶在引导RNA指定位置选择性切割DNA的特性,有效富集目标片段。值得注意的是,在运行#8中,团队成功检测到Ramos细胞系的IGH::MYC易位断点,验证了该策略对经典易位的检测可靠性。
优化的Cas9多重测序提升效率不牺牲灵敏度
为提升临床应用可行性,研究团队将Cas9富集方案与纳米孔最新测序化学方法(NBD-114条形码试剂盒)相结合,实现了样本多重测序。这种改进使得三个不同样本能够在单次测序运行中同时处理,不仅将流动槽使用率提升至55%,还保持了37.6倍的平均覆盖深度。如图1B所示,双边切除策略通过从两侧切割目标区域,再经核酸外切酶消化背景DNA,显著提高了常见易位的靶向精度。然而,该方法对非经典伴侣(如Maver-1细胞的IGL::MYC易位)的检测能力有限,这主要是由于探针设计仅针对MYC而非IGL伴侣。
自适应采样提供快速灵活方案但灵敏度受限
与Cas9富集相比,自适应采样展现出独特的优势:无需预先设计探针,可根据需要动态调整靶向区域,且完全支持样本多重测序。如图1C所示,该技术利用纳米孔平台的实时碱基识别特性,在读取约400个碱基后暂停测序,通过与参考基因组比对决定是否继续测序整个片段。然而,这种策略的劣势同样明显:四个测序运行的平均覆盖深度仅为12.4倍,导致多个预期易位未被检出。例如在运行#6中,仅检测到5个主要重排之一的IGH::MYC易位。研究人员认为,这种较低的检测率与自适应采样固有的较高脱靶率有关。
面向临床应用的决策模型
基于上述发现,研究团队提出了一套实用决策算法(图4),帮助实验室根据具体需求选择最优富集策略。关键考量因素包括:目标区域大小与复杂性、预期易位伴侣(已知或未知)、设计灵活性、样本多重测序需求以及周转时间。从经济学角度,还需权衡测序的主要目的(探索性研究还是确诊性检测)与成本效益。Cas9介导的富集适合聚焦的诊断意图,而自适应采样更适用于广泛的科研用途。
研究结论与讨论
本研究系统评估了长读长测序富集策略在淋巴瘤相关易位检测中的性能。结果表明,CRISPR/Cas9富集策略(特别是双边切除法)在检测已知易位方面具有高灵敏度和覆盖深度,适合临床诊断场景。而自适应采样则以其灵活性和高通量特性,更适用于探索性研究或需要检测大量样本的项目。研究人员在5例临床淋巴瘤样本中成功验证了Cas9切除法的可靠性,所有通过短读长测序和光学基因组图谱确定的易位均被准确检出。
然而,该研究也存在一定局限:自适应采样运行的覆盖深度相对较低,影响了部分断点的检测能力;实验主要使用细胞系,可能无法完全反映临床样本的肿瘤异质性和亚克隆事件。此外,对高质量高分子量DNA的依赖也限制了在常规福尔马林固定石蜡包埋(FFPE)样本中的应用。
总体而言,长读长测序技术凭借其长读长优势,能够跨越大型基因组重排区域,为血液肿瘤中结构变异的检测提供了独特价值。随着技术不断优化和临床验证的深入,长读长靶向测序有望整合入常规诊断流程,特别适用于常规细胞遗传学技术结果不明确或复杂的病例。本研究为此转化过程提供了重要的方法学依据和实用决策框架。