《Communications Biology》:A practical guide to targeted single-cell RNA sequencing technologies
编辑推荐:
这篇综述系统剖析了传统3′/5′端单细胞RNA测序(scRNA-seq)在检测目标转录本(TOI)和序列区域(ROI)时存在的各类偏倚,并全面介绍了靶向测序解决方案(包含捕获、引物设计、扩增、双重PCR、探针杂交五大类)来克服这些局限。文章为研究人员提供了实用的决策树,助其根据实验需求(如检测单核苷酸变异、剪接点、融合断点)选择最适合的靶向方法。
单细胞RNA测序(scRNA-seq)已成为解析组织中单个细胞基因表达的强大工具。然而,当前主流的高通量3′/5′端scRNA-seq方法仅能检测细胞中10–40%的转录本,且获取的信息通常局限于转录本末端的非翻译区(UTR),导致对转录本内部重要区域(如编码区、突变位点)信息的丢失。这些局限性严重阻碍了研究者对特定目标转录本(Transcripts of Interest, TOIs)和序列区域(Regions of Interest, ROIs)的检测。为此,一系列靶向scRNA-seq方法应运而生,旨在特异性富集TOIs或ROIs,以弥补标准方法的不足。
scRNA-seq中影响TOI和ROI检测的偏倚
标准的3′/5′端scRNA-seq实验流程会引入多种偏倚,影响TOI和ROI的检测。这些偏倚贯穿于整个工作流程,主要可归纳为三类:scRNA-seq协议固有的偏倚、转录本序列特征相关的偏倚以及实验设计选择引入的偏倚。
- •
单细胞制备:组织解离、细胞分离等步骤可能损伤RNA,导致碎片化或线粒体RNA比例升高,影响TOI检测。
- •
dT捕获/引物设计与内部捕获:大多数方法通过oligo(dT)捕获带poly(A)尾的mRNA,这排除了非poly(A)化的RNA(如调控RNA)。此外,分子拥挤和空间位阻会阻碍结合,而内部多聚腺苷酸化序列导致的“内部捕获”会产生截短的cDNA,消耗珠子上有限的寡核苷酸,并导致转录本5′端信息丢失。
- •
逆转录:逆转录效率受转录本二级结构、高GC含量等因素影响,可能导致cDNA合成不完全或引入序列错误。
- •
模板转换:包括“链入侵”(可能导致嵌合cDNA)和“scRNA-seq模板转换”(依赖逆转录酶末端转移酶活性添加非模板C,然后由模板转换寡核苷酸TSO介导第二链合成)。后者效率不高,导致许多cDNA分子无法完成全长转换。
- •
较短cDNA的生成:为适配短读长测序,需通过转座酶片段化(Tagmentation)或随机引物法将cDNA缩短至200-600 bp。转座酶插入有序列偏好性,随机引物则可能导致错配延伸。关键在于,cDNA必须在其末端包含细胞条形码和唯一分子标识符(UMI),因此可读取的序列信息通常局限在捕获位点(polyA尾)约600 bp范围内,这使得获取编码序列(CDS)内部信息变得困难。
- •
PCR偏倚:PCR扩增偏好短且GC含量均衡的cDNA,可能导致低丰度TOIs被高丰度cDNA掩盖。聚合酶的保真度也影响ROI序列的准确性。
- •
高通量测序:测序深度直接影响低表达TOI的检出概率。读长决定了能否覆盖到远离捕获位点的ROI。不同测序平台(如Illumina, PacBio, ONT)具有不同的错误谱。
基于短读长测序的靶向scRNA-seq策略
为克服上述偏倚,靶向方法在scRNA-seq流程的不同阶段进行干预。根据其富集策略,可分为五大类:
- •
类别1:靶向捕获:通过在条形码珠上修饰与TOI内部区域互补的寡核苷酸(捕获序列),在逆转录前直接从RNA池中物理捕获目标转录本。代表性方法如DART-seq、RoCKseq和direct capture Perturb-seq。其优势在于从源头富集目标,可绕过不利于逆转录的区域,并能靶向非poly(A)化转录本。局限性包括潜在的脱靶捕获和因RNA二级结构导致的杂交效率低下。
- •
类别2:靶向引物设计:使用能与转录本或cDNA特定区域结合的引物,来富集ROI或TOI信息。根据引物加入的步骤不同,可作用于第一链cDNA(如RoCK and ROI、Constellation-Seq)、逆转录步骤(如GoT、tss2)或扩增后的cDNA(如Constellation-Seq应用于10× Chromium文库)。这类方法通过定义cDNA的5′端,将信息“移位”到TOI内部,有效缓解了3′/5′端偏倚,并降低了对读长的要求。其局限性在于引物设计的特异性、潜在的非特异性结合以及RNA二级结构对引物结合的影响。
- •
类别3:靶向扩增:在文库制备后期(通常在cDNA扩增后),使用针对特定ROI或TOI的引物进行额外的PCR,以富集这些区域。代表性方法包括BD Rhapsody平台的靶向扩增模块、TARGET-seq、BART-Seq以及GoT-Splice和scG2P方法的一部分。这类方法操作相对简单,可灵活设计大量引物。但主要挑战在于需与大量背景cDNA竞争,可能导致低丰度靶点富集效率不高,且无法缓解早期步骤(如捕获、逆转录)引入的偏倚。
- •
类别4:双重靶向PCR:在同一反应体系中,使用两套不同的靶向引物分别扩增基因的不同区域(通常是5′UTR和3′UTR),以获得全长或近全长的转录本信息。代表性方法如GoT和GoT-Splice,特别适用于将体细胞突变(位于ROI)与细胞类型(由TOI表达谱定义)进行关联。其主要优势是能够获得跨越多个外显子的信息,有利于检测可变剪接和突变。局限性在于需要为每个靶基因设计两对引物,多重化程度受限,且扩增效率受两对引物性能共同影响。
- •
类别5:探针杂交:使用荧光标记的DNA探针与细胞内的RNA靶点原位杂交,然后通过显微成像或测序进行检测。代表性方法如HyPR-seq(基于成像)和HybriSeq(基于测序)。其最大优势是可在完全保留空间位置信息的情况下,对少量预先定义的靶点进行高灵敏度、高多重性的检测,无需逆转录或扩增,避免了相关偏倚。局限性在于通量有限(通常靶点数在百个级别),且无法获得非靶向转录本的全基因组表达谱。
靶向方法在长读长测序和空间转录组学中的应用
靶向策略也被整合到长读长测序(如PacBio, Oxford Nanopore)和空间转录组学技术中,以提升其性能。
- •
长读长测序:长读长技术能直接测序全长cDNA,但通量较低。通过结合靶向策略(如探针杂交富集scTaILoR-seq,或通过靶向引物进行特异性扩增如HIT-scISOseq),可以富集包含特定条形码或来自目标基因的cDNA,从而提高目标序列的覆盖深度和检测效率。
- •
空间转录组学:许多空间转录组学方法本质上是靶向的,例如基于探针杂交的(如10x Genomics Visium, 其后续的靶向panel如10x Flex)或基于捕获的(如Slide-seq)方法。这些方法通过在空间位置上捕获特定mRNA,将基因表达信息与组织形态学背景相关联。
选择指南与未来展望
为帮助研究者选择合适的靶向方法,文章提供了一个实用的决策树。决策的关键因素包括:主要目标是增强TOI检测还是ROI检测?需要多高的细胞通量?是否需要保留标准转录组信息?ROI是位于转录本内部还是末端?预算是多少?以及实验室具备哪些技术平台。
未来,靶向scRNA-seq领域的发展方向可能包括:开发能够同时靶向数千个ROI的高多重性方法;创建更灵活、可定制的“按需”靶向panel;将靶向测序与蛋白质组学、表观基因组学等多组学技术更紧密地整合;以及利用人工智能辅助设计最优的靶向策略和数据分析流程。
总之,靶向scRNA-seq方法为克服传统技术的偏倚提供了强大的工具箱。通过明智地选择和运用这些方法,研究者能够以前所未有的精度和深度,探索单细胞中特定的转录本和遗传变异,从而推动基础生物学发现和临床医学研究。