综述：利用高通量方法解码RNA-蛋白质相互作用

《RNA Biology》：Decoding RNA-Protein interactions using high-throughput methods

【字体：大中小】 时间：2026年01月31日 来源：RNA Biology 3.4

编辑推荐：

　　本综述系统梳理了高通量结合测定法（MPBAs）在解析RNA结合蛋白（RBP）与RNA相互作用分子机制中的应用。文章详细比较了体外（如SELEX、RNAcompete、RBNS）与体内（如酵母三杂交、RBPscan）MPBAs的技术原理、优势与局限，强调其在描绘RBP结合特异性、亲和力（KD）及动力学参数（KON/KOFF）方面的独特价值。作者指出，尽管体外方法能精确控制条件并探索庞大序列空间，但其结果需在更复杂的体内环境中验证。综述最后展望了MPBAs在揭示RBP在疾病（如癌症、神经退行性疾病）中的作用、指导RNA疗法开发以及推动预测模型构建等方面的未来方向。

RNA结合蛋白（RBP）是一类在基因表达各阶段发挥关键作用的蛋白质，许多RBP的功能失调与人类疾病密切相关。理解RNA-蛋白质相互作用的分子规律对于破译调控性RNA密码至关重要。本综述聚焦于大规模并行结合测定法（MPBAs），这类高通量技术利用大型RNA或蛋白质变体库，系统研究RNA与蛋白质间的相互作用。

ABSTRACT

RNA结合蛋白（RBP）构成了一个多样化的蛋白质类别，对基因表达过程的每个阶段都至关重要。许多RBP也与人类疾病和病理状况相关。理解RNA-蛋白质相互作用的分子规律对于破译调控性RNA密码至关重要。本综述全面概述了大规模并行结合测定法（MPBAs），这些高通量技术使用大型RNA或蛋白质变体库来系统研究RNA-蛋白质相互作用。我们描述了体外和体内方法的基本原理、应用及其优缺点。最后，我们概述了该领域的未来方向和挑战，这将有助于推动新方法的开发，以更好地理解RBP识别密码。

Introduction

一旦新生mRNA在转录过程中出现，它就会被多种RNA结合蛋白（RBP）结合，这些蛋白调控其加工、修饰、稳定性、翻译和定位。这些RBP在mRNA上协同作用，组装成动态的信使核糖核蛋白（mRNP）复合物，并在整个mRNA生命周期中不断重塑。RBP可以通过直接的蛋白质-RNA相互作用或通过小RNA介导的机制与mRNA结合。后者可以以微RNA（microRNA）为例，它们引导Argonaute蛋白与其mRNA靶标结合；以及小核RNA（snRNA），它们赋予剪接体序列特异性。小RNA引导的RNA识别相对容易理解，主要是因为RNA-RNA碱基配对的可预测性更强。相比之下，直接的蛋白质-RNA相互作用更为复杂，难以预测。RBP通过多种RNA结合域（RBD）识别其RNA靶标，例如经典的RNA识别基序（RRM）、K同源结构域（KH-domain）和冷休克结构域（CSD）。重要的是，单个RBD通常自身结合较弱，大多数RBP具有模块化结构，平均包含2-4个RBD，这些结构域共同作用提高了结合特异性和亲和力。此外，RBD通常与调节其RNA结合的辅助结构域协同作用。例如，内在无序区域（IDR）在RBP中普遍存在，现在清楚的是它们在RNA结合中起着关键作用。最后，一些传统上认为不结合RNA的代谢酶和转录因子（TF）已被证明直接结合mRNA。许多此类实验发现的RBP缺乏任何经典的RBD，这凸显了基于结构域注释的局限性，并揭示了RNA结合能力比以前认为的更广泛、功能更多样。

在破译调控mRNA稳定性、翻译效率、剪接和定位的顺式调控RNA密码方面也取得了重大进展。然而，该密码的功能性取决于反式作用因子（如RBP和小RNA）的识别。重要的是，相同的顺式元件可能根据细胞环境的不同而被不同地解读。尽管大多数RBP表现出相对较低的组织特异性，但它们的功能会因表达水平、翻译后修饰和选择性剪接的差异而显著变化。此外，RBP以组合方式调控mRNA，因此即使在具有相似RBP库的细胞中，具有不同3'UTR的mRNA也可能根据与其结合的特定RBP集合而受到不同的调控。因此，为了完全理解特定mRNA的整个5'或3'UTR对其功能的贡献，重要的是确定每个顺式元件如何被反式作用因子识别，以及它们的相互作用如何在特定的细胞环境中被调控。这些知识可以实现mRNA行为的预测建模，并指导为生物技术和RNA治疗学需求设计可编程的RNA分子。

在用于鉴定RBP的RNA结合序列的方法中，基于交联和免疫沉淀（CLIP）的方法应用最广泛。CLIP的一个主要优点是能够捕获内源性RNA-蛋白质相互作用。然而，CLIP不太适合获取精确的定量信息，如结合亲和力（K_D值），或区分稳定和瞬时的相互作用。迄今为止，只有一种基于CLIP的方法KIN-CLIP被开发出来用于分析活细胞中RNA-蛋白质相互作用的动力学。然而，它在技术上具有挑战性，并且迄今为止仅应用于一种蛋白质DAZL。此外，CLIP分析倾向于优先考虑强的高亲和力相互作用，而忽略了可能仍然具有功能相关性的低亲和力相互作用。与转录因子（TF）类似，RBP可能通过由RNA序列和结构塑造的一系列亲和力来识别其RNA靶标。正如对TF所证明的那样，低亲和力相互作用通常是进化选择的，偏离这些最优值可能导致发育缺陷。类似地，RNase P的蛋白质亚基RBP C5与其生理RNA靶标的结合亲和力落在其整体结合谱的中间，突出了它们的生物学相关性。这一观察表明，其他RBP也可能依赖广泛的结合亲和力来有效执行其功能。

本文将大规模并行结合测定法（MPBAs）定义为使用大型RNA或蛋白质序列变体库来研究RNA-蛋白质相互作用的高通量方法。虽然这些方法依赖于人工系统，不直接探测内源性RNA-蛋白质相互作用，但它们能够探索比内源性转录本可能更广泛的序列空间，后者在多样性上固有地有限。因此，全面表征RBP的特异性和结合亲和力需要使用更大、更复杂的RNA库。MPBAs不同于大规模并行报告基因测定法（MPRAs），后者主要测量顺式元件对RNA功能的影响，并不直接分析特定反式因子与RNA的关联。MPBAs中使用合成RNA也使得研究难以内源性分析的低丰度转录本成为可能。此外，由于MPBAs可以使用来自任何类别转录本的RNA序列，包括mRNA、lncRNA和其他非编码RNA，它们为量化RBP如何与不同RNA底物相互作用提供了一个通用框架。在本综述中，我们描述了使用RNA或蛋白质序列变体的合成库来表征RNA-蛋白质结合的MPBAs。我们重点介绍了探索大序列空间、高分辨率量化结合决定因素以及提供RNA-蛋白质相互作用动力学测量的方法。我们首先描述量化RBP-RNA结合相互作用并以高分辨率剖析序列结合决定因素的体外MPBAs。然后我们讨论RNA-蛋白质相互作用定量体内分析的最新进展。最后，我们强调了主要挑战，概述了该领域悬而未决的问题，并展望了解决这些问题的未来方向。我们将不讨论基于CLIP或RNA编辑的分析RBP与内源性RNA结合的方法，因为它们不提供关于RBP结合动力学的定量信息，并且先前已被广泛综述。

General Considerations about the design of MPBAs

原则上，任何RBP与RNA之间的相互作用都可以通过三个关键参数来表征：结合特异性、亲和力和相互作用动力学。为了全面描述RBP的特性，必须测量所有这些参数，最好是在它们发生的自然细胞环境中进行。虽然使用一系列专门的低通量技术可以全面表征单个RBP，但只有在DNA合成和测序技术取得进展后，高通量实现这一目标才变得可行。这些创新使得能够生成复杂的序列库并对富集的序列池进行详细分析。通常，所有用于研究RBP结合特异性的MPBA都涉及三个主要步骤：(1) 生成RNA motif库和感兴趣的RBP（或RBP库），(2) 将RNA库与RBP一起孵育，以及(3) 鉴定和分析被蛋白质结合的RNA序列。一些MPBA方法更适合探测RNA序列变异，另一些更适合探索蛋白质变体，还有一些允许同时 interrogation 两个组分。现有技术在执行这些步骤的具体策略上有所不同。

RNA库的设计是一个关键组成部分，因为它定义了可用于RBP结合的序列空间。大多数单个RBD识别相对较短的motif，通常长度为4到8个核苷酸，这使得使用完全随机化的库成为可能，该库包含该范围内的所有可能变体。然而，通常由多个结构域组成的全长RBP可以与更长的RNA序列相互作用，其中结合motif可能相邻出现，被间隔区分隔，或嵌入特定的二级结构中。使用完全随机化的40核苷酸库提出了重大挑战，因为理论序列空间极其巨大，无法在合成过程中完全代表或通过测序全面采样。因此，通常使用替代策略，例如较短的序列、部分突变的库或内源性转录本的片段，以在保持表征RBP结合偏好所需的高序列多样性的同时降低序列复杂性。由于下一代测序是MPBA中最常用的读出方式，测序深度成为一个重要的考虑因素。通常希望每个变体获得大约100-1000次读数以获得可靠的富集估计。因此，根据文库的复杂性，应调整测序深度以确保所有变体的充分和均匀代表。

孵育步骤在不同的MPBA技术中也各不相同。它可能在体外或体内进行，诸如孵育时间以及RNA和蛋白质浓度等因素引入了额外的变异层。最后，这些方法在如何富集与RBP相互作用的RNA分子与未相互作用的RNA分子方面有所不同，并且使用的读出类型也不同。读出可能包括序列富集、生存选择、报告蛋白表达或RNA编辑/修饰。我们总结了本综述讨论的所有方法的这三个主要步骤。

IN VITRO MPBAs

配体系统进化技术（SELEX）由Larry Gold和Jack Szostak的团队于1990年开发，是第一个用于鉴定T4 DNA聚合酶的RNA配体以及结合小分子的RNA适体的高通量方法。它后来被用于鉴定经典RBP的首选结合motif。SELEX过程始于合成一个多样化的DNA分子池，其中包含随机化区域，两侧是PCR扩增所需的恒定序列。该DNA池随后被体外转录成RNA，并与感兴趣的RBP一起孵育。结合蛋白质的RNA分子使用亲和层析、硝酸纤维素滤膜结合试验或顺磁珠进行分离，然后进行逆转录、PCR扩增，并转录回RNA用于下一轮筛选。通过迭代循环，库中的序列多样性逐渐减少，直到富集出一小部分与RBP结合的高亲和力RNA分子。最终的“获胜”序列使用常规测序进行分析。由于这一限制，基于SELEX的方法偏向于最高亲和力的“获胜”motif，并且不是定量的，阻碍了并行比较RBP与许多RNA序列的结合。因此，通常错过了结合亲和力较低的motif。

为了解决这一局限性，开发了SEQRS和HTR-SELEX。SEQRS和HTR-SELEX在概念上与SELEX相似，但使用NGS分析富集的序列。这些方法使用较少的选择轮次，这有助于保留更多样化的序列池，并提供有关结合偏好的更详细信息。使用随机化的20聚体序列，SEQRS已成功应用于鉴定PUF蛋白家族几个成员的结合motif。SEQRS还被用于评估两个RBP之间的协同相互作用。HTR-SELEX已应用于使用随机化的40聚体序列鉴定86种RBP的结合motif，并识别了短线性motif、结构motif和间隔motif。

总之，尽管基于SELEX的方法使用大的RNA池和序列多样性，允许无偏地选择能够采用特定构象的RNA序列，识别高亲和力RBP结合motif以及可能发现具有相似结合的替代构象，但它们也有一些局限性。具体来说，除SEQRS外，它们不提供关于次优结合序列的信息，并且都不提供RBP-RNA相互作用的动力学信息。然而，通过分析早期的选择轮次，这一局限性可能得到解决，这可能有助于识别在后期轮次中丢失的次优结合motif。

噬菌体展示是一种基于蛋白质变体与靶底物结合能力进行选择的工具。在该技术中，感兴趣的蛋白质与噬菌体外壳蛋白基因融合，使其展示在噬菌体表面。这使得能够展示大的蛋白质变体库，可以筛选它们与感兴趣靶标的结合。结合的噬菌体然后通过感染大肠杆菌进行分离和扩增，允许进行迭代的选择和富集轮次。噬菌体展示非常适合阐明RBP中负责RNA识别的单个氨基酸的贡献。噬菌体展示已被证明对于基于剪接体成分U1A的RRM结构域的大规模RBP变体库的遗传选择是有效的。此外，它已成功应用于从cDNA文库中鉴定和克隆RBP。

最近开发的方法PD-SELEX将噬菌体展示与SELEX集成，以同时筛选RBP和RNA变体。首先生成展示噬菌体的RBP变体库和含有通用序列的合成RNA。将两个库一起孵育后，通过两个连续的亲和纯化步骤进行选择：首先分离展示RBP的噬菌体，然后通过所有RNA变体中存在的通用序列捕获RNA-蛋白质复合物。富集的RNA被逆转录、PCR扩增并再次体外转录，而富集的噬菌体在下一轮选择前在大肠杆菌中扩增。PD-SELEX方法已被用于鉴定L7Ae变体与K-turn RNA motif之间的新型正交相互作用对。这表明PD-SELEX可用于发现和优化RBP-RNA对。然而，可以在噬菌体上展示的RBP变体的数量可能是一个限制因素。由于噬菌体展示中使用的文库大小受大肠杆菌转化能力的限制，已经开发了用于完全体外测试大蛋白质库的替代方法，包括核糖体展示和mRNA展示。例如，mRNA展示依赖于通过嘌呤霉素在合成蛋白与其编码mRNA之间形成共价键，已被用于鉴定结合boxB发夹的新型肽。

RNAcompete是一种高通量体外方法，用于并行研究RBP跨许多RNA序列的结合偏好。经典方案涉及生成一个非随机RNA池，由两组独立的序列组成，每组包含所有可能的9聚体序列变体，从而能够独立评估序列上下文如何影响RBP结合。使用安捷伦244K微阵列技术合成编码该RNA池的DNA寡核苷酸，随后进行体外转录。然后将RNA池与纯化的重组GST标记的感兴趣RBP一起孵育，然后通过一步法下拉RNA-蛋白质复合物。重要的是，结合是在RNA相对于蛋白质存在约75倍摩尔过量的情况下进行的，以确保多个RNA序列竞争相同的RBP。这种竞争允许RNA分子基于它们的K_OFF速率进行交换，假设在没有其他因素竞争的情况下跨序列具有统一的K_ON速率。然而，这种滴定方案并非最优于确定解离常数或准确测量RBP-RNA结合动力学。从下拉中回收的RNA用Cy5荧光标记，并与Cy3标记的输入RNA池一起杂交到与原始设计匹配的安捷伦244K微阵列上，从而能够量化下拉部分中RNA相对于输入的相对富集。输出经过Z转换以标准化探针强度，然后使用k聚体富集进行分析以识别顶部结合序列中存在的序列motif。在一项大规模研究中，RNAcompete被应用于分析来自不同物种的205种经典RBP的结合偏好。最近，它被用于研究492种缺乏经典RBD的非经典RBP的结合特性。此外，RNAcompete数据已被用于基于其RNA结合区域的同源性，为包含RRM和KH结构域的数千种不同真核生物RBP生成结合motif的综合资源。这些motif汇集在CisBP-RNA数据库中，该数据库汇编了跨真核生物的实验确定和预测的RBP结合motif。尽管RNAcompete具有诸如相对低成本和简单的实验程序等优点，但使用微阵列进行RNA合成和分析限制了可以评估的探针数量。此外，RNAcompete中使用的RNA池对二级结构的代表性有限，并且偏向于非结构化motif。这一局限性已通过开发RNAcompete-S得到克服，其中RNA池使用40聚体随机化模板合成，并使用高通量测序进行分析。RNAcompete-S的另一个优点是缺乏复杂RNA池中通常用于促进NGS文库构建的侧翼引物序列。这些序列可能影响二级结构形成或直接被RBP识别。因此，RNAcompete-S最大限度地减少了RBP结合中的这种偏差，尽管这一特性是以更繁琐的文库制备程序为代价的。

RNA Bind-n-Seq是一种用于评估RNA-蛋白质相互作用的定量生化方法，改编自最初为DNA结合蛋白开发的Bind-n-Seq技术。在典型的RBNS方案中，通过体外转录生成短合成RNA池。该池包含一个完全随机化的区域，两侧是高通量测序所需的恒定Illumina接头序列。使用完全随机化的区域能够全面评估RNA序列空间，捕获短线性motif以及在此长度RNA内可能顺式形成的潜在二级结构。尽管使用较长RNA序列有利于捕获RNA二级结构的影响，但大多数RBNS实验使用较短的序列进行，因为它们允许更有效地识别短线性结合motif。此外，还开发了RBNS的一个变体，称为天然序列RBNS，它利用来自内源性转录组的天然序列。这种方法能够分析RBP与较长RNA片段的结合，同时保持相对较低的文库复杂性，确保所有序列的完全代表。RBNS相对于其他方法的一个关键优势是使用多个RBP浓度，允许检测从低纳摩尔到高微摩尔的广泛亲和力范围内的相互作用。在较低的蛋白质浓度下，高亲和力结合位点优先结合，而较高的RBP浓度使这些位点饱和，揭示次优结合位点。将RNA池与从大肠杆菌纯化的重组RBP一起孵育，直到达到结合平衡。这种浓度依赖的结合行为使得能够估计特定序列元件的解离常数。RBP-RNA复合物可以使用诸如特异性抗体下拉、电泳迁移率变动分析或双滤膜结合试验等方法进行分离。然后纯化结合的RNA，进行测序，并与输入文库进行比较。在经典RBNS中，通过计算每个k聚体在结合部分与输入部分中的富集得分来量化结合偏好，从而产生首选结合motif的排名列表。ENCODE联盟生成的RBNS数据集可通过ENCODE数据门户公开获取。RBNS已被用于确定微RNA诱导的沉默复合物的相对解离常数，并且最近该方法已优化以获得绝对K_D值，包括Argonaute 1的结合和解离速率。最近，RBNS进一步扩展以允许使用从哺乳动物细胞免疫沉淀的RBP，从而能够分析全长蛋白质并可能考虑翻译后修饰。

高通量测序动力学是一种生化方法，用于同时测量数千种RNA序列变体的RNA-蛋白质相互作用和RNA加工的动力学。与在平衡条件下评估结合的RNAcompete或RBNS等方法不同，HiTS-Kin包含一个时间分辨组件以捕获反应动力学。HiTS-Kin的另一个关键特征是它测量RBP与随机化RNA池中所有可能序列变体的相互作用。这使得能够实验绘制完整的RBP亲和力图谱。然而，为了确保足够的覆盖范围和测序深度，随机化区域的长度通常限制在6-8个核苷酸。在这种方法中，将包含RBP结合位点内完全随机化区域的RNA池与感兴趣的RBP一起孵育，并在多个时间点收集样品。该设置类似于传统的生化测定，例如通过聚丙烯酰胺凝胶电泳可视化反应产物的EMSA或切割测定，但针对特定RNA的数千种序列变体同时进行。通过测量随时间推移未结合或未处理部分中每种变体的丰度，该方法捕获了每种序列的相对反应速率。HiTS-Kin最初应用于C5，以测量其与结合位点上所有可能序列变体结合的动力学。这项研究揭示，C5的生理靶标并不对应于其最高亲和力结合motif，而是落在整体亲和力分布的中值附近。后来开发了HiTS-Kin的一个变体，称为HiTS-Eq，用于测量平衡条件下的动力学。与RBNS类似，它使用不同的RBP浓度来评估不同亲和力范围内的结合偏好。最近，HiTS-Eq被用于证明Rbfox2与不同RNA底物的双峰结合行为，揭示了两种不同的蛋白质构象，并有助于解释Rbfox2的非凡特异性。由于HiTS-Kin和HiTS-Eq中的序列空间仅限于8聚体并且需要侧翼恒定序列，这些技术最适合全面表征特定RNA中已知的结合或切割位点，而不是用于发现先前未表征的结合特异性。

定量大规模并行阵列上的RNA分析和高通量测序与RNA亲和力探测是两种类似的方法，开发用于在体外精确量化RNA-蛋白质结合动力学。在这些方法中，使用荧光读数检测溶液中RBP与固定在NGS流动池表面上的RNA之间的相互作用。首先，将编码可变RNA区域以及T7启动子序列的DNA文库附着在流动池表面，然后进行扩增，生成独特序列的簇，通过测序进行识别。然后该DNA文库用于在芯片上直接进行体外转录以产生相应的RNA池。重要的是，在每个DNA模板的末端加入一个转录路障，以停滞RNA聚合酶，将新合成的RNA拴在其DNA模板上，防止解离。在HiTS-RAP中，使用复制终止子蛋白Tus作为转录路障，而RNA-MaP使用生物素-链霉亲和素复合物实现相同目的。将荧光标记的感兴趣RBP注入流动池。达到平衡后，测量流动池上每个位置的荧光，其中信号增加表明结合更强。使用RNA-MaP方法，已测量了MS2结合蛋白与超过10^7种MS2发夹变体的结合常数和解离动力学。在HiTS-RAP中，已测量了数千种RNA适体与绿色荧光蛋白和负延伸因子E的结合解离常数。RNA-MaP方法还被用于测量Pumilio同源结构域与其RNA结合motif综合库的结合动力学，从而能够开发描述Pumilio-RNA相互作用的准确热力学模型。此外，RNA-MaP被用于确定微RNA-靶标相互作用的热力学特异性。为了考虑被测RNA序列的自然上下文，RNA-MaP还被用于检查Smaug蛋白家族成员Vts1的结合偏好，使用固定在流动池上的覆盖整个酿酒酵母基因组的100聚体片段组成的转录基因组阵列。正如上述例子所强调的，芯片上RNA测定是强大的工具，能够在RNA序列空间上进行精确的生化测量。然而，它们需要大多数实验室无法获得的复杂设备。为了克服这一障碍，最近开发了一种类似的方法RNA-CHAMP，它与Illumina流动池和常规显微镜兼容，并已成功用于确定RNA引导的RNA内切酶Cas13d的结合特性。最后，还应考虑到许多蛋白质具有双重RNA和DNA结合特性。因此，DNA作为模板和桥梁将RNA拴在芯片上的存在可能影响结合常数的确定。这可以通过使用专门的微流体设备来克服，例如RNA-MITOMI，其中体外转录和结合测定在两个独立的腔室中进行，正如对组蛋白茎环结合蛋白所证明的那样。尽管有其优点，但这种方法的使用受到高成本和需要定制MITOMI设备的限制。

IN VIVO MPBAs

最早开发的在体内分析RNA-蛋白质相互作用的方法之一是在细菌中实现的。这些系统依赖于抑制或激活可量化报告蛋白的合成来测量RNA-蛋白质结合。第一种方法，翻译起始阻断，利用了核糖体有效翻译需要Shine-Dalgarno序列之间碱基配对的要求。将感兴趣的RNA序列插入SD位点上游允许结合的蛋白质空间阻碍核糖体 access，减少β-半乳糖苷酶的表达。最初，这种方法被用于鉴定影响HIV-1 Rev蛋白与Rev反应元件茎环结合的突变，以及研究涉及剪接体蛋白U1A的相互作用，后来优化为包含荧光读数。另一类方法依赖于RNA-蛋白质依赖的转录抗终止，也被用于分离特异性结合HIV Rev反应元件的肽。尽管其原始设计和实用性，这些方法由于原核生物和真核生物之间基因表达控制的根本差异而仅限于细菌。在哺乳动物细胞中使用的首批体内方法之一是Tat-杂交测定，它基于HIV Tat-TAR系统。在该方法中，表达与Tat蛋白融合的RBP库，并且TAR被感兴趣的RNA序列取代。如果测试的RBP-Tat融合体结合到测试的RNA，它会招募转录 machinery 并激活报告基因的表达。这种方法已应用于研究几种RNA-蛋白质相互作用。

酵母三杂交系统是一种遗传工具，源自酵母双杂交测定，适用于在体内检测RNA-蛋白质相互作用。它依赖于特定RBP-RNA相互作用的形成来触发报告基因的转录激活，从而能够快速表型读出测试的分子相互作用。该系统涉及三个组分的表达：一个由DNA结合域与MS2外壳蛋白融合组成的杂交蛋白，它定位到报告基因的启动子区域；一个感兴趣的RBP与转录激活域融合；以及一个包含保守MS2发夹和感兴趣的可变RNA序列的RNA诱饵分子。当所有组分在酵母中表达时，MS2外壳蛋白与杂交RNA的MS2发夹区域结合，从而将RNA定位到启动子区域。如果感兴趣的RBP特异性识别测试的RNA序列，它将转录激活域带到启动子，启动报告基因的转录。除了验证已知的RNA-蛋白质相互作用外，Y3H系统还被用于通过筛选蛋白质或RNA库来发现新的RNA-蛋白质相互作用。例如，Y3H已被用于鉴定Snp1、SLBP、FBF、Mpt5p的结合序列。此外，它被应用于工程化具有新结合特异性的Pumilio蛋白，并检测长链非编码RNA与调节植物干旱反应的转录因子ERF84之间的相互作用。Y3H筛选还经过优化，能够筛选多对多蛋白质-RNA相互作用。Y3H系统的一个局限性是测试的RNA有时可以自行激活转录，而无需与携带反式激活结构域的蛋白质伙伴结合。事实上，这一特性已被利用来鉴定基于RNA的转录激活剂。尽管存在诸如频繁假阳性、依赖多个组分的表达以及RNA在非天然环境中的定位等局限性，Y3H平台仍然是研究体内RNA-蛋白质相互作用的通用且可扩展的工具。Y3H系统有限的转化能力可以通过将其与SELEX结合来解决，其中初始选择在体外进行，以减少进行体内筛选的序列空间。最近，开发了概念上相似的细菌三杂交系统，将Y3H方法的应用扩展到其他物种。鉴于大肠杆菌的高转化效率，该系统可以成为筛选大蛋白质和RNA文库的强大工具。此外，最近开发的CRISPR-Hybrid系统使用CRISPR将RNA招募到细菌的基因组位点，并已应用于发现识别RBP的新型RNA适体。

大规模并行RNA测定 followed by RNA免疫沉淀被开发用于鉴定与剪接因子hnRNPK在哺乳动物细胞中特异性相互作用的RNA元件。在这种方法中，将RNA片段库插入合成GFP mRNA的3'UTR并转染到哺乳动物细胞中。细胞裂解后，使用特异性抗体通过免疫沉淀RBP，并通过测序鉴定与蛋白质相关的富集RNA片段。最近，这种方法已被应用于探索Pumilio 1和Pumilio 2的结合要求，并测量它们对报告基因翻译效率的影响。此外，还开发了一种概念上类似的策略，称为MPRNA-IP，其中RNA片段直接插入CMV启动子下游，因此不编码任何报告蛋白。在MPRNA-IP中，测试的157聚体序列被系统突变，从而能够全面探索RBP结合的序列和结构要求。与在非交联天然条件下进行的MPRNA-RIP不同，MPRNA-IP采用甲醛交联来稳定RNA-蛋白质相互作用。使用MPRNA-IP，表征了Pumilio 2-PRE、MCP-MS2和TERT-hTR相互作用的结合偏好。总之，MPRNA-RIP和MPRNA-IP是有效的方法，将传统的MPRAs重新用于测定RBP结合。然而，两者都需要IP级抗体，并且结果的质量取决于免疫沉淀的效率以及纯化过程中RNA-蛋白质复合物的稳定性，并且可能具有甲醛交联引入的偏差。

最近，开发了一种基于RNA编辑测量体内RNA-蛋白质相互作用的新型MPBA RBPscan。该方法建立在TRIBE的基础上，其中感兴趣的RBP与ADAR的催化结构域融合。当RBP-ADAR融合在细胞中表达时，RBP将ADAR引导至其mRNA靶标，然后通过检测A-to-G转换进行修饰和识别。与TRIBE相比，RBPscan使用编码报告蛋白的合成mRNA库，其中可变序列区域置于3'UTR中，而不是依赖内源性mRNA。关键的是，mRNA报告基因包含一个具有多个腺苷的区域，位于可变RNA元件附近，作为RBP结合的传感器。

热点排行

新闻专题