综述:计算方法在别构RNA选择性筛选中的应用:综述

《International Journal of Biological Macromolecules》:Computational selection of allosteric RNAs: A review

【字体: 时间:2026年05月10日 来源:International Journal of Biological Macromolecules 8.5

编辑推荐:

  迪米特里奥斯·卡卢达斯 | 尼科莱特·帕夫洛娃 | 罗伯特·彭霍夫斯基 索菲亚大学“圣克利门特·奥赫里德斯基”生物学院合成生物学与生物信息学实验室,8德拉甘·赞科夫大道,1164,索菲亚,保加利亚 **摘要** 配体响应性核酶既可以通过体外筛选方法生成,也可以通过基

  迪米特里奥斯·卡卢达斯 | 尼科莱特·帕夫洛娃 | 罗伯特·彭霍夫斯基
索菲亚大学“圣克利门特·奥赫里德斯基”生物学院合成生物学与生物信息学实验室,8德拉甘·赞科夫大道,1164,索菲亚,保加利亚

**摘要**
配体响应性核酶既可以通过体外筛选方法生成,也可以通过基于算法的计算设计方法获得,这些方法能够明确模拟RNA的二级结构和能量特性。体外筛选依赖于实验筛选和富集过程,而计算设计策略则采用随机搜索和进化算法,包括基于配分函数的方法,这些方法根据热力学原理预测RNA的折叠过程。这些方法能够定量评估折叠概率、自由能状态以及配体依赖性的构象转换。通过编程控制结构和热力学限制,可以系统地设计出具有布尔逻辑门行为的核酶,其中催化活性作为二进制输出。与体外筛选相比,计算机设计在速度、可扩展性和重复性方面具有显著优势。算法工作流程可以完全自动化,由独立计算机程序执行,生成、评估和筛选大量候选序列。这种自动化使得设计过程能够快速进行,支持大规模开发可编程的核酶,突显了计算建模和算法控制在现代RNA工程中的核心作用。

**引言**
核酶是天然存在的RNA分子,能够催化化学反应。它们存在于多种生物体中,包括人类和人类病原体[1, [2]。在自切割核酶中,锤头核酶(HHR)是最适合用于计算设计allosteric RNA开关的支架。这种选择基于其相对较小的尺寸、明确的二级结构要求、保守的催化核心以及模块化结构,这些特性允许在保留关键茎结构的情况下插入 sensing 元件[3, [4], [5], [6]。此外,最小型和扩展型HHR变体的可用性使得可以设计出适用于不同应用的核酶:最小型HHR特别适用于体外生物传感,而扩展型HHR更适合接近生理条件的应用[6, [7], [8], [9]。重要的是,天然的HHR是一种自切割催化RNA,本身并不识别多种配体;配体识别是经过工程改造的allosteric HHR的特征,其中寡核苷酸结合位点或适配体结构被连接到催化支架上[3, [7], [8]。“别构”指的是通过效应子在某个位点的结合来调节另一个功能位点的活性。在核酶的背景下,别构性描述了 sensing 区域的配体结合与核酶核心催化活性变化之间的联系。在allosteric HHR中,这种通信是通过配体诱导的结构重排实现的,这种重排使RNA在无活性和活性构象之间转换。更具体地说,寡核苷酸或小分子的结合可以稳定或破坏茎结构的形成,从而促进或干扰催化活性锤头结构的形成。因此,RNA中的别构性可以理解为通过碱基配对相互作用、二级结构组织和构象集合的变化,将折叠信息从结合位点传递到催化中心。这一普遍原理类似于蛋白质中的别构性,即一个位点的结合会影响远端位点的活性。然而,蛋白质的别构性通常用结构域运动和侧链相互作用来描述,而RNA的别构性则更多地用替代的二级和三级折叠路径及其相关的热力学性质来描述。从这个意义上说,allosteric 核酶充当RNA开关,其中分子识别直接与结构重编程和催化调节相连[3, [7]。

**计算设计策略**
用于allosteric核酶的计算设计策略利用随机搜索、进化算法和热力学建模来生成具有预定义调节行为的RNA序列。这些方法的核心是基于配分函数的算法,它们根据热力学参数计算RNA的折叠概率[10, [11]。这些方法可以高效地测试大量序列,并预测配体结合时的构象变化[3, [10]。与体外筛选相比,计算设计在速度、可扩展性和重复性方面具有显著优势,同时减少了实验复杂性和脱靶活性。算法工作流程可以完全自动化,由独立的计算机程序执行,生成、评估和筛选大量候选序列。这种自动化使得设计过程能够快速进行,支持高通量生成可编程的allosteric核酶,突显了计算建模和算法控制在现代RNA工程中的关键作用。

**HHR的结构和功能**
HHR有两种主要的结构变体:最小型和扩展型。最小型HHR由一个保守的催化核心和三个对自切割活性至关重要的茎区域(茎I、II和III)组成。相比之下,扩展型HHR在茎II的环区域和茎I内的凸起部分之间增加了额外的三级相互作用,从而形成结构更稳定的分子(图1)。这种构象增强使得其催化速率大约是最小型HHR的十倍[6, [7], [8], [9]。这种结构改进使得扩展型HHR即使在低至1 mM的镁离子浓度下也能高效运作。相比之下,最小型HHR通常需要至少10 mM的Mg2+浓度才能发挥作用,这对于细胞环境来说过高[7]。扩展型HHR在接近生理条件的离子环境中也能正常工作,使其特别适合用于体内应用和基因调控系统[8, [9]。尽管最小型HHR的动力学较慢且对Mg2+的依赖性更高,但在需要降低活性的计算设计中仍然很有价值。特别是基于最小型HHR的allosteric核酶非常适合用于体外生物传感和延迟催化反应的应用[7, [14]。

**计算设计与自动化**
基于HHR的allosteric核酶的计算设计策略使用随机搜索、进化算法和热力学建模来生成具有预定义调节行为的RNA序列。这些方法的核心是基于配分函数的算法,它们根据热力学参数计算RNA的折叠概率[10, [11]。这些方法可以高效测试大量序列,并预测配体结合时的构象变化[3, [10]。与体外筛选相比,计算设计在速度、可扩展性和重复性方面具有显著优势,同时降低了实验复杂性和脱靶活性。计算核酶设计的一个重要成果是在分子层面上实现布尔逻辑运算。基于HHR的allosteric核酶已被设计为YES、NOT、AND和OR逻辑门,其中核酶的自切割作为计算输出[3, [12], [13]。在这个框架中,配体的存在与否被视为输入变量,切割活性被建模为二进制激活状态。通过设计能够识别多个效应分子的核酶,可以实现多输入调节行为。这些设计策略已被整合到自动化计算流程中,自动执行整个设计工作流程,包括序列生成、折叠评估、适应性评分和候选序列选择[5, [14]。这类系统能够快速生成大量的allosteric核酶库,并支持对基于RNA的调控电路的系统探索。总体而言,基于HHR的计算设计allosteric核酶为研究RNA折叠动态、开发分子逻辑系统以及推进计算生物学和医学领域的算法驱动生物工程应用提供了强大的平台[7]。

**结论**
HHR的计算设计和自动化为研究RNA折叠动态、开发分子逻辑系统以及推进计算生物学和医学领域的算法驱动生物工程应用提供了强大的工具。这些进展凸显了将结构限制纳入自动化RNA设计流程的重要性[3, [7], [14]。计算设计算法可以利用这些动力学差异,选择具有预定义折叠稳定性和催化阈值的HHR变体,以满足特定应用需求。本文更具体地介绍了计算筛选和设计策略、它们被自动化为独立软件工具的过程、实验验证以及当前的限制,以及将计算机设计与allosteric核酶的实验实现相连接的工作流程,补充了早期关于allosteric核酶作为分子生物传感器的综述[7]。

**实验验证**
寡核苷酸感应allosteric核酶可以通过体外筛选或最近开发的经过实验验证的计算机设计方法获得。体外筛选过程劳动密集且成本高昂,需要构建庞大的RNA库来探索多样的二级和三级结构。筛选在目标寡核苷酸配体结合调节核酶催化活性的条件下进行,根据所需功能(如配体依赖性切割或连接)对序列进行分组。随后进行多轮富集,通常涉及逆转录、PCR扩增和体外转录以再生RNA。该过程的效率很大程度上取决于配体的复杂性和转换动态范围,富集后的池中可能仍然存在脱靶或配体无关的活性,这可能会限制下游应用。相比之下,计算设计能够快速生成大量基于最小型或扩展型HHR支架序列的寡核苷酸感应allosteric核酶。这些方法依靠随机搜索和进化算法生成负责配体识别的候选寡核苷酸结合位点(OBS)序列。OBS序列被插入到HHR支架序列中的预定位置,这些位置由经过实验验证的设计算法确定[3, [10]。序列组装后,使用基于配分函数的算法(如ViennaRNA套件中的RNAfold-p)进行RNA折叠预测,该算法应用McCaskill配分函数来计算碱基配对概率和二级结构集合[15], [16],以评估二级结构形成和折叠概率。根据热力学和结构标准选择或排除候选核酶,包括ON和OFF状态之间的自由能平衡、所需茎结构的保持以及预测的配体依赖性构象转换[3, [10], [17], [18]。设计算法确保所选allosteric核酶在配体结合时发生预定的构象转换,从而根据指定的布尔逻辑功能激活或抑制自切割[11]。尽管这些计算策略的部分内容已被用于小分子感应核酶的设计,但寡核苷酸感应核酶仍是当前计算流程中最可靠且预测最准确的输出。

**总结**
计算设计策略的一个关键优势是OBS序列被明确定义,这使得可以直接使用序列比对工具(如BLAST[19], [20])来识别目标寡核苷酸并评估序列选择性。此外,还结合了反向折叠算法(如ViennaRNA套件中的RNAinverse[15]),以生成保持期望折叠拓扑结构的多个核酶变体,同时随机化OBS序列。对于在细胞环境中运行的基因表达系统,可以使用基于BLAST的筛选来确保OBS选择性地识别目标配体,避免与内源性宿主转录本的意外相互作用。为了保持催化活性,allosteric核酶的所有关键结构元素(包括催化核心和三个典型的茎区域)都必须保持完整。在设计YES逻辑门寡核苷酸感应核酶时,核酶在寡核苷酸不存在时处于非活性状态,在寡核苷酸结合时激活。这种非活性状态是通过将OBS插入茎III实现的,破坏其形成并形成另一个茎(茎IV)。茎III的破坏使催化核心失稳,从而使核酶失活。配体结合时,与OBS的相互作用诱导构象重排,恢复茎III和催化核心,从而重新激活自切割。这种配体触发的结构转换实现了YES布尔逻辑功能,展示了如何通过序列级优化精确控制核酶行为(图2A)。同样的算法框架也可以用于生成实现NOT布尔逻辑功能的allosteric核酶。在这种设计中,OBS再次插入茎III,但其序列的选择使其在配体不存在时无法破坏茎III的形成。因此,HHR的催化核心保持完整,核酶在无配体条件下仍具有自切割活性。计算算法确保目标寡核苷酸与OBS的结合会诱导构象重排,破坏茎III并形成另一个茎结构(茎IV),从而失活核酶。这样,配体结合将核酶从活性状态切换到非活性状态,实现了NOT布尔逻辑功能(图2B)。AND和OR逻辑门的原理与YES布尔逻辑函数类似,不同之处在于引入了两个独立的寡核苷酸结合位点(OBSs),它们识别两种不同的配体。在这些设计中,OBSs被插入茎II而不是茎III,并通常由一个短间隔序列分隔。他们的插入会破坏茎II结构,促进替代茎(茎IV)的形成,并使催化核心变得不稳定,从而在没有配体的情况下保持核酶的非活性状态。对于OR逻辑门,任一配体与其对应的OBS结合就足以诱导构象重排,恢复茎II和催化核心,从而激活核酶并导致自我切割(图3)。相比之下,AND逻辑门需要两个配体同时结合才能重新建立活性构象(图4)。

通过指数富集(SELEX)对配体进行系统进化在体外广泛用于选择别构核酶,但这既耗时又耗费资源。SELEX结合了化学合成和分子生物学方法来生成单链RNA或DNA寡核苷酸库,首次应用于1990年以分离能够结合小分子的RNA适配体[21]、[22]、[23]。该方法包括化学合成大量的随机DNA寡核苷酸库,这些寡核苷酸两侧有固定的接头区域,用作PCR扩增的引物结合位点。每个序列的一端都含有T7 RNA聚合酶启动子,以及一个二核苷酸或三核苷酸鸟嘌呤基序(GG或GGG),以确保高效转录。这些设计元素使得转录、选择和扩增的循环迭代进行,逐步富集具有所需结合特性的序列(图5)。

在体外选择过程中,多种因素可能影响生成库的质量。在库合成过程中很少能完全覆盖随机化的DNA或RNA区域。尽管理想情况下随机化片段应限制在大约25个核苷酸以内,但实际限制通常会导致更长的片段,通常是40-60个核苷酸或更多。因此,库只采样了目标分子理论可能序列空间的一小部分。此外,寡核苷酸合成过程中的错误也会产生限制,包括形成可能在PCR过程中优先扩增的截短序列,进一步降低库的多样性。PCR扩增本身可能会引入序列依赖性偏差,而引物和模板之间的不匹配则可能导致非预期序列的富集[11]。

技术进步如微流控和下一代测序(NGS)已被引入以部分自动化SELEX工作流程并加速适配体的选择。其他技术,包括非平衡毛细管电泳(NECEEM),也被开发出来以提高选择效率。尽管有这些创新,体外选择方法仍然耗时且成本高昂[24]。

相比之下,用于生成小分子感应别构核酶的计算设计方法更快、更具成本效益且高度精确。通过结合随机搜索策略、动态规划和热力学折叠预测,可以系统地评估部分随机化的序列是否能够采用预定义的二级结构。这些算法能够生成等长的适配体序列库,这是体外方法难以实现的。在计算设计的系统中,配体与适配体域的结合会诱导核酶的构象变化,要么恢复催化茎和核心结构,从而激活自我切割(YES逻辑),要么破坏这些结构,导致核酶失活(NOT逻辑)。

通过将适配体序列插入HHR的茎II或茎III中,可以生成可编程的小分子感应别构核酶,分别对应于YES或NOT布尔逻辑功能的实现。这种算法驱动的框架能够精确控制核酶的行为,并突显了计算设计在构建基于RNA的调控系统方面的优势。

**计算设计基于HHR最小版本的具有YES逻辑的寡核苷酸感应别构核酶**
计算设计框架采用多步骤算法,利用结构和热力学标准反复筛选候选别构核酶序列。RNA二级结构预测使用ViennaRNA套件中的RNAfold分区函数进行。OBS序列通常长度为14-22个核苷酸,且不包含长连续重复的核苷酸片段,通过随机搜索算法生成,并插入YES逻辑功能计算设计中预定义的位置。

**算法设计具有YES和NOT逻辑的寡核苷酸感应别构核酶**
经过实验验证的用于生成寡核苷酸感应别构核酶的算法已完全自动化,并实现为独立的计算机程序。这些程序连续执行整个设计流程,直到识别出满足所有预定义结构和热力学标准的序列。该过程持续进行,直到生成用户定义数量的功能性别构核酶序列,实现高通量的计算机设计。

**长度感应别构核酶**
计算算法可以用于生成能够检测RNA或DNA分子大小差异的别构核酶。通过利用长度依赖性识别,可以在单个核酶中嵌入多个布尔逻辑功能,从而构建集成分子电路(IMCs)。在这些系统中,RNA核酶作为自组装支架与多个DNA或RNA寡核苷酸相互作用,形成分子复合体。

**具有预定义寡核苷酸效应子的别构核酶的计算设计**
合理设计的别构核酶能够选择性识别预定义的RNA序列,在肿瘤学领域具有显著的治疗潜力。人类端粒酶逆转录酶(hTERT)mRNA在大约90%的人类肿瘤中表达,是一个既定且具有临床相关性的序列特异性调控分子靶点。相比之下,大多数健康体细胞不表达hTERT mRNA,使其成为区分恶性细胞和正常细胞的理想标记。

**基于扩展HHR的NOT布尔逻辑小分子感应别构核酶的计算设计**
能够感应小分子的别构核酶有许多应用,包括化学检测、外源性基因表达控制、高通量筛选(HTS)的报告系统以及分子计算。RNA适配体可以被设计用来结合特定的小分子,当与核酶结构域融合时,可以实现选择性的分子识别和调控控制。最初为寡核苷酸感应核酶开发的计算设计策略已成功应用于...

**基于HHR最小版本的YES布尔逻辑小分子感应别构核酶的计算设计**
为了作为小分子感应别构核酶的YES逻辑运算符,最小HHR与NOT变体的区别仅在于茎II中缺少一个碱基对(U-A)。这种缺失导致在没有鸟嘌呤的情况下茎II变得不稳定,因为只存在一个碱基配对;而缺少一个C残基则会降低核酶的自我切割速率。当与鸟嘌呤结合时,位于茎II的两个核苷酸(U, C)形成非典型...

**基于HHR最小版本的基于3D的计算设计NOT布尔逻辑小分子感应别构核酶**
最小HHR支架序列已被用于创建与鸟嘌呤或腺嘌呤感应适配体融合的小分子感应别构核酶,生成能够感应嘌呤的NOT布尔逻辑别构核酶。这些嘌呤感应适配体是腺嘌呤核开关的一部分,存在于人类病原菌mRNA分子的5’-UTR区域。它们通过直接结合鸟嘌呤或腺嘌呤残基来控制基因表达。

**小分子感应别构核酶的应用**
无论是基于最小还是扩展HHR支架的小分子感应别构核酶,由于它们能够选择性地响应特定的分子输入,因此具有广泛的应用范围。一个突出的应用是在HTS检测中,这类核酶可用于识别能够调节核酶活性的小分子,并可能作为潜在的药物候选物。设计响应疾病相关分子的核酶可以实现大规模化合物的系统性筛选。

**从计算机设计到体外测试**
在计算设计之后,OBS或适配体序列可以与剩余的HHR部分一起进行化学合成,并用于实验实现所设计的别构核酶。根据所设计别构核酶的布尔逻辑功能,体外测试条件需要略有不同的方法。HHR的各种组成部分(根据构建类型不同,可能是OBS或适配体)被合成...

**性能和限制**
计算策略在寡核苷酸感应别构核酶方面的性能最强,其中识别主要基于经典的沃森-克里克碱基配对,因此可以使用基于分区函数的二级结构预测有效建模[3]、[7]、[10]。在实验研究中,所有11种计算机设计的别构核酶都被证明是功能性的。所得到的YES、NOT、AND和OR结构显示出较大的切换窗口...

**讨论**
通过计算算法生成的核酶序列已进行化学合成,经过生化切割实验,并显示出预测的配体依赖性切换行为和逻辑功能。这些经过实验验证的算法允许通过改变OBS或适配体结构的序列或插入位置来精确调节核酶的特异性和调控行为。这种灵活性使得...

**结论**
基于最小或扩展HHR支架实现布尔逻辑功能的可编程核酶代表了用于治疗检测、基因调控、集成分子电路和环境感应的灵活组件。寡核苷酸和小分子感应核酶的计算设计提供了一种可扩展且成本效益高的替代传统体外选择的方法。通过应用经过实验验证的算法,这些计算机方法可以实现高设计精度。

**作者贡献声明**
Dimitrios Kaloudas:撰写——原始草稿,数据管理。
Nikolet Pavlova:撰写——审稿与编辑。
Robert Penchovsky:撰写——审稿与编辑,监督,概念化。

**利益冲突声明**
作者声明以下可能的财务利益/个人关系可能被视为潜在的利益冲突:Robert Penchovsky报告称获得了保加利亚国家科学基金的支持。如果还有其他作者,他们声明没有已知的可能影响本文工作的财务利益或个人关系。

**致谢**
本研究由保加利亚国家科学基金(BNSF)资助,资助编号分别为:KP-06-H63/1/13.12.2022和KP-06-M93/1/08.12.2025。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号