《RNA Biology》:In silico unwinding of caenorhabditis elegans microRNA duplexes to evaluate thermodynamic end stabilities improves predictions of microRNA strand selection
编辑推荐:
本研究为解决传统microRNA(miRNA)链选择预测模型精度不足的问题,研究者聚焦秀丽隐杆线虫(C. elegans),在生理相关温度下,通过对miRNA发夹与双链结构进行预测,并开创性地引入约束性折叠算法模拟双链末端的局部解旋,从而量化了其热力学稳定性。研究表明,基于此“计算机模拟解旋能量”评估的热力学不对称性,可显著提升对miRNA链选择的预测准确性,为深入理解miRNA生物发生机制提供了新方法与重要资源。
在生命活动的精密调控网络中,microRNA(miRNA,微小核糖核酸)扮演着类似“分子开关”的重要角色。这些长度约22个核苷酸的非编码RNA,通过与靶信使RNA(mRNA)结合,在转录后水平精确调控基因表达,影响着从个体发育到疾病发生等众多生命过程。miRNA的产生并非一蹴而就,它经历了一个复杂的生物发生(biogenesis)过程:最初,基因组编码的初级转录本(pri-miRNA,初级miRNA)被加工成发夹状的前体(pre-miRNA,前体miRNA),再被进一步剪切形成一个包含两条互补链的短双链RNA,即miRNA双链体。这个双链体随后会被加载到核心效应蛋白Argonaute中,但最终只有其中一条链(指导链,guide strand)被选中并保留下来,成为具有功能的成熟miRNA,而另一条链(过客链,passenger strand)则被降解。这个关键的“二选一”步骤被称为链选择(strand selection)。选对链,miRNA才能精准行使功能;选错链,则可能导致基因调控的紊乱。
然而,细胞是如何做出这个选择的?科学家们此前已知,两条链5’端第一个核苷酸的种类(偏好U>A>G>C)以及双链两端的相对热力学稳定性(thermodynamic stability)是主要决定因素,Argonaute倾向于加载5’端核苷酸更有利、热力学稳定性相对更低的那一端。但现有模型对大约20%-25%的miRNA链选择预测失败,说明我们的理解还不完整。此外,一个常被忽视但可能至关重要的问题是:大多数用于预测RNA二级结构和稳定性的算法,其默认参数设定在37°C。对于像秀丽隐杆线虫(Caenorhabditis elegans)这样在更低温度(如实验室常用的20°C)下生存的模式生物,使用非生理温度的参数进行预测,其结果是否能真实反映体内的分子状态?目前主流的miRNA数据库(如miRBase和MirGeneDB)对线虫miRNA前体结构的预测本身就存在分歧,这提示我们,是时候重新审视并优化这些计算模型了。
正是为了解决这些问题,由Medley等人开展的研究在《RNA Biology》上发表。他们决定以秀丽隐杆线虫为模型,深入探究生理温度如何影响miRNA中间体的结构预测,并开发一种更精准的方法来评估双链末端的热力学稳定性,从而提升链选择的预测能力。
为了开展这项研究,作者们主要运用了几个关键技术方法。首先,他们从公共数据库miRBase v22.1获取了所有线虫miRNA发夹及成熟链的序列信息。其次,核心的分析工具是来自ViennaRNA软件包的RNAfold和RNAcofold程序,用于在不同设定温度(如生理相关的15°C、20°C、25°C,以及默认的37°C)下,预测miRNA发夹和双链体的最小自由能(MFE, Minimal Free Energy)二级结构。最后,也是本研究方法学的创新点,他们开发了“计算机模拟解旋”方法:通过向RNAcofold引入硬性折叠约束(hard constraints),强制指定双链末端1-4个核苷酸不配对,从而模拟局部解旋状态,并通过计算完全配对与部分解旋双链之间的自由能差值,定义了“解旋能量”,以此量化每个末端的热力学稳定性。所有统计分析均使用R软件完成。
研究结果
次级结构预测揭示温度对线虫miRNA中间体的显著影响
研究人员首先系统预测了线虫miRNA发夹在不同温度下的结构。他们发现,超过25%的发夹在20°C下的预测折叠方式与在37°C下不同。这些差异大多数(75.9%)发生在发夹的末端或环区,部分(24.1%)影响了中央错配或凸起的位置。重要的是,一些温度依赖性的变化甚至改变了对于miRNA加工至关重要的顶端或基部连接点(junction)的位置。即便在15°C至25°C的生理温度范围内,也有一定比例的发夹显示出不同的预测结构。这强有力地表明,温度参数显著影响miRNA前体结构的算法预测,使用生理相关温度至关重要。
随后,他们对miRNA双链体进行了类似分析。结果显示,13.2%的双链体在20°C和37°C下的MFE结构不同。更高的温度通常与双链体末端碱基配对的减少相关。这些温度引起的变化,有些影响了中央错配的位置(这关乎小RNA被分选到特定Argonaute蛋白),有些则导致了一个末端的部分解旋,从而直接改变了对于链选择至关重要的热力学不对称性的预测。
miRNA发夹前体可能将双链体限制在亚稳定状态
一个有趣的发现是,对比从发夹结构中提取出的双链区与独立预测的双链体MFE结构,近三分之一(31.1%)的miRNA在20°C下两者结构不同。双链体的MFE结构通常显示末端的碱基配对减少,尤其是在对应指导链的末端。这表明,miRNA发夹前体可能将双链体“禁锢”在一个能量较高的亚稳定状态,一旦双链体从发夹中释放出来,其末端的部分解旋在能量上可能更为有利。这种发夹约束状态与最低能量状态之间的能量差,可能潜在地贡献于双链末端的热力学不对称性。
计算机模拟解旋评估miRNA双链末端热力学稳定性
为了在生理温度下更准确地量化双链末端稳定性,研究者创新性地开发了“计算机模拟解旋”方法。其核心思路是,通过引入折叠约束,强制让双链末端1至4个核苷酸不配对,计算这部分解旋的双链的自由能,然后与完全配对的双链自由能作比较,其差值即为“解旋能量”。这个值理论上与解开该末端所需的能量成正比。利用这种方法计算出的解旋能量,清晰地显示出了miRNA双链末端固有的热力学不对称性:平均而言,对应于指导链5’端的解旋能量低于对应于过客链5’端的解旋能量,意味着解开指导链末端所需的能量更少。这种方法超越了传统的、基于37°C参数的最邻近邻接模型数据库的取值,因为它考虑了末端解旋对整个双链稳定性的影响。事实上,最邻近邻接模型的计算结果甚至与已知的小RNA不对称性原则相矛盾。

p<0.01,
p<0.001, n.s. (not significant) p>0.05. (b-d) a value of zero indicates no difference in free energy between the wound and partially unwound duplexes and corresponds to duplex ends that are already unwound in the mfe or hairpin structures. a positive value i
>