综述:变态发育与长链非编码RNA:紧密关联

《Genesis: The Journal of Genetics and Development》:Metamorphosis and lncRNAs: A Close Relationship

【字体: 时间:2026年04月14日 来源:Genesis: The Journal of Genetics and Development 2.5

编辑推荐:

  本刊推荐:该综述系统阐释了长链非编码RNA(lncRNA)在脊椎动物变态发育中的核心调控作用。文章从lncRNA的转录机制、核质定位功能切入,深入探讨了其在基因组印记、剂量补偿及器官重塑(如尾吸收、肠重构)中的分子网络,并提供了针对非模式物种的生物信息学分析流程与进化视角,是该领域极具价值的参考蓝图。

  
变态发育与lncRNAs:紧密关联
摘要
经典的变态发育定义是指胚胎后的转变过程,例如从蝌蚪转变为幼蛙。然而,近期研究表明,由于潜在的内分泌和分子通路高度保守,这一过程在所有脊椎动物中均不同程度地存在。随着高通量测序技术的发展,非模式物种的转录组数据揭示,蛋白质编码基因仅占基因组的一小部分。相比之下,大部分转录产物产生了具有重要调节功能的非编码RNA。其中,长链非编码RNA(lncRNA)是一类多样且重要的分子,已知其在多个水平上调节基因表达,并涉及各种生物学背景。尽管lncRNA的重要性已被确立,但针对生命之树中lncRNA的研究仍是一个开放的领域,这对于理解其潜在作用和进化保守性至关重要。本文总结了lncRNA作为调节分子的作用、其在发育和变态发育中的功能、用于表征它们的计算策略,以及在非模式物种中研究它们所面临的挑战和机遇。
1 引言
变态发育(希腊语 meta-“改变” 和 -morphos“形态”)描述了从幼虫到幼体的生命周期阶段转变,几乎总是伴随着主要的形态变化和栖息地迁移,从而允许利用不同的生态位。从基底谱系(七鳃鳗)开始,变态发育存在于所有脊椎动物中。硬骨鱼表现出多样的变态策略,从微妙的生理调整到完全的生态过渡。虽然其他脊椎动物群体表现出更弱化的变态形式,但这些过程共享一个保守的分子信号通路调控框架。两栖动物仍然是这一过程最具代表性的例子,其戏剧性的转变已成为发育生物学家一个多世纪的模型系统。
两栖动物的变态发育是一个内分泌驱动的过程,甲状腺激素(TH)和皮质类固醇水平指导形态、生理和生化变化,包括尾部重吸收、后肢发育和肠道重塑。在变态发育期间,TH到达外周组织并进入细胞核,与其受体结合,招募特定的转录因子(TF),从而引发变态相关基因的转录。
TH结合位点出现在基因间区域,这表明许多变态相关基因是从非蛋白质编码位点转录而来的。这一观察结果与一个公认的事实相符:虽然只有约2%的基因组编码蛋白质,但约80%的区域是活跃转录的,产生了具有专门功能的多种非编码RNA(ncRNA)。
ncRNA是指几乎没有编码潜力但在各种细胞环境中具有结构或调节功能的转录本。ncRNA根据大小进一步细分为小ncRNA(<200核苷酸,miRNA、piRNA、snRNA)和长ncRNA(lncRNA),后者长度超过200核苷酸。这一定义是任意的,因为它最初是为了明确区分作为调节转录本的lncRNA和执行结构作用的sncRNA。一个更精细的定义是长度超过500核苷酸、几乎没有编码潜力、由RNA聚合酶II(Pol II)转录、5'端加帽、3'端多聚腺苷酸化甚至经过剪接的转录本。LncRNA代表了遗传调控的一个额外层面,因为不同的转录本与复杂的生物学现象相关,如细胞增殖、分化、DNA损伤反应和衰老。
本文旨在综合关于lncRNA调节脊椎动物个体发育中变态发育的知识,探讨其进化保守程度、生物信息学方法,以及当前发现和注释的挑战与机遇。
2 LncRNA转录
2.1 普遍性转录
在讨论lncRNA生物发生时,一个重要的概念是普遍性转录,它指的是真核生物基因组中来自蛋白质编码基因(PCG)和经典结构或调节位点(如tRNA、rRNA、snRNA)之外的广泛RNA分子产生。术语“普遍性”并不一定意味着缺乏功能——许多此类转录本尚未被表征——而是强调这一现象广泛的、全基因组的性质。
在真核生物中,RNA聚合酶II(Pol II)被认为是普遍性转录的主要驱动力,因为它可以从广泛的基因组位点启动转录,特别是无核小体区域。大多数Pol II启动子表现出双向活性:虽然大多数Pol II复合物以经典的5'–3'方向启动转录,但一小部分从同一启动子区域启动反义转录。这种双向转录产生了多样化的非编码RNA库,包括增强子RNA(eRNA)、启动子上游转录本(PROMPT)和其他长的基因间非编码RNA(lincRNA),以及许多不稳定的隐性转录本,这些转录本会被核外泌体和其它RNA监测通路迅速降解。
普遍性转录的进化优势一直受到质疑,因为该过程的失调可能对细胞极具危害性。松散转录控制的潜在后果包括干扰PCG的转录、基因组不稳定以及限制性细胞因子的滴定。然而,尽管随机的转录干扰可能是有害的,但有充分记录的案例表明,在特定生物学背景下,转录干扰可以作为调节机制发挥作用,例如静止状态、稳态(通过Zap1下调)和代谢物控制。值得注意的是,这些结论大多来自芽殖酵母的研究,它们是否适用于后生动物仍有待完全确定。
尽管全面讨论普遍性转录的生物学影响超出了本文的范围,但将其视为细胞的“受控风险”是合理的。因此,在研究普遍性转录的非编码RNA时,一个合理的零假设是大多数转录本对生殖适合度的影响最小。
2.2 LncRNA转录不同于mRNA
为了理解lncRNA在基因调控中的作用,首先需要了解lncRNA的转录调控不同于mRNA。在真核细胞中,Pol II负责从PCG产生所有前体mRNA,这些前体mRNA在转录过程中经过5'-加帽、剪接和3'-多聚腺苷酸化共同成熟。前体mRNA的转录是一个定义明确的过程,由5'-帽和3'-多聚腺苷酸化位点分别标记转录起始位点(TSS)和转录终止位点(TES)。
尽管lncRNA也是由Pol II转录的,但它们的转录调控、起始、终止和加工不如mRNA那样受到严格约束。本节旨在描绘lncRNA和mRNA转录及加工之间的主要差异。
2.2.1 转录起始
尽管Pol II也负责lncRNA的合成,但lncRNA的转录仍然知之甚少,因为它通常是组织特异性的且表达水平较低。对实验验证的人类和lncRNA loci的核心启动子区域(-50至+30 bp相对于TSS)的分析显示,它们的三维启动子结构与PCG相似,特别是在两个区域:TSS周围的起始元件(INR)六核苷酸和TATA框(位于-28 bp左右的八核苷酸)。然而,这些元件在频率和序列特征上存在差异;值得注意的是,TATA框在lncRNA启动子中显著少见,且每个位置的资讯熵高于PCG核心启动子,导致lncRNA的基序较弱且约束较少,而这些基序对PCG的转录调控至关重要。
PCG启动子的转录起始需要先锋TF来招募染色质重塑复合物,促进染色质转变为可及状态,并使随后的特定下游TF结合以驱动转录起始。这种调控复杂性并未被lncRNA启动子普遍共享。相反,lncRNA转录经常发生在预先存在的开放染色质区域内,“搭便车”于活跃的转录枢纽,并且通常与邻近PCG的表达相关。这种现象在双向转录的增强子RNA(eRNA)和反义lncRNA中得到了例证。
此外,lncRNA可以通过形成R-loop来促进开放染色质状态的维持——R-loop是指当RNA转录本与DNA双链中的一条链退火时形成的RNA-DNA杂交结构。R-loop在Pol II启动子处特别富集,并且与反义lncRNA转录密切相关,支持了染色质结构和RNA结构而非严格的序列基序可能作为lncRNA转录关键调控特征的观念。
2.2.2 转录终止
PCG的转录终止可以通过两种非互斥的机制发生:变构模型和鱼雷模型。在变构模型中,多聚腺苷酸化位点的转录诱导Pol II的构象变化,包括延伸因子SPT5的去磷酸化,从而减缓转录并促进终止。这一过程使得外切核酸酶XRN2能够降解下游RNA并促进Pol II从DNA模板上释放。在鱼雷模型中,XRN2被招募到切割的前体mRNA暴露的5'末端,并以进行性方式降解RNA,直到追上Pol II,触发聚合酶脱离。
LncRNA的转录终止涉及额外的专门蛋白质复合物,最显著的是Integrator、Restrictor和Microprocessor。Integrator复合物与暂停或减慢的Pol II相关,并介导新生RNA的切割,这一机制最初是在snRNA中表征的,但现在被认为作用于lncRNA亚群。或者,Restrictor复合物独立于RNA切割终止转录;相反,其组分PNUTS和WDR82促进SPT5的去磷酸化,导致Pol II释放。此外,一些lncRNA由Microprocessor复合物加工,其中lincRNA内嵌入的前体miRNA(pre-miRNA)的共转录切割诱导下游Pol II终止,而不依赖于典型的多聚腺苷酸化依赖途径。
少数lncRNA(特别是PROMPT和eRNA)受到NNS终止复合物——Nrd1-Nab3-Sen1——的强烈基因组监视。在该通路中,Nrd1和Nab3通过序列特异性基序被招募到新生转录本上,随后募集解旋酶Sen1,促进转录本释放。释放的RNA随后被核外泌体迅速降解。这种机制通常被解释为转录衰减系统和防止通读转录进入下游基因的安全装置。某些lncRNA如何逃避NNS介导的终止并实现稳定表达仍然是一个悬而未决的问题,也是未来研究的重要方向。
2.3 选择性转录和亚型复杂性
转录是一个受多水平调控的复杂生物学过程。通过不同分子参与者的相互作用,单个基因组位点可以产生多个RNA产物,使细胞能够在不需要额外遗传物质的情况下适应不同条件,从同一位点产生的不同RNA产物被称为亚型。
2.3.1 选择性转录起始位点
启动子可以有一个灵活的TSS,根据表观遗传修饰、细胞环境(如缺氧)或发育阶段,可以在位点上制定差异亚型选择,从而以组织或环境特异性的方式调节基因表达。例如,Xist(X染色体失活的主调节因子)拥有3个推定的启动子,称为P0、P1和P2。P1是位于TSS正上游的最小启动子区域,P0位于TSS上游6.5Kb处,产生不稳定的Xist转录本;或者,P2位于TSS下游约1.5Kb处(在外显子1内部),产生稳定的转录本。最近的数据表明,P2可能充当增强子而不是启动子,这对选择性转录作为一种调节机制的相关性提出了质疑。
一些作者认为,大多数选择性转录起始事件可能不是适应性的,而是代表分子噪音或错误,其中一个TSS是最佳的并与适当的基因功能相关,而替代位点则源于不精确的转录起始。选择性转录起始是否反映了复杂的基因调控机制或分子错误仍然是一个悬而未决的问题,因为这种潜在分子变异的适应性价值可能在于它为自然选择提供了原材料。
2.3.2 选择性多聚腺苷酸化和3'加工
lncRNA中另一个主要的转录和转录后复杂性来源是选择性3'多聚腺苷酸化(APA)和切割。相当比例的lncRNA(约70%)表现出与mRNA不同的APA模式。在lncRNA中,多聚腺苷酸化位点通常位于最3'外显子的上游,而在mRNA中,这些位点通常位于末端外显子内。LncRNA中最常见的APA结果是产生具有可变3' UTR长度的转录本亚型,这一特征会影响RNA分子的亚细胞定位、二级结构和功能相互作用。
LncRNA NEAT1例证了选择性3'末端加工的后果,因为它产生两种主要亚型:NEAT1v1和NEAT1v2,它们在3'末端加工上主要不同。NEAT1v1(约3.7 kb)是多聚腺苷酸化的,而NEAT1v2是非多聚腺苷酸化的且明显更长(约23 kb)。这两种亚型都是旁斑形成所必需的:NEAT1v2首先与RNA结合蛋白p54nrb(NONO)和SFPQ结合作为结构支架,随后招募NEAT1v1和PSPC1以稳定旁斑结构。这种调节平衡的破坏,例如NEAT1v1的过表达,会导致旁斑组装减少,并与神经退行性疾病的进展有关。
一些lncRNA完全绕过典型的多聚腺苷酸化途径,转而经历由RNase P切割介导的选择性3'末端加工。RNase P依赖性加工通过从其互补的下游3' U-rich序列切割11-nt A-rich tract,产生高度稳定的U•A–U主要沟RNA三链体结构。这种构型允许A-rich tract与上游U-rich内部环相互作用,lncRNA MALAT1就是一个例子。RNase P的识别似乎依赖于新生lncRNA 3'末端特定结构基序的形成,该基序部分模拟了tRNA的“肘部”,从而促进RNase P的招募,这也是NEAT1描述的机制。
2.3.3 选择性剪接
与mRNA类似,lncRNA由内含子和外显子组成,并在其5'和3'末端含有调节元件,使其易于发生剪接。然而,与PCG相比,lncRNA表现出较低的剪接效率,这反映在每基因产生的转录本亚型数量较少。在人类中,大约16,000个lncRNA基因产生约28,000个转录本,导致转录本与基因的比率显著低于PCG观察到的比率。这种剪接效率的降低可能源于lncRNA和PCG之间的内在结构差异,包括外显子平均数量较少、内含子长度差异、分支点和供体/受体位点处5'和3'剪接位点共有序列的差异,以及与不同或专门的剪接因子的相互作用。
尽管如此,lncRNA中的剪接已成为一种重要的调节机制。例如,lncRNA SNHG19的选择性剪接通过下调snoRNA表达促进肝母细胞瘤的化疗耐药性。在其他生物学背景中也发现了此类例子:在水稻中,lncRNA LAIR的选择性剪接产生多种亚型,通过差异结合表观遗传调节因子OsMOF和OsWDR5来调节LRK1位点的表达,这两个调节因子分别控制H4K16ac和H3K5me3组蛋白标记,从而调节产量相关性状。同样,lncFAM200B的不同亚型下调Cyclin D1 mRNA,抑制牛脂肪生成过程中的前脂肪细胞增殖,并与牛的体型测量性状相关。LncRNA剪接变体的证据凸显了这些分子在基因表达调控和细胞生物学不同方面的重要性。
总的来说,这些观察结果强调,lncRNA转录在一个复杂的、依赖于环境的调控景观内运作。尽管机制见解不断增长,但关于lncRNA的调控、加工和功能相关性仍然存在许多基本问题,需要通过针对性的实验验证来解决。
3 LncRNAs在基因调控中的作用
LncRNA调节从染色质结构组织到转录、翻译、RNA定位和稳定性的基因表达。它们的功能源于它们与RNA、蛋白质和DNA相互作用的能力。LncRNA的亚细胞定位与其功能相关;相当一部分lncRNA保留在细胞核中,在那里它们与染色质相关联以调节基因表达。细胞质lncRNA充当分子诱饵,调节其他RNA或蛋白质的活性,以及它们的稳定性和周转。
3.1 核内LncRNA
LncRNA调节从其转录的同一染色体上的染色质结构(顺式),或靶向存在于不同染色体上的位点(反式)。它们对染色质的影响可以是直接的,通过与DNA的物理相互作用以及招募TF、RNA结合蛋白(RBP)或组蛋白修饰酶;也可以是间接的,作为支架稳定染色质重塑复合物而不直接结合DNA。高达60%的核lncRNA被发现与靠近自身转录位点的转录活跃染色质区域相关联,支持它们作为局部基因表达微调者的角色。核lncRNA的功能如图1所示。
3.1.1 顺式(Cis)活性**
顺式染色质调控的一个经典例子是哺乳动物中的X染色体失活,由lncRNA Xist介导。Xist从一个X染色体随机表达;它沿着整个染色体扩散,招募转录抑制因子和染色质修饰剂以建立X失活中心,最终通过异染色质形成导致全染色体沉默。
LncRNA通过影响TF来影响基因组区域的空间可及性。Kancr通过结合hnRNPAB来增强Kdm2b转录,促进增强子和启动子之间的染色质环化。这些效应也可以扩展到局部相互作用之外;HOTAIRM1束缚在其自身的位点以重组HOXA簇周围的三维染色质结构(约120 kb),维持其转录。
3.1.2 反式(Trans)作用的LncRNA**
LncRNA影响全基因组的基因表达(反式)。一个关键的例子涉及CCCTC结合因子(CTCF),它是三维染色质结构的保守调节因子。大约5000个人类lncRNA被预测通过RNA特异性基序结合CTCF,暗示了一种潜在的广泛机制——尽管这些相互作用需要进一步验证。LncRNA Jpx通过取代CTCF在低亲和力位点的结合来重塑染色质环化,从而实现全基因组调控。除了这些广泛的影响外,lncRNA-CTCF调控也可以在局部发生;lncRNA PACERR与CTCF形成复合物并招募组蛋白乙酰转移酶p300,增强组蛋白乙酰化,从而激活邻近基因。
3.1.3 表观遗传调控
LncRNA通过将组蛋白修饰复合物引导至精确的基因组位置来影响染色质组织,例如多梳抑制复合物(PRC)。多梳蛋白是进化上保守的转录抑制复合物(PRC1和PRC2)。已发现LncRNA将PRC引导至其靶位点,建立局部的染色质抑制。AIRN作为一个主调节因子,通过结合多个调节性DNA元件并促进PRC1和PRC2的招募,在15 Mb结构域内介导局部基因沉默。该模型表明,类似的lncRNA介导机制可能控制其他染色体背景下的抑制。
3.1.4 DNA–LncRNA相互作用
LncRNA通过在整个基因组中与DNA的直接相互作用来协调基因表达并塑造染色质结构。LncRNA形成R-loop和三链体结构,不仅调节特定基因,还有助于组织高阶特征,如拓扑关联域(TAD)和核区室,将lncRNA定位为基因组结构的关键调节因子。
LncRNA通过序列特异性杂交指导TF,例如APOLO,它形成R-loop以招募LHP1(PRC1的一个组分)。R-loop介导的调控在真核生物中至关重要,如TERRA所示,它通过介导RAD51依赖的R-loop形成来维持端粒长度。或者,LncRNA通过Hoogsteen键合的三链螺旋在大沟中结合DNA,这由既定的序列特征(嘌呤偏向、核小体接近性和带正电的H3 N-尾)引导。这些原理允许细微的调节结果:一些lncRNA通过招募沉默复合物(如LINC00525通过EZH2)来抑制转录;而另一些,如RAINY,则激活基因表达。
3.1.5 转录非依赖性调控
一些lncRNA通过位于其位点内的DNA元件或通过转录行为本身来调节邻近基因,而不是通过RNA分子的功能。一个被充分表征的例子是lncRNA BENDR,其启动子作为顺式调节元件控制下游相邻基因Bend4的表达。删除BENDR启动子的750 bp使Bend4表达降低了约60%,表明该区域包含激活Bend4所需的增强子元件。然而,在第一个BENDR外显子中插入过早的多聚腺苷酸化信号消除了成熟BENDR转录本的转录,但对Bend4表达没有影响。这些结果表明,BENDR转录本对于Bend4激活不是必需的。相反,调节效应是由嵌入BENDR位点启动子区域内的DNA顺式调节元件介导的。
类似地,lncRNA HNF1A-AS1(也称为HASTER)的启动子作为调节元件控制相邻HNF1A基因的表达。HASTER启动子最初激活HNF1A转录,进而促进HNF1A-AS1表达。随后,HNF1A蛋白结合到HASTER启动子上,破坏增强子-启动子相互作用,建立一个限制HNF1A表达的负反馈回路。
这些情况强调了lncRNA的双重功能:DNA元件本身可以充当调节枢纽,而lncRNA转录本可以执行单独的角色。实验策略应旨在剖析基因组位点、转录行为和RNA产物的各自贡献。
3.1.6 增强子相关的LncRNA
增强子相关的lncRNA主要分为两类:增强子RNA(eRNA),它们是双向转录、未剪接、缺乏多聚腺苷酸化的转录本,被核外泌体迅速降解;和增强子相关的长基因间ncRNA(elincRNA),它们更稳定、单向转录、经过剪接,并具有独特的染色质特征(H3K4me1和H3K27ac)。
增强子是介导远端调节元件和启动子之间染色质环化的结构锚点。已知eRNA积极调节这一过程,引导组蛋白修饰复合物,结合特定的TF,甚至形成影响染色质动力学的R-loop。ERNA表达水平与增强子活性相关,证据表明elincRNA剪接在增强子介导的调节中发挥积极作用。尽管它们具有功能相似性,但增强子衍生的RNA表现出不同的分子特征。目前的文献经常互换使用术语eRNA和elincRNA,掩盖了稳定性加工方面的生化差异是反映了不同的功能类别还是代表了增强子相关转录本的连续体。
重要的研究来自超级增强子(SE):大型(10-60 kb)调节枢纽,包含聚集的增强子元件、丰富的TF、中介复合物和特征性的组蛋白标记。SE衍生的lncRNA通过调节长距离相互作用中的三维染色质结构,驱动彼此相关并与复杂表型相关的多个基因的表达,强调了它们在基因组组织中的重要性。
3.2 细胞质LncRNA
LncRNA通过核孔以5'-先行的方始被输出到胞质溶胶中。这种输出机制得益于它们类似于mRNA的结构特征。在胞质中,lncRNA经历特定的但仍知之甚少的分类机制,将其递送到不同的亚细胞区室,在那里它们充当mRNA稳定性调节剂、翻译机器调节剂、分子诱饵或信号通路组分(图2)。
3.2.1 mRNA稳定性和翻译调节
LncRNA通过Staufen1(STAU1)介导的mRNA衰变途径发挥转录后加工作用。STAU1是一种RBP,可识别lncRNA-mRNA双链体,其中每种RNA贡献一半的STAU1结合域——称为半STAU1结合位点RNA(?-sbs RNA)——通常由Alu重复序列形成。在双链体中,STAU1结合并招募UPF2,导致UPF1解旋酶活性发挥和mRNA降解。TINCR通过结合多个mRNA调节组织分化、增殖和凋亡,证明了这一机制。
LncRNA通常通过相互作用与RBP来增强基因表达,从而稳定mRNA。例如,FAM83-AS1将Fibrillarin招募到FAM83 mRNA,保护其免于降解,而SNHG16促进EIF4A3与RhoU mRNA的结合,增强其稳定性。此外,lncRNA可以通过阻断靶mRNA上的miRNA反应元件(MRE)来防止miRNA介导的降解。一个例子是GSTu1-AS1,它与相应的mRNA形成双链体,保护其免受miR-8525-5p的降解。
LncRNA在翻译水平上调节基因表达。例如,lincRNA-p21通过结合其转录本(包括5'和3' UTR)的多个区域来抑制β-catenin和JUNB翻译。LincRNA-p21形成一个复合物,招募翻译抑制因子RCK,导致核糖体脱落并抑制蛋白质合成,在骨骼肌分化期间的LncMyoD也报道了类似的作用。
3.2.2 竞争性内源RNA
竞争性内源RNA(ceRNA)是具有多个MRE的lncRNA,与mRNA中存在的MRE相同。CeRNA利用这些MRE来隔离(或“吸附”)miRNA,从而允许原始mRNA靶标的主动翻译。这是lncRNA在多种生物学过程中施加的最受研究的调节机制之一——主要与健康问题相关——例如:不同类型的癌症、神经退行性疾病和自身免疫性疾病。这种机制允许通过共同靶标在编码和非编码转录组之间共享双向调节网络,使其成为整合表达分析的坚实基础。
4 LncRNAs在发育和变态发育中的作用
脊椎动物共享一个发育计划,始于两个成熟生殖细胞的融合,形成一个全能受精卵,分化为多能干细胞(PSC),后者将形成整个生物体。一小部分进化上保守的lncRNA在原肠胚形成中发挥重要作用,而物种特异性的lncRNA倾向于在较晚的发
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号