《New Phytologist》:Small RNAs regulation and genomic harmony: insights into allopolyploid evolution in marsh orchids (Dactylorhiza)
编辑推荐:
本文系统研究了沼泽兰属(Dactylorhiza)异源多倍体中小RNA(smRNA)的调控网络,发现尽管独立起源,两种异源四倍体D. majalis和D. traunsteineri在smRNA组成上存在显著趋同。研究揭示了24 nt smRNA更倾向于靶向转座子(TE)富集的父本基因组,而较短smRNA(20-23 nt)则表现出更强的物种特异性调控模式。这些发现为理解多倍体进化中基因组稳定性维持和生态适应性分化提供了新视角。
研究背景与意义
杂交和多倍化是植物多样化的主要驱动力,常伴随基因表达和基因组组成的变化。小非编码RNA(smRNA)被认为是影响这种基因组变化的关键介质,特别是通过其与转座子(TE)的相互作用。尽管对smRNA在多倍体进化中的作用日益关注,但大多数研究集中在合成或早期多倍体上。本研究聚焦两个生态差异显著、已建立的姐妹异源四倍体兰花Dactylorhiza majalis和D. traunsteineri及其二倍体亲本,探讨异源多倍化后smRNA的长期命运和潜在作用。
材料与方法
研究样本包括每个目标物种的成年个体,从欧洲多个地点移植到奥地利维也纳的共同花园。最终采样包括每个二倍体(D. incarnata和D. fuchsii)的四个个体,以及每个异源四倍体(D. majalis和D. traunsteineri)的9个和12个个体。小RNA提取、文库制备和测序如前所述。使用mirVana miRNA分离试剂盒进行smRNA分离,并通过15% TBE-尿素预制凝胶进行凝胶大小选择。小RNA文库使用NEBNext多重小RNA文库制备试剂盒制备。
读数使用CLC Genomics Workbench进行接头修剪、大小选择(20-24 nt范围)和质量过滤。过滤后的读数使用STAR映射到D. incarnata参考基因组。采用无注释方法识别可能被smRNA"靶向"的基因组区域,定义为显示与smRNA序列同源性的区域。使用deepTools2评估每个个体基因组中非重叠100 bp窗口的smRNA读数覆盖度。
研究结果
smRNA及其基因组靶标
测序平均每个样本产生1350万条读数。经过大小选择和质量过滤后,平均保留580万条20-24 nt的读数。平均83.1%的读数映射到D. incarnata参考基因组,各物种间没有明显的映射偏差。读数长度分布符合smRNA的预期特征,所有物种在21-22 nt和24 nt处都有峰值。
D. fuchsii的20-22 nt smRNA的CPM高于D. incarnata,而23-24 nt smRNA则在D. incarnata中更丰富。两个异源四倍体彼此之间比二倍体更相似。对于21 nt smRNA,两个异源四倍体都显示出显著高于父本物种但显著低于母本物种的CPM。大部分20-22 nt smRNA映射到外显子区域,而24 nt smRNA主要映射到TE和基因间区域。
生态分化异源四倍体中的smRNA模式
比较两个姐妹异源四倍体,保留了152,503个通过CPM阈值的靶区域。在D. traunsteineri和D. majalis之间识别出2106个差异靶向区域,其中约一半与基因相关。大多数基因相关的差异靶向区域位于内含子内。在所有基因类别中,较老的异源四倍体D. majalis显示出的smRNA靶向区域数量约是D. traunsteineri的三倍。
差异靶向区域与先前从同一实验鉴别的差异表达基因比较显示,大多数与差异靶向区域重叠的基因在两个异源四倍体之间没有显示差异表达,这与潜在的转录后效应或选择性剪接一致,而不是直接转录调控。
smRNA靶向和基因组相互作用
进一步比较每个异源四倍体与亲本二倍体的20-24 nt smRNA模式。过滤后保留了212,434个靶区域。两个异源四倍体相对于二倍体显示出大致相似的靶向模式,尽管较年轻的D. traunsteineri比D. majalis表现出更大的差异。异源四倍体与母本亲本(D. fuchsii)的差异大于与父本D. incarnata的差异。
差异靶向区域被分类为四种相互作用类型:加性、越亲性和对任一亲本的显性。大多数靶区域相对于两个二倍体没有变化。在差异靶向区域中,非加性模式占主导,显性最为频繁,特别是对D. incarnata的显性。值得注意的是,在缺乏注释TE的基因间区域,与其他基因组环境相比,显示对D. fuchsii显性的smRNA靶区域比例更高。
在越亲靶向区域中,两个异源四倍体最常显示出相对于两个二倍体更高的smRNA靶向。跨相互作用类型的一个显著普遍模式是,尽管姐妹异源四倍体独立起源,但大部分差异靶向区域在它们之间共享。
smRNA与TE的关联
对于TE重点分析,读数分为24 nt smRNA(可能是异染色质siRNA,因此预期更频繁地与TE关联)和20-23 nt smRNA。经过CPM过滤后,对于D. majalis与D. traunsteineri的比较分析,24 nt靶区域比20-23 nt的更多通过阈值。然而,差异靶向分析显示了相反的趋势:20-23 nt smRNA识别出3242个差异靶向区域,而24 nt smRNA只有103个,表明异源多倍体中异染色质siRNA对TE的靶向一致。
与基因靶标类似,差异靶向区域被分类为加性、越亲性和对任一亲本的显性。在两个数据集中,发现大量差异靶向区域在相互作用类别中在D. majalis和D. traunsteineri之间共享。显性模式再次占主导,显示对任一亲本显性的靶区域比加性或越亲模式更多。对于20-23 nt smRNA,略多的靶区域显示对靶向较低的亲本显性,而对于24 nt smRNA,观察到相反的趋势。
讨论
一致倾向于父本较大基因组的显性
我们的结果揭示了与父本较大亚基因组一致的smRNA靶向的一致显性,特别是对于TE相关的24 nt smRNA。这种模式在两个姐妹异源四倍体中都观察到,并导致它们之间差异靶向区域数量相对较少。鉴于D. incarnata比D. fuchsii具有更大的基因组和更高的TE负载,我们的发现与先前报告一致,表明smRNA介导的沉默优先靶向TE丰富的亚基因组。
24 nt和20-23 nt smRNA对TE的不同靶向
正如预期,24 nt smRNA(通常是异染色质siRNA)与TE强烈相关,特别是LTR反转录转座子。令人惊讶的是,异源四倍体之间24 nt smRNA的差异靶向区域数量较低,表明TE沉默在这些独立进化谱系中以相对一致的方式进行。相比之下,20-23 nt smRNA在姐妹异源多倍体之间表现出明显更大的差异,与更动态、谱系特异性调控作用一致。
基因smRNA靶向和可能的调控意义
多倍体形成引入了减数分裂/有丝分裂挑战和广泛的遗传冗余。同源和部分同源染色体之间的准确区分对于确保正确的减数分裂分离至关重要。同时,异源多倍体通常经历遗传二倍化,其中一些冗余或错误调控的基因拷贝可能随时间被沉默或功能丧失。
除了沉默TE外,smRNA(特别是21-22 nt类别)通过转录后基因沉默或转录基因沉默调控基因表达。我们观察到广泛的基因smRNA靶向,特别是在外显子和基因模型上游1 kb(推定的启动子)中,21 nt smRNA贡献最大。虽然这种靶向可能介导转录物降解、选择性剪接或顺式沉默,但一些关联也可能没有功能后果。然而,这些模式可以反映早期二倍化过程中的调控调整。
结论与未来方向
本研究强调了smRNA在异源多倍体中与基因组特征的双重关联——既与TE也与基因区域——反映了它们在基因组调控中的潜在作用。尽管有共享的祖先,D. majalis和D. traunsteineri在smRNA活性上表现出清晰的谱系特异性模式,特别是在基因区域,表明异源多倍化后不同的调控轨迹。鉴于其快速作用、多样性和调控可塑性,smRNA可能在异源多倍体的早期和长期基因组重组中发挥核心作用。我们的结果支持一个模型,其中smRNA在基因组合并后介导即时稳定和长期功能分化。未来的工作应将smRNA表达谱与部分同源特异性参考基因组和DNA甲基化景观整合。这些方法将为亚基因组特异性调控、smRNA-靶标相互作用的动力学以及天然异源多倍体中smRNA介导的基因和TE调控的进化后果提供更深入的见解。