哺乳动物保守非编码RNA基因家族的拷贝数演化

《Mammalian Genome》:Copy number evolution of conserved noncoding RNA gene families across mammals

【字体: 时间:2026年05月24日 来源:Mammalian Genome 2.7

编辑推荐:

  非编码RNA(ncRNA)在哺乳动物基因调控中发挥重要作用,但其跨物种拷贝数演化特征尚不明确。研究人员利用Rfam数据库中高置信度的协变量模型(Covariate Models, CMs),采用统一的INFERNAL流程,系统预测了60种哺乳动物基因组中588

非编码RNA(ncRNA)在哺乳动物基因调控中发挥重要作用,但其跨物种拷贝数演化特征尚不明确。研究人员利用Rfam数据库中高置信度的协变量模型(Covariate Models, CMs),采用统一的INFERNAL流程,系统预测了60种哺乳动物基因组中588个经过严格筛选的保守ncRNA基因家族的拷贝数。系统发育相关性检验表明,ncRNA家族数量及总拷贝数的变异与基因组大小、支架数或组装完整性基本无关,提示谱系特异性进化过程而非基因组特征主导了ncRNA拷贝数多样性。CAFE分析推断真兽祖先发生了ncRNA拷贝数扩张爆发,主要涉及小核RNA(small nuclear RNA, snRNA)和H/ACA型小核仁RNA(small nucleolar RNA, snoRNA)家族。相反,系统发育信号(Pagel’s λ)和进化速率(σ2)估算显示,许多微RNA(microRNA, miRNA)家族表现出谱系特异性的拷贝数扩张。对高度可变ncRNA家族的分析进一步揭示其常与转座元件重叠,并呈现不同的复制策略,包括串联成簇(如mir-154和SNORA116)及分散分布伴随区域性串联复制(如5S_rRNA)。这些结果系统揭示了哺乳动物保守ncRNA家族的拷贝数变异格局,尽管个别预测拷贝可能包含假基因或转座元件来源的位点,但家族层面的进化模式稳健,为后续ncRNA复制与多样化研究奠定了基础。
该研究由研究人员发表于《Mammalian Genome》,针对非编码RNA(ncRNA)拷贝数演化在哺乳动物中缺乏系统性认识的问题,采用统一的结构感知预测框架,克服传统工具在不同ncRNA类别间数据不兼容的局限,构建了跨60种哺乳动物的保守ncRNA家族拷贝数数据集,解析其演化动态及机制。
研究人员选取来自17个目的60种哺乳动物染色体级基因组,涵盖单孔类、有袋类及真兽类,均来自NCBI RefSeq,并通过BUSCO评估确保组装完整性。关键技术包括:基于Rfam 15数据库筛选序列数≥10的高质量协变量模型(CMs),使用INFERNAL cmscan进行全基因组ncRNA预测,并应用E值、比对覆盖度等过滤标准;结合TimeTree构建时间校准的系统发育树,利用phytools进行系统发育相关性分析与Pagel’s λ、σ2估算;采用CAFE v5分析家族扩张收缩;利用Bedtools评估基因组坐标重叠,RepeatMasker注释转座元件,chromoMap可视化基因组分布。
Overview of predicted ncRNA families across 60 mammals
研究人员共预测到588个保守ncRNA家族,物种间家族数为314至573个,真兽类比非真兽类显著更多,灵长类尤为突出。总拷贝数差异巨大,从1748至55232不等,主要由少数家族的谱系特异性扩张驱动。系统发育相关性分析显示,ncRNA家族数与总拷贝数与基因组大小、支架数及BUSCO完整性无显著相关,仅累计长度与基因组大小呈弱正相关,表明拷贝数多样性主要受谱系特异性进化影响。
Expansions and contractions of putative ncRNA family copy numbers across the mammalian phylogeny
CAFE分析基于291个哺乳动物祖先存在的家族发现,真兽类的出生-死亡速率最高,祖先节点出现大规模扩张(62个家族扩张,19个收缩),而有袋类则多为收缩。在较高分类阶元上,H/ACA型snoRNA家族频繁发生显著拷贝数变化,而C/D型snoRNA几乎未出现显著变化。
Analysis of putative ncRNA family copy numbers
主成分分析将非真兽类与真兽类明显分开。Pagel’s λ与σ2分析识别出25个在所有物种中拷贝数恒定的家族,其中4个miRNA家族恒定为2拷贝。miRNA在低系统发育信号组中显著富集,提示其谱系特异性演化活跃;H/ACA型snoRNA的进化速率显著高于C/D型。
Analysis of ncRNA families with variable and high copy numbers across species
在进化速率最高且拷贝数多的10个家族中,SNORD116等家族在不同谱系独立复制,且多数与转座元件重叠。复制模式分为串联成簇(mir-154、SNORA116)与分散分布伴随局部串联复制(5S_rRNA)两类,后者在环尾狐猴基因组中形成数十至百拷贝的大片段重复区。
在讨论中,研究人员指出,尽管INFERNAL框架提高了跨物种注释的一致性,但检测敏感性仍偏向模式生物及其近缘类群,这可能低估非真兽类ncRNA多样性。真兽类祖先的snRNA与H/ACA snoRNA扩张可能与核心RNA加工功能相关,而miRNA的谱系特异性扩张则可能推动调控创新。不同复制模式反映了不等交换、片段复制及转座介导等多种机制的共同作用。研究结论认为,哺乳动物保守ncRNA家族拷贝数演化呈现多样化轨迹,既有强约束的单拷贝家族,也有谱系特异性扩张的多拷贝家族,这些动态变化可能在塑造谱系特异性调控网络中发挥关键作用,为未来功能与演化研究提供了基础资源。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号