quota_Anchor:一种全基因组复制与链特异性共线性基因识别工具及其在植物比较基因组学中的应用

《aBIOTECH》:quota_Anchor: a strand and whole genome duplication–aware collinear gene identification tool

【字体: 时间:2026年01月28日 来源:aBIOTECH 5.1

编辑推荐:

  本研究针对不同物种全基因组复制(WGD)事件频率差异对共线性分析工具提出的特定技术要求,开发了quota_Anchor工具。该工具在搜索共线性区块时严格控制相邻基因对的比对深度和方向性,能够准确定位WGD事件并基于不同基因复制模式对同源基因进行分类。研究发现相对倒置基因对的表达模式相似性低于非相对倒置基因对,且WGD来源基因更多参与植物生长发育过程,而串联复制和近端复制基因则富集于胁迫响应功能。该工具为比较基因组学研究提供了强大支持。

  
在植物进化历程中,全基因组复制(Whole-genome duplication, WGD)事件频繁发生,这些事件深刻影响了植物基因组的结构和功能演化。然而,不同物种间WGD历史的显著差异对共线性分析工具提出了特殊要求。传统工具如quota_align、WGDI和SOI等在识别正交同源共线性区块时,往往难以严格控制比对深度,需要研究人员手动筛选符合预期WGD历史的基因对,这一过程既繁琐又容易引入主观误差。此外,现有工具大多忽视链特异性信息,对共线性区块内相对倒置基因对与非相对倒置基因对的功能差异研究不足。
为应对这些挑战,西北农林科技大学农学院的李小东等人开发了quota_Anchor——一款兼具链特异性和WGD感知能力的共线性基因识别工具。该研究成果发表于《aBIOTECH》期刊,为植物比较基因组学研究提供了新的解决方案。
研究人员采用的主要技术方法包括:基于最长路径算法的动态编程共线性识别、链特异性共线性区块搜索、Ks值计算与高斯混合模型分析、以及基于OrthoFinder的直系同源基因簇分析。研究使用了27个禾本科植物物种及外群物种Joinvillea ascendens的基因组数据,通过转录组数据(TPM)进行表达模式相关性分析。
2.1. quota_Anchor工具概述
quota_Anchor包含三大工作流程:识别共线性基因对时严格控制比对深度和相邻基因对方向性;基于链特异性共线性基因对定位WGD事件相对于物种分化事件的位置;分类不同类型的基因复制模式。该工具采用有向无环图算法中的最长路径算法来识别链特异性共线性基因,并能根据WGD事件调整比对深度。
2.2. 全基因组复制感知的共线性基因识别
与quota_align、WGDI和SOI等工具相比,quota_Anchor在玉米与高粱的比对中严格遵循2:1的比对深度,无需用户手动过滤不符合比对深度标准的共线性基因对。特别值得关注的是,quota_Anchor通过优化算法避免了因max_gap_size参数设置而遗漏较短共线性区块的问题,在玉米与高粱比较中额外识别出两个高质量共线性区块。
2.3. 非相对倒置共线性基因表达模式更保守
研究发现,物种分化产生的共线性正交同源基因对的表达模式最为相似,其次是古共线性基因对,非共线性基因对的表达模式相似性最低。更重要的是,在共线性正交同源基因对中,非相对倒置基因对的表达模式比相对倒置基因对更为保守,这一发现为理解基因方向变化对功能的影响提供了新视角。
2.4. 相对倒置基因经历更强纯化选择
通过计算27个禾本科物种与外群Joinvillea ascendens的共线性比对,发现相对倒置基因对具有较低的Ka/Ks值,表明它们经历了更强的纯化选择。这些基因可能在生物体生存中扮演关键角色,因而在进化过程中保持高度保守。
2.5. 基于链特异性共线性基因对定位WGD事件
以茶树(Camellia sinensis)为例,研究人员展示了quota_Anchor定位WGD事件相对于物种分化事件的能力。茶树经历了两次WGD事件:核心真双子叶植物全基因组三倍化-γ事件和PPC事件。通过分析Ks值,成功确定了最近一次WGD事件在物种分化历史中的相对位置,结果与先前研究一致。
2.6. 使用quota_Anchor分类基因复制模式
研究团队基于共线性算法改进了DupGen_finder的分类标准,开发了基因复制模式分类模块。与DupGen_finder相比,quota_Anchor在非唯一模式下允许WGD、串联和近端相关基因之间的重叠,减少了分散基因对的假阳性率,并恢复了之前被遗漏的蛋白质编码单例基因。
2.7. 禾本科植物中串联复制、近端复制和WGD基因的功能特征
对27个禾本科物种的分析表明,高倍性物种比低倍性物种含有更多WGD基因,但串联复制和近端复制基因的数量在不同倍性物种间无显著差异。GO富集分析显示,WGD基因主要参与植物生长发育、碳水化合物代谢和氮代谢等过程,而串联复制和近端复制基因则主要富集于非生物胁迫响应、氧化还原调节和种子发育等功能。
讨论部分指出,quota_Anchor在正交同源共线性推断方面的表现与现有工具相当,但其独特优势在于能够基于物种特异性WGD历史严格控制比对深度。工具的有效性依赖于高质量的基因组组装和注释,随着长读长测序技术的发展,更多高质量基因组的出现将极大促进基因组共线性研究。
该研究的重要意义在于开发了一款能够严格控制比对深度的共线性分析工具,解决了现有工具在应对复杂WGD历史时的技术瓶颈。quota_Anchor不仅能准确识别正交同源共线性区块,还能用于基因复制模式分类和WGD事件定位,为植物比较基因组学、进化生物学和功能基因组学研究提供了强有力的技术支持。特别是对链特异性共线性基因对的深入研究,为理解基因方向变化与功能演化之间的关系提供了新的分析视角和方法基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号