今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

评估参考基因组选择对分类学分析准确性的影响

《BMC Genomics》:Benchmarking the impact of reference genome selection on taxonomic profiling accuracy

【字体: 大 中 小 】 时间:2026年05月23日 来源:BMC Genomics 3.7

编辑推荐:

  摘要背景在过去的几十年里,基因组数据库呈指数级增长,经常在同一分类水平上包含高度相似的基因组。这种冗余性可能会阻碍分类工作,导致难以区分密切相关的序列,并增加计算需求。虽然一些新的分类工具通过选择一部分基因组作为参考来应对这种冗余性,但关于不同参考基因组选择方法对各种分类工具影响

  

摘要

背景

在过去的几十年里,基因组数据库呈指数级增长,经常在同一分类水平上包含高度相似的基因组。这种冗余性可能会阻碍分类工作,导致难以区分密切相关的序列,并增加计算需求。虽然一些新的分类工具通过选择一部分基因组作为参考来应对这种冗余性,但关于不同参考基因组选择方法对各种分类工具影响的了解仍然不足。

结果

我们使用模拟的宏基因组样本和一个细菌模拟群落,系统地评估了基因组选择和去重复方法在细菌和病毒数据集上的效果。对于细菌物种级别的分析,包含所有可用基因组通常可以获得最高的准确性,同时对计算资源的使用影响有限。相比之下,在高度相似的细菌菌株级别和SARS-CoV-2谱系级别数据集中,我们发现选择某些基因组可以显著提高丰度估计的准确性。结合基于位置的元数据可以通过优先考虑局部相关的基因组来进一步提高病毒分析的性能。在病毒实验中,较小的参考基因组集合显著减少了索引和分析过程中的内存和运行时间需求,尽管这会增加额外的预处理成本。

结论

参考基因组的选择会影响分类分析的准确性和计算效率,但其好处似乎取决于具体情境和分辨率。我们的结果表明,参考基因组集的设计并没有一种通用的解决方案,选择策略应根据生物学和计算环境进行调整。

背景

在过去的几十年里,基因组数据库呈指数级增长,经常在同一分类水平上包含高度相似的基因组。这种冗余性可能会阻碍分类工作,导致难以区分密切相关的序列,并增加计算需求。虽然一些新的分类工具通过选择一部分基因组作为参考来应对这种冗余性,但关于不同参考基因组选择方法对各种分类工具影响的了解仍然不足。

结果

我们使用模拟的宏基因组样本和一个细菌模拟群落,系统地评估了基因组选择和去重复方法在细菌和病毒数据集上的效果。对于细菌物种级别的分析,包含所有可用基因组通常可以获得最高的准确性,同时对计算资源的使用影响有限。相比之下,在高度相似的细菌菌株级别和SARS-CoV-2谱系级别数据集中,我们发现选择某些基因组可以显著提高丰度估计的准确性。结合基于位置的元数据可以通过优先考虑局部相关的基因组来进一步提高病毒分析的性能。在病毒实验中,较小的参考基因组集合显著减少了索引和分析过程中的内存和运行时间需求,尽管这会增加额外的预处理成本。

结论

参考基因组的选择会影响分类分析的准确性和计算效率,但其好处似乎取决于具体情境和分辨率。我们的结果表明,参考基因组集的设计并没有一种通用的解决方案,选择策略应根据生物学和计算环境进行调整。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:病毒基因组|宏基因组数据库|参考选择策略|分类准确性|评估饱和度|计算效率 对于不同分类水平的分析策略差异。

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号