
-
生物通官微
陪你抓住生命科技
跳动的脉搏
PAGD:美国橄榄(Persea americana)基因组数据库及基于Docker的转录组分析工作流程
《BMC Genomics》:PAGD: the Persea americana Genome Database and a Docker-based transcriptome analysis workflow
【字体: 大 中 小 】 时间:2026年06月02日 来源:BMC Genomics 3.7
编辑推荐:
摘要背景牛油果(Persea americana)是一种具有经济重要性的水果,其全球产量正在不断增加。尽管已经有多种基因组组装和转录组数据集可供公开使用,包括专门的平台AvoBase,但这些资源仍然分散且缺乏与预先计算的多组学分析及可重复工作流程的整合。结果我们推出了Persea
牛油果(Persea americana)是一种具有经济重要性的水果,其全球产量正在不断增加。尽管已经有多种基因组组装和转录组数据集可供公开使用,包括专门的平台AvoBase,但这些资源仍然分散且缺乏与预先计算的多组学分析及可重复工作流程的整合。
我们推出了Persea americana基因组数据库(PAGD;http://bioinfor.kib.ac.cn/),这是一个整合了两个高质量基因组组装(Hass染色体级别和西印度端粒到端粒级别)的综合性平台。该数据库还存储了来自13个NCBI BioProject的RNA-seq数据集,每个数据集都关联了详细的生物样本元数据,并且所有数据都经过了统一处理。预先计算的结果包括基因家族分类(68个TPS基因)、基因共线性、基因密度和表达谱。PAGD提供了BLAST、JBrowse、交互式热图以及数据下载功能。此外,我们还开发了三个封装在Docker中的Snakemake工作流程,用于基于参考序列和无参考序列的转录组分析,从而消除了手动配置软件的需要。
PAGD通过将多组学数据与预先计算的分析结果以及可重复的转录组工作流程相结合,提升了现有的牛油果基因组资源。这些封装的工作流程降低了RNA-seq分析的技术门槛,适用于其他植物物种,并支持功能基因组学、育种和比较研究。
牛油果(Persea americana)是一种具有经济重要性的水果,其全球产量正在不断增加。尽管已经有多种基因组组装和转录组数据集可供公开使用,包括专门的平台AvoBase,但这些资源仍然分散且缺乏与预先计算的多组学分析及可重复工作流程的整合。
我们推出了Persea americana基因组数据库(PAGD;http://bioinfor.kib.ac.cn/),这是一个整合了两个高质量基因组组装(Hass染色体级别和西印度端粒到端粒级别)的综合性平台。该数据库还存储了来自13个NCBI BioProject的RNA-seq数据集,每个数据集都关联了详细的生物样本元数据,并且所有数据都经过了统一处理。预先计算的结果包括基因家族分类(68个TPS基因)、基因共线性、基因密度和表达谱。PAGD提供了BLAST、JBrowse、交互式热图以及数据下载功能。此外,我们还开发了三个封装在Docker中的Snakemake工作流程,用于基于参考序列和无参考序列的转录组分析,从而消除了手动配置软件的需要。
PAGD通过将多组学数据与预先计算的分析结果以及可重复的转录组工作流程相结合,提升了现有的牛油果基因组资源。这些封装的工作流程降低了RNA-seq分析的技术门槛,适用于其他植物物种,并支持功能基因组学、育种和比较研究。