《Journal of High Energy Astrophysics》:Benchmarking metabarcoding and metagenomics pipelines in taxonomic profiling for soil microbial eukaryotes
任银才|沈玉杰|刘志银|王思琪|郭帆|王轩|李红梅|薛青
中国南京农业大学农业与林业生物安全国家重点实验室,南京 210095
摘要
宏基因组学和宏条形码技术已成为解析细菌多样性的强大工具,但尚未广泛应用于真核生物的研究。目前为宏基因组分析开发的许多生物信息学工具主要针对原核生物设计,因此需要在真核生物中进行验证。因此,目前对真核微生物的分类分析主要依赖于基于18S rRNA的宏条形码技术。尽管已经建立了针对原核生物的丰度校正方法,但针对真核生物的类似方法仍然有限。本研究使用两个模拟数据集(一个包含不同门类的微生物群落,另一个为线虫群落)对三种宏基因组分类方法(基于读段的方法、基于18S rRNA的方法和基于蛋白质的方法)与形态学方法和宏条形码方法进行了对比。结果表明,在分类到目级别时,基于18S rRNA的宏基因组学方法优于其他分类方法。此外,通过18S rRNA基因拷贝数校正可以显著提高群落丰度估计的准确性,在线虫模拟数据集中,针对样本特异性的校正方法优于针对物种特异性的方法。我们还发现,通过纤维素酶、果胶裂解酶和邻氨基苯甲酸甲酯酶等标志基因可以区分海洋和土壤微生物群落,这表明蛋白质组成是预测微生物群落功能的一种有前景的方法。总体而言,本研究评估了用于真核生物分类分析和丰度估计的流程,为基于基因功能而非分类学归属的土壤生态系统功能分析提供了新的解决方案。
部分内容
背景
真核微生物,也称为显微真核生物或微真核生物,是只有在显微镜下才能观察到的真核生物。它们是土壤生态系统中的丰富且多样的组成部分,被认为是生物多样性隐藏世界的一部分(Moreira和López-García,2002;Lentendu等人,2013;Bik等人,2012)。研究这类生物的主要挑战在于它们的体积微小,肉眼无法观察到。物种鉴定
模拟群落和宏基因组测序
为了验证不同的分类分析方法,构建了两个模拟群落:MicroEuk6(包含六个真核门类,详细信息见表S1)和NemaCom35(包含35种线虫,详细信息见表S2)。对于MicroEuk6,使用Qiagen公司的REPLI-g单细胞试剂盒(德国Hilden)进行了全基因组扩增。为了测试数据生成的影响,使用不同的文库构建方法和测序平台对MicroEuk6进行了测序。
宏基因组学准确注释真核微生物群落
使用包含六个门类的真核微生物模拟群落MicroEuk6,在不同的分类分辨率水平(门、纲、目)上,评估了基于18S rRNA的宏条形码技术和鸟枪法宏基因组分析方法的分类注释性能。在门级别,方法2、3B和4能够识别MicroEuk6中的所有六个门类,而方法3A和3C仅识别出五个门类,方法1识别出的门类最少,为四个(图2A)。在目级别,方法2和3B能够识别出所有九个门类
宏基因组学有助于更好的分类分析
随着近几十年来微生物组宏基因组学的快速发展,通过宏基因组学进行物种鉴定已成为可能。已经开发了多种工具,利用基因组标记(Ye等人,2019)、全基因组(Parks等人,2022)或部分rRNA基因(Lu等人,2020;Gruber-Vodicka等人,2020;Chakoory等人,2022;Ruscheweyh等人,2021)进行鉴定。不幸的是,这些工具主要针对原核微生物组设计。Latz等人(2022)使用了基于18S rRNA的宏基因组学方法
CRediT作者贡献声明
任银才:撰写初稿、开展研究、进行正式分析。沈玉杰:开展研究。刘志银:制定方法论、开展研究。王思琪:开展研究。郭帆:制定方法论、开展研究。王轩:提供监督指导。李红梅:提供监督指导、资源支持。薛青:撰写稿件、进行审稿和编辑、提供监督指导、争取资金支持、构思研究框架
未引用的参考文献
Crampton-Platt等人,2016;de Mesquita等人,2024;Delmont等人,2022;Gendron等人,2023;Gurevich等人,2013;Hebert和Gregory,2005;Karst等人,2018;Levy Karin等人,2020;Li和Durbin,2009;Liu等人,2021;Rognes等人,2016;Saraiva等人,2023。
数据和材料的获取
本研究的原始序列数据已存放在NCBI的BioProject中,项目编号分别为PRJNA1124229和PRJNA1248141。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
致谢
本工作得到了中国国家重点研发计划(2023YFD1401000)和中国国家科技基础资源调查计划(2024FY100400)的支持。