从Aloe barbadensis Miller中分离出的一种内生细菌Enterobacter sp. I4的基因组序列草图

【字体: 时间:2026年03月14日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  基因组测序显示从健康芦荟组织中分离的Enterobacter sp. I4菌株具有4.7Mb高质量基因组(56.5% GC),包含4339个蛋白编码基因。通过PacBio测序和GS De Novo组装,鉴定出6个次级代谢产物基因簇(包括NRPS-like、RRE-containing RiPP等),为研究内生菌-宿主互作及代谢多样性提供新资源。

  

摘要

我们报告了从健康的Aloe barbadensis Miller叶片和茎中分离出的内生细菌Enterobacter sp. I4的基因组序列草图。该基因组大小为4.7 Mb(GC含量为56.5%),由三个contig组成,编码4,339个蛋白质编码基因,为研究内生菌-宿主相互作用和次级代谢提供了基因组资源。

公告

内生菌是一类能够在植物内部组织中定殖而不引起疾病的微生物,在植物健康、应激适应和代谢多样性方面发挥着重要作用(15)。内生菌产生的代谢产物为直接采集植物提供了可持续的替代方案,并且在抗生素耐药性日益严重的背景下,成为药物发现中尚未充分探索的抗菌化合物来源(1, 2, 57)。我们介绍了来自Aloe vera的内生菌Enterobacter sp. I4的基因组序列草图及其生态学特性和代谢潜力。
A. barbadensis于2021年3月在南非林波波省Apel村(南纬24° 24′ 0″,东经29° 44′ 0″)采集,并用无菌聚乙烯袋装在冰块上运送到实验室。在彻底清洗后,使用5% Tween 20处理、70%乙醇和1.5%次氯酸钠进行表面消毒并冲洗五次,从PBS匀浆的叶片和茎段中分离出内生菌(2, 3)。内生菌在30°C的营养琼脂上培养5天。随后通过Zymo Research Fungal/Bacterial DNA MiniPrep Kit(美国)从24小时营养肉汤培养物中提取高分子量基因组DNA。使用NanoDrop ND-2000分光光度计(Thermo Fisher Scientific,美国)评估DNA浓度和纯度。全基因组测序由Inqaba Biotechnical使用Pacific Biosciences的Revio系统通过PacBio SMRT技术完成。SMRTbell文库由服务提供商根据制造商的协议使用PacBio SMRTbell Express Template Prep Kit 2.0制备。高分子量基因组DNA被机械剪切至约15 kb的目标插入长度,并在文库制备过程中使用AMPure PB珠纯化技术进行片段大小筛选。使用SMRT Link应用程序和标准PacBio协议生成HiFi circular consensus sequence(CCS)读段。在SMRT Link(v10.1)流程中生成CCS读段之前,自动识别并移除了接头序列。使用SMRT Link运行摘要和默认参数生成的CCS质量报告评估了HiFi读段长度和读段质量。共生成了9,614个HiFi读段,包含65.9 Mb的序列数据。使用GS De Novo Assembler(DEC-2021)进行de novo基因组组装。使用Arrow算法(SMRT Link V10.1)对组装后的基因组进行优化以提高一致性。基因组注释使用NCBI Prokaryotic Genome Annotation Pipeline(PGAP,v6.7)完成。除非另有说明,所有分析均使用默认参数进行,组装质量通过CheckM v1.2.2进行评估。平均核苷酸同一性(ANI)使用FastANI与从GenBank检索的代表性Enterobacter基因组进行比较,其中与Enterobacter hormaecheiGCA_019048245.1)的相似度最高,为91.44%;而E. bugandensisGCA_900324475.1)、E. moriGCA_022014715.1)、E. cloacaeGCA_019047105.1)和E. cancerogenusGCA_019047785.1)的相似度较低,≤88.94%。由于ANI值低于95%–96%的物种划分阈值,该分离株被归类为与E. hormaechei密切相关的Enterobacter sp.。使用antiSMASH v8.0预测次级代谢产物生物合成基因簇(表1),并与MIBiG数据库进行比较(8)。
表1
表1Enterobacter sp. I4的基因组组装和注释统计信息
参数
来源(日期)叶片和茎(2021年)
基因组大小(bp)4,718,120
GC含量(%)56.5
Contig数量(及其长度,bp)3个(分别为2,598,250、1,434,460和685,410 bp)
蛋白质编码基因(rRNA基因)4,339个(22个)
Scaffold N50(bp)2,598,250
基因组完整性(%)99.43
基因组污染(%)0.50
基因组覆盖度约25倍
GenBank预测的基因(tRNA基因)4,501个(78个)
antiSMASH(总BGCs)6个
主要类别NRPS类似铁载体、含RRE的RiPP、萜烯前体、含唑的RiPP和NRP金属载体(NRPS)
该基因组序列草图适用于比较基因组学、系统发育分析和探索与内生菌相关的功能特性。然而,由于组装仍处于contig阶段,复杂基因组区域的解析和完整质粒的重建可能受到限制。未来的工作应包括质粒的特征分析和可能的环化处理。

致谢

我们感谢约翰内斯堡大学研究委员会(项目编号075432)对本文发表的资助,以及Inqaba Biotec提供的测序服务。
特别感谢分子病原学和分子流行病学研究小组(MPMERG)的成员。
M.M.N.——负责形式分析、审稿和编辑、数据管理、方法学;A.G.O.——负责撰写初稿、验证、数据管理、方法学;E.G.——负责概念构思、监督、形式分析、审稿和编辑、资金支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号