从泌尿系统和人工水源环境中分离出的铜绿假单胞菌(Pseudomonas aeruginosa)克隆株C8277、PT31M和SG50M的完整基因组序列
《Microbiology Resource Announcements》:Complete genome sequences of Pseudomonas aeruginosa clone C strains 8277, PT31M, and SG50M isolated from the urinary tract and anthropogenic water environments
【字体:
大
中
小
】
时间:2026年03月17日
来源:Microbiology Resource Announcements 0.6
编辑推荐:
本研究揭示了三个Pseudomonas aeruginosa克隆C菌株(8277、PT31M、SG50M)的全基因组特征,涵盖尿路、饮用水和泳池水环境来源,基因组呈现单圆染色体结构且整合tLST和pKLC102,为比较基因组学研究提供新资源。
摘要 我们报告了三种铜绿假单胞菌(Pseudomonas aeruginosa )克隆C菌株的完整基因组序列:8277(来自泌尿道)、PT31M(来自饮用水)和SG50M(来自游泳池)。这些基因组扩展了现有的参考菌株范围,不再仅限于囊性纤维化分离株,从而能够研究克隆C的生态适应性、病原多样性及其在全球范围内的传播情况。
公告 铜绿假单胞菌(
Pseudomonas aeruginosa )是一种机会性病原体,可引起多种感染,包括囊性纤维化患者的慢性肺部感染(
1 )。除了其临床意义外,该菌还在多种自然和人为形成的水环境中繁衍生息,如河流、饮用水和游泳池(
2 )。其中最广泛分布的克隆C在全球的水生栖息地中都能找到,并能引发急性和慢性感染(
3 – 5 )。克隆C的成功与其携带的应激耐受性(tLST)相关,这些基因位点包含分子伴侣蛋白,如ClpG
GI 解聚酶和小热休克蛋白(sHsp20
GI )(
4 ,
6 ,
7 )(
图1A )。虽然之前已有研究记录了克隆C菌株的基因组可塑性,但完整的基因组序列主要集中在囊性纤维化肺部分离株上,只有少数环境来源的菌株得到了研究(
8 – 11 )。
图片(mra.01240-25.f001.tif)缺失或无效。 图1 铜绿假单胞菌克隆C菌株8277、PT31M和SG50M的基因组结构,以及tLST位点。(A )三个克隆C菌株的tLST图谱显示了该位点上基因顺序的保守性。(B )全基因组图谱显示了GC含量分布(用黑色表示)和预测的基因组岛(用红色表示)。tLST位点和与基因组岛相关的pKLC102的位置分别用蓝色和绿色标示。基因组图谱及GC含量分布由Proksee软件生成(12 )。为了克服这一偏见,我们获得了三种之前仅通过脉冲场凝胶电泳或部分测序得到描述的克隆C菌株的完整基因组序列。菌株8277来自英国达勒姆的泌尿道(
4 ,
13 ,
14 ),代表了非呼吸道感染中的完整基因组。菌株SG50M(来自游泳池水)和PT31M(来自德国米尔海姆-安-德尔-鲁尔的人为水环境)(
4 )。在这项研究之前,NCBI中仅有关于PT31M的部分基因组测序数据,登录号为
NZ_NSSQ00000000 。这些分离株丰富了克隆C的生态和临床多样性,使得可以对比分析呼吸道感染与泌尿道感染,以及自然水系与人为水系中的克隆C。
基因组DNA是从在37°C下振荡培养过夜的LB培养基中的细胞中提取的,然后使用AccuPrep Genomic DNA Extraction Kit(Bioneer,目录号K-3032)进行纯化。全基因组测序使用了PacBio SMRT Sequel和Illumina NovaSeq 6000平台;PacBio文库是从剪切后的7–10 kb大小选定的DNA制备的,而Illumina文库则是通过随机片段化和接头连接生成的,用于配对末端151 bp(PE151)测序。Illumina的读段被映射到初始的PacBio组装结果中,以识别和纠正剩余的测序错误。
De novo 组装使用CANU(v1.7)或SMRT(v8.0)完成,并通过Pilon(v1.21)进行优化(
15 ,
16 )。基因组注释由NCBI的PGAP管道(v6.10)完成(
17 )。
菌株8277、PT31M和SG50M的完整基因组被组装成单一的环状染色体,这一点通过末端序列重叠得到确认,且未检测到质粒(
表1 ,
图1B )。基因组大小在6.75到6.90 Mb之间,平均G+C含量为66.7%,包含6,156–6,318个预测的编码序列。每个菌株都携带由IslandViewer四软件使用DIMOB方法预测的基因组岛中的tLST位点(
4 ,
6 ,
7 ,
18 )。此外,通常在克隆C菌株中发现的质粒pKLC102被确定为整合到了染色体中,并带有移动元件。
表1 铜绿假单胞菌克隆C菌株PT31M、SG50M和8277的基因组测序、组装和注释统计信息菌株 PT31M SG50M 8277 染色体特征 ? ? ? 总序列长度(bp) 6,908,713 6,754,410 6,897,720 序列数量 1 1 66.2 N50 6,908,713 6,754,410 6,897,720 GC含量(%) 66.1 66.2 66.2 深度 86.5 88.4 126.1 基因组注释 ? ? ? CDS数量 6,298 6,156 6,318 rRNA数量 12 12 12 tRNA数量 74 75 75 PacBio测序 ? ? ? 子读段数量 86,070 87,695 127,076 子读段总碱基数 697,625,891 697,910,834 1,010,030,729 平均读段长度(bp) 8,105 7,958 7,948 N50 10,675 10,703 10,481 覆盖率(×) 101 103 146 Illumina测序 ? ? ? 原始数据集 ? ? ? 总读段碱基数(bp) 3,126,617,778 3,175,056,766 2,914,658,474 总读段数 20,706,078 21,026,866 19,302,374 GC含量(%) 66.26 67.1 66.83 过滤后的数据集 ? ? ? 总读段碱基数(bp) 1,754,529,912 1,803,894,982 1,774,329,278 总读段数 11,623,572 11,951,988 11,754,716 GC含量(%) 66.22 67.06 67 映射读段 11,622,353 11,951,969 11,754,716 覆盖率(%) 100 100 100 深度 242.07 253.18 242.62
这三个基因组不仅扩展了克隆C的生态和临床范围,还揭示了tLST之外的共享和差异性基因组岛。这些差异为解析克隆C的生态特异性适应性和全球传播提供了依据。
致谢 Changhan Lee获得了韩国国家研究基金会(NRF)的资助,该基金会由韩国政府(MSIT)支持(项目编号RS-2024-00452071、RS-2025-02313052),以及韩国国家研究基金会针对硕士/博士生和博士后(LAMP)项目的资助,该项目由教育部提供(项目编号RS-2023-00285390)。Ute R?mling获得了瑞典医学与健康研究委员会(K2012-56X-22034-01-3)的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号