从爱尔兰土壤中分离出的酵母菌Candida solani UCD2211的基因组序列
《Microbiology Resource Announcements》:Genome sequence of the yeast Candida solani UCD2211 isolated from soil in Ireland
【字体:
大
中
小
】
时间:2026年02月10日
来源:Microbiology Resource Announcements 0.6
编辑推荐:
Candida solani菌株UCD2211基因组测序完成,包含6条核染色体(总长12.63 Mb)和线粒体基因组(38,626 bp)。与NRRL Y-2224和UCD1087基因组相比存在相互易位和倒位差异,平均核苷酸相似度97.69%,基因组完整性93.6%,GC含量39.86%
摘要
Candida solani 属于出芽酵母的 Wickerhamomyces 类群。我们介绍了从爱尔兰都柏林大学学院(UCD)校园土壤中分离出的 C. solani UCD2211 菌株的基因组序列。该基因组大小为 12.67 Mb,被组装成六个染色体大小的 contig 以及一个线粒体基因组 contig。
公告
Candida solani 是一种无性繁殖的物种,属于出芽酵母的 Wickerhamomyces 类群。它最初是在荷兰的一家马铃薯淀粉厂中分离出来的。目前尚未发现其任何食品或生物技术应用。由于该菌株在 35°C 以上无法生长,因此不太可能对人类具有致病性。此外还有两个其他基因组序列:一个是来自模式菌株 NRRL Y-2224 的基因组,被分割成超过 9,000 个 contig;另一个是来自相关菌株 UCD1087 的染色体级基因组序列。
C. solani UCD2211 是在爱尔兰都柏林大学学院(UCD)校园采集的土壤中分离得到的(GPS 坐标:53.308583, ?6.222999),这是作为本科研究项目的一部分完成的。土壤样本在含有氯霉素(30 μg/mL)和氨苄西林(100 μg/mL)的 9 mL 液体酵母提取物-蛋白胨-葡萄糖(YPD)培养基中室温下培养了两次,随后接种在 YPD 球脂平板上。该物种通过核糖体 DNA 进行了鉴定(参考文献
3)。与模式菌株
C. solani(登录号
KY102402 和
NG_055191)相比,ITS 区域的序列同源性为 96.98%(546/563 bp),D1/D2 区域的序列同源性为 99.46%(556/559 bp)。
DNA 是通过从室温下培养的YPD 液体培养物中用苯酚/氯仿提取法获得的。使用 NovaSeq X Plus(Novogene [UK] 公司)进行短读长测序,获得了 1760 万个读长对(每个读长为 150 bp)。通过 Skewer v0.2.2 工具去除了适配器和低质量读段(参考文献
5)。对于长读长测序,首先通过 MasterPure Yeast DNA Purification Kit MPY80010 进行 DNA 提取和文库制备(Native Barcoding Kit SQK-NBD114-24),然后筛选出长度大于 3 kb 的 DNA 片段,再使用 Oxford Nanopore 测序仪(MinION MK1B,流动池 FLO-MIN114)进行测序,并通过 MinKNOW v24.06.16 工具进行超精确碱基校正(默认多重检测设置,去除条形码序列,保留长度大于 500 bp 的读段)。NanoFilt v2.3.0 工具筛选出质量大于等于 10 且长度大于等于 1,000 bp 的读段(N50 值为 6,932 bp),随后使用 Canu v2.2 进行基因组组装(参考文献
7),并使用 NextPolish v1.4.1 进行五轮错误校正(参考文献
8)。除非另有说明,否则所有步骤均使用默认参数。
该基因组由六个核基因组 contig(总长度 12.63 Mb;N50 值为 2,190,064 bp)和一个线粒体基因组(38,626 bp 的环状基因组;登录号
CDRNKE010000007)组成。所有六个核基因组 contig 都被认为是完整的染色体,因为每个 contig 的两端要么是端粒重复序列 (
TGGTGTAGGGATGTACTGTG)
n(参考文献
9),要么是 rDNA 数组(通过 BLASTN 检测到;参见
表 1)。所有 rDNA 数组的 18S 和 26S rRNA 基因都朝向相邻 contig 的末端方向排列。该基因组与 UCD1087 的基因组基本一致(参考文献
3),但存在一次相互易位和一次倒位(参见
表 1)。
表 1 Candida solani UCD2211 的基因组组装特征| 染色体 | 大小(bp) | 左端 | 右端 | 与 UCD1087 的比较 |
|---|
| 1 | 2,692,170 | rDNA | rDNA | chr1 + 部分 chr4(相互易位) |
| 2 | 2,640,582 | 端粒 → rDNA | 端粒 | chr4 + 部分 chr1(相互易位) |
| 3 | 2,190,064 | rDNA | rDNA | chr2 |
| 4 | 2,155,114 | rDNA | 端粒 | chr3 |
| 5 | 1,523,230 | 端粒 | rDNA | chr6 |
| 6 | 1,426,753 | 端粒 | 端粒 | chr5(该染色体上的倒位) |
| 线粒体 | 38,626 | n/a(环状) | n/a(环状) | |
UCD2211 基因组的序列与模式菌株 NRRL Y-2224(登录号
JAKVQS010000000)的序列同源性为 97.69%(参考文献
1),与先前我们分离的 UCD1087(登录号
CAXWWC010000000)的序列同源性为 93.2%(参考文献
3),这表明
C. solani 内部存在序列多样性。使用 BUSCO v5.8.2(参考文献
11)估算,该基因组的完整性为 93.6%,与子囊菌门(Ascomycota)的基因组数据集相当。该基因组的鸟嘌呤(G)和胞嘧啶(C)含量为 39.86%。
致谢
本研究得到了都柏林大学学院的本科教学资源以及爱尔兰研究委员会(Research Ireland,项目编号 24/FFP-A/12509)的支持。资助方未参与研究设计、数据收集与分析,也未参与决定将研究成果发表。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号