用于无乳链球菌(Streptococcus agalactiae)的跨菌株CRISPRi sgRNA文库

《Microbiology Resource Announcements》:A cross-strain CRISPRi sgRNA library for Streptococcus agalactiae

【字体: 时间:2026年06月05日 来源:Microbiology Resource Announcements 0.6

编辑推荐:

  摘要我们构建了一个全面的、基于计算机模拟(in silico)设计的CRISPR干扰(CRISPRi)sgRNA数据库,该数据库针对高毒性的无乳链球菌(Streptococcus agalactiae)COH1菌株。这一资源提供了广泛、冗余且跨菌株的功能覆盖,能够实现对GBS(G

  

摘要

我们构建了一个全面的、基于计算机模拟(in silico)设计的CRISPR干扰(CRISPRi)sgRNA数据库,该数据库针对高毒性的无乳链球菌(Streptococcus agalactiae)COH1菌株。这一资源提供了广泛、冗余且跨菌株的功能覆盖,能够实现对GBS(Group B Streptococcus)生物学特性、定植能力和致病机制中保守性和菌株特异性因素的可扩展CRISPRi研究。

公告

无乳链球菌(Group B Streptococcus;GBS)是胃肠道和阴道微生物群的共生菌,同时也是一种机会性病原体,可引发侵袭性疾病,包括败血症、肺炎和脑膜炎(14)。GBS仍然是全球新生儿细菌性脑膜炎的主要原因,尤其是在免疫系统尚未发育完全的新生儿中(3)。传统上,对GBS的定植能力、持久性和毒力决定因子的功能研究依赖于基因敲除方法,但这些方法往往耗时且难以大规模应用(3, 513)。
CRISPR干扰(CRISPRi)通过使用催化活性较低的Cas9(dCas9)来抑制目标基因的转录,提供了一种快速、精确的功能基因研究方法(14, 15)。CRISPRi的抑制效果可以通过调整单引导RNA(sgRNA)结合位点与转录起始位点(TSS)之间的距离来调节(15, 16)。因此,我们设计了一个基于计算机模拟的CRISPRi sgRNA库,以促进对GBS基因功能的可扩展研究(17)。
我们生成了一个包含3,595个sgRNA的数据库,这些sgRNA针对高毒性的GBS菌株COH1中的1,944/2,073个已注释的蛋白质编码基因,排除了rRNA和tRNA位点。sgRNA的设计使用了CHOPCHOP v3.0工具,该工具此前已被用于链球菌和肠球菌的CRISPRi sgRNA设计,以最大化预测的靶向效率并最小化脱靶效应(图1A)(1820)。尽管CHOPCHOP评分框架主要基于真核生物数据集,但其设计标准强调序列特异性和PAM(Palindromic Repeats and Motifs)兼容性,这些标准普遍适用于细菌的CRISPRi系统。然而,sgRNA在GBS中的活性可能有所不同,需要针对每个目标进行实证验证(21, 22)。
图1
工作流程图、UpSet图、热图和堆叠条形图,展示了针对GBS菌株的CRISPRi sgRNA库设计。大多数基因在COH1、A909、NEM316、BM110、CJB111和CNCTC 10/84菌株中具有共同的sgRNA。
图1 无乳链球菌的CRISPRi sgRNA库的设计和功能覆盖情况。(A)基于计算机模拟的sgRNA设计工作流程概述。使用CHOPCHOP工具针对COH1参考基因组设计sgRNA,以最大化预测的靶向效率并最小化脱靶效应。(B)sgRNA目标位置相对于基因起始密码子的分布。对于每个基因,选择一个靠近转录起始位点的初级sgRNA以实现更强的抑制效果,并在上游PAM缺失的情况下选择一个位于下游的次级sgRNA以实现较弱的抑制效果。(C)至少有一个保守sgRNA在六个常用GBS菌株(COH1、A909、CNCTC 10/84、NEM316、BM110和CJB111)中靶向的基因交集。(D)热图显示了sgRNA库在主要生物学类别中的功能覆盖情况,以每个菌株中具有两个sgRNA(强覆盖)或至少一个sgRNA(总体可及性)的基因百分比表示。(E)使用Roary工具确定的基因组核心覆盖情况。显示了在所有六个菌株中都被一个或多个sgRNA靶向的基因比例,证明了GBS核心基因组的广泛覆盖。核心基因组是指在所有菌株中都存在的基因;软核心基因组是在五个菌株中保守的基因;辅助基因组是在四个或更少菌株中保守的基因。
在可能的情况下,为每个基因设计了两个sgRNA以提供冗余性并利用CRISPRi的可调节性:一个初级sgRNA位于TSS附近以实现更强的抑制效果(中位数90 bp,四分位数范围[IQR] 160 bp),另一个次级sgRNA位于下游以实现较弱的抑制效果(中位数541 bp,IQR 274 bp)(图1B)。虽然这不能达到大型CRISPRi库所达到的饱和度,但每个基因包含两个引导序列可以在支持必要基因研究的同时进行初步调查,对于这些基因可能需要部分抑制(17)。尽管已经描述了包括基于错配的sgRNA调整在内的其他方法,但这里采用的位置策略为在整个基因组中调节抑制强度提供了一个简单、可扩展的框架。
虽然sgRNA的设计主要是针对COH1菌株进行的,但我们力求最大化这一资源在常用GBS实验室菌株(A909、CNCTC 10/84、NEM316、BM110和CJB111)中的实用性(17)。共有1,448/2,073个目标基因在这些菌株中至少有一个共同的sgRNA(图1C)。使用EggNOG Mapper v2.1.13和默认参数评估了库的功能覆盖情况,将基因分配到COG(Common Ortholog Groups)功能类别中,揭示了跨生物过程的功能冗余性(图1D)(23, 24)。使用Roary v3.13和90%的氨基酸同一性阈值以及严格的定义(要求基因在100%的菌株中存在)评估了基因组核心覆盖情况。在1,448个核心基因(排除rRNA和tRNA)中,有1,319个基因被至少一个sgRNA靶向(图1E)(25)。
总的来说,这个CRISPRi sgRNA数据库为GBS的靶向功能基因组学提供了一个多功能、易于使用的资源,能够快速确定和研究保守性和菌株特异性的定植及致病机制决定因素。

致谢

B.J.K.得到了美国国家神经疾病和中风研究所(National Institute of Neurological Disorders and Stroke)的R15NS131921资助和美国国家过敏和传染病研究所(National Institute of Allergy and Infectious Diseases)的R03AI185593资助,并从这两项资助中获得了工资支持。作者声明,本研究是在没有任何可能被视为潜在利益冲突的商业或财务关系的情况下进行的。
W.D.C.在A.S.、A.W.F、B.K.G和B.J.K的帮助下撰写了手稿。分析和统计工作由W.D.C.完成,A.S.也提供了协助。B.J.K.设计了研究并提供了资源、指导和资金支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号