发酵乳制品是益生菌和益生元的重要来源,在乳制品市场中占据着越来越重要的地位(Thomas & Photis, 2022)。根据研究团队的调查和统计,2023年全球发酵乳制品销售额达到347亿元人民币,预计到2030年将达到514亿元人民币(Gurumayum, Kaur, Rasane, & Singh, 2022)。Lactobacillus是乳制品起始菌和益生菌产品中使用的主要菌株,在维持人类和动物胃肠道的微生态平衡方面发挥着重要作用(Huang et al., 2022)。其中,Lactobacillus delbrueckii亚种bulgaricus(简称L. bulgaricus)是Lactobacillus的模式物种之一,也是工业生产发酵乳制品的重要起始菌株(Ayivi & Ibrahim, 2022)。然而,作为大规模商业乳酸菌产品最持久的天然对手之一,噬菌体(简称phage)对发酵乳制品的生产和应用构成了重大威胁(Wu et al., 2023)。由于噬菌体被认为是导致乳制品发酵失败的主要原因之一,已经采取了几项预防措施来管理它们(Lisa, Declan, Olivia, & Aidan, 2020)。然而,噬菌体污染仍然是乳品行业的主要问题之一。当前的研究表明,发酵乳制品中存在丰富的噬菌体多样性,这些噬菌体可以通过调节产乳酸细菌的代谢来影响发酵系统和过程(White et al., 2022; Wu et al., 2023)。
早期的比较基因组分析发现,超过50%的细菌含有噬菌体或其基因组片段(Carlos, Caroline, Ghislain, Anne, & Harald, 2003)。通常,噬菌体与宿主细胞之间存在长期且相对稳定的关系,它们与宿主细胞一起进行分子遗传,并在代谢活性、生态适应性和进化方面对宿主细胞产生深远影响(Young-Duck & Jong-Hyun, 2012)。然而,在某些情况下,噬菌体可能因环境压力因素从细菌基因组中切除并包装成完整的噬菌体颗粒,从而促进水平基因转移(HGT)(MolinaQuiroz, Dalia, Camilli, Dalia, & SilvaValenzuela, 2020)。作为外源遗传物质,噬菌体可以通过转移其功能基因对宿主菌株产生重大影响。一方面,噬菌体可以为宿主提供适应性优势基因和新的辅助代谢基因,增强宿主细菌群体的生存优势(Middelboe, Traving, Castillo, Kalatzis, & Glud, 2025)。另一方面,作为毒力因子基因和抗生素抗性基因的储存库和重要载体,噬菌体介导的HGT也可能传播对宿主生物健康构成潜在风险的基因,如毒力因子基因和抗生素抗性基因(Huang et al., 2023; Jia et al., 2023; Liao et al., 2024)。因此,研究L. bulgaricus中噬菌体的分布和功能特征对于制定对抗噬菌体的措施具有重要意义。
CRISPR-Cas系统是细菌中最重要的适应性免疫系统之一,用于对抗噬菌体(Mohanraju et al., 2022)。研究表明,乳酸菌中存在大量的CRISPR-Cas系统,这些系统可以通过不断获取新的噬菌体DNA片段作为间隔序列来增强对不同噬菌体的识别和防御能力(Roberts & Barrangou, 2020)。此外,源自乳酸菌的CRISPR-Cas系统在基因编辑、物种遗传稳定性和益生菌工程方面也取得了显著成果(Xin, Guo, & Qiao, 2025)。然而,值得注意的是,不同乳酸菌物种中的CRISPR-Cas系统分布存在差异。Mohaddeseh等人分析了675株Lactiplantibacillus plantarum,发现143株含有确认的CRISPR-Cas系统,主要为类型II-A(Mohaddeseh, Bahman, & Reza, 2024)。Bahman等人分析了238株Lacticaseibacillus rhamnosus,发现106株具有有效的CRISPR-Cas结构,所有可识别的CRISPR-Cas系统都属于类型II-A(Bahman, Behnaz, & Yousef, 2023)。Nami等人通过分析Lactobacillus johnsonii,发现138株在其基因组中含有有效的CRISPR-Cas结构,分别属于类型II-A、类型I-E和类型I-C(Nami, Rostampour, & Panahi, 2023)。然而,目前缺乏对L. bulgaricus中天然存在的CRISPR-Cas系统的全面分析。由此可见,探索L. bulgaricus中CRISPR-Cas系统的详细特征对于揭示噬菌体与细菌之间的相互作用机制以及开发新型基于噬菌体的生物控制技术至关重要。
在L. bulgaricus中实现精确的基因编辑以获得具有普遍抗噬菌体能力的优良菌株是解决乳品行业中噬菌体污染问题的有效方法之一(Vaid et al., 2022)。然而,由于多种影响因素,L. bulgaricus菌株的基因组存在显著差异,导致功能多样性广泛(van de Guchte et al., 2006)。因此,有必要从不同来源分离L. bulgaricus并对大量菌株进行全基因组测序。目前,NCBI数据库中包含了近一百个L. bulgaricus菌株的注释全基因组序列,这有助于更系统、更深入地研究其噬菌体的组成、CRISPR-Cas系统的结构以及它们之间的靶向关系。这些研究结果对于后续开发适合工业乳品生产的抗噬菌体L. bulgaricus菌株具有重要意义。
本研究重点关注119株L. bulgaricus的全基因组序列(93个菌株的基因组从NCBI GenBank数据下载,26个菌株的基因组由我们实验室测序)。通过生物信息学方法,本研究全面分析了L. bulgaricus中噬菌体的基因组特征和CRISPR-Cas系统的遗传结构,同时探讨了噬菌体与间隔序列之间的靶向关系和功能特征。一方面,本研究增强了了对L. bulgaricus噬菌体基因组比较分析的理解,并揭示了它们来自不同地理来源的遗传进化特征。另一方面,追踪了L. bulgaricus中噬菌体的进化历史和传播途径,并推测了噬菌体在L. bulgaricus中的功能效应。本研究的目的是全面分析L. bulgaricus中噬菌体的特征和机制,旨在为筛选抗噬菌体菌株和开发新的抗菌治疗技术提供有价值的参考数据。