《International Journal of Molecular Sciences》:Genomic Plasticity and Functional Reweighting Facilitate Microbial Adaptation During the Ripening of Artisanal Goat Cheese
Jan Sadurski,
Ma?gorzata Ostrowska,
Adam Staniszewski and
Adam Wa?ko
编辑推荐:
本研究采用宏基因组组装基因组(MAG)与通路水平功能分析,首次全面解析了波兰玛祖里地区传统生山羊奶酪成熟过程的微生物演替。文章揭示了菌株水平基因组异质性、代谢通路重分配(如半乳糖代谢增强)及移动遗传元件(如噬菌体、抗生素抗性基因)在微生物适应与功能重塑中的关键作用,为理解传统发酵食品的微生物生态与风味形成机制提供了新见解。
引言
山羊奶酪是全球许多地区烹饪传统的重要组成部分,其独特的风味和香气由多种因素共同塑造,包括乳汁成分、生产条件,以及最关键的是发酵与成熟过程中微生物的代谢活动。近年来,山羊奶制品因其在消化性、蛋白质组成和氨基酸谱方面的差异,作为牛奶奶酪的替代品吸引了越来越多的消费者兴趣。与山羊奶酪相关的微生物群落通过发酵和成熟过程中复杂的代谢相互作用,在塑造其生化和感官特性方面起着核心作用。然而,许多早期研究主要依赖于16S rRNA基因扩增子测序,这种方法能捕获广泛的分类学模式,但在菌株水平上分辨率有限,且无法实现直接的功能基因谱分析或移动遗传元件检测。这一局限在由生乳制作的传统手工奶酪中尤为突出,其中错综复杂且动态的微生物群落在当地环境条件、生产方法以及成熟相关压力(如盐浓度、pH波动和营养消耗)的影响下不断演变。尽管这种微生物多样性通常与独特的风味属性相关,但在基因组和功能水平上,特别是在成熟过程中菌株水平的多样化、基因组可塑性以及代谢通路的重分配方面,其特征仍不充分。
为填补这一空白,本研究提出了一个假设:奶酪成熟不仅涉及分类学上的演替,还包括菌株水平的基因组多样化以及代谢通路的协同再分配,这可能与基因组可塑性和移动遗传元件相关。为验证此假设,研究对波兰玛祖里地区的传统生山羊奶酪进行了宏基因组鸟枪法测序和基因组解析分析,以表征连续成熟阶段的微生物演替、功能潜力和基因组可塑性。
结果
1. 测序数据整体质量
宏基因组测序每个样本平均产生47.1 ± 5.6百万条双末端读长,对应6.93 ± 0.79 Gb的数据。使用Kraken2进行的分类学分配在所有样本中均表现出高且一致的分类率,平均96.9%的读长被分类,表明绝大多数测序读长来源于微生物。质量控制在所有分析样本中保持一致,过滤后没有样本被排除在后续分析之外。组装指标显示出显著的连续性。总之,测序数据在所有样本中均表现出高且一致的质量,为后续的分类学分析、功能表征和基因组解析分析提供了可靠基础。
2. 微生物群落组成
所有α多样性比较均在经过抽平的数据库上进行,以确保样本间测序深度均等。α多样性评估使用了丰富度估计值(观测值、Chao1、ACE)和多样性/均匀度指标(Shannon、Simpson、Pielou)。最终产品样本的α多样性高于成熟阶段观察到的样本。与丰富度和多样性相关的指数,如ACE、Chao1、观测丰富度和Shannon多样性,在最终产品样本中 consistently 表现出更高的值。相比之下,Pielou均匀度和Simpson多样性指数在成熟和最终产品样本之间显示出相似的值。这些结果表明,成熟奶酪中微生物复杂性的增加主要是由低丰度类群的积累驱动,而非群落优势度的重组。
在属水平上,两组的微生物群落均以乳酸菌为主。在成熟和产品样本中,乳球菌都是最丰富的属(成熟期平均88.768%,产品期79.926%)。其他几个属以较低比例存在并显示出组间变化,包括 植物乳杆菌、副干酪乳杆菌和 链球菌。基于Bray-Curtis相异性的主坐标分析支持了层次聚类模式,并表明成熟阶段和产品阶段的微生物群落存在部分分化。主要坐标(PCoA1 = 46.59%)捕获了群落组成的主要梯度。尽管在排序原点附近存在一些重叠,但产品样本比更紧凑的成熟集群表现出更广泛的分散,表明最终产品微生物群的异质性增加。对排序贡献最大的类群包括与发酵相关的常见乳酸菌,以及 腐生葡萄球菌、琥珀葡萄球菌和 肠杆菌,表明发酵类群和伴随类群的变化共同导致了样本间的差异。
判别分析揭示了几种类群与成熟和最终产品样本的差异关联。例如,分枝杆菌、假单胞菌、螺原体和 鞘氨醇单胞菌在成熟样本中富集,而 粘液乳杆菌、链霉菌、根瘤菌和 不动杆菌在最终产品中更为普遍。然而,在经过本杰明-霍奇伯格多重检验校正后,没有类群达到预定义的错误发现率阈值具有统计学显著性,因此这些差异应被解释为探索性模式而非统计学支持的生物标志物。
3. 宏基因组组装基因组与基因组解析功能分析
本研究进行了基因组解析分析,以重建代表奶酪微生物组主要和持续检测成分的宏基因组组装基因组。基因组重建过程独立使用两种组装器(MEGAHIT和SPAdes)与两种分箱算法(MetaBAT2和MaxBin2)联合执行,促进了跨不同方法工作流程的基因组回收稳健性评估。
总共从成熟阶段收集的样本中回收了37个MAG,而从最终产品中重建了141个MAG,相当于成熟奶酪样本中重建基因组总数增加了约3.8倍。重建MAG的分类学分类显示,最终产品比成熟阶段具有更高的基因组丰富度。最终产品包含10个属和13个物种,而成熟阶段包括6个属和7个物种。尽管某些类群(包括 葡萄球菌和 罗氏菌)仅从最终产品中重建,但费希尔精确检验后经本杰明-霍奇伯格校正并未在属或物种水平上识别出具有统计学显著差异的MAG代表性。这些发现表明,最终产品中基因组多样性是数量上的扩张,而非阶段间具有统计学稳健性的分类学重组。最终产品中重建MAG数量的增加可能反映了奶酪成熟过程中整体基因组复杂性的增加和微生物贡献的累积,而非特定类群的阶段特异性富集。
在所有组装-分箱组合中,植物乳杆菌、副干酪乳杆菌和 乳酸乳球菌是最常重建的物种。代表性高质量MAG的组装统计数据显示了高基因组完整性和低污染水平。通过BLASTn进行的重建MAG与相应参考基因组的比较基因组比对,并利用Proksee可视化为环状基因组图谱,显示出近乎连续的基因组范围覆盖,表明染色体结构的强保守性。GTDB-Tk分析进一步证实了重建MAG与其最近参考基因组之间的高度基因组相似性。例如,乳酸乳球菌MAG与参考基因组的平均核苷酸一致性为98.95%,比对分数为0.943。在环状基因组图谱中观察到局部区域比对覆盖率降低,表明存在菌株特异性基因组片段。值得注意的是,无论采用何种重建策略,这些类群中的每一个都 consistently 产生了多个不同的MAG,表明在优势的奶酪相关种群中存在显著的菌株水平异质性。
为了定量评估种内基因组多样性,在99% ANI阈值下对高质量MAG进行了去重复分析。该分析解析了优势类群内的多个菌株水平集群。具体而言,植物乳杆菌形成2个集群,副干酪乳杆菌形成9个集群,乳酸乳球菌形成2个集群,副布赫内尔乳杆菌形成10个集群,马胃葡萄球菌形成5个集群,嗜热链球菌形成10个集群。这些结果表明存在大量的种内基因组异质性,证明重建的MAG代表了基因组上不同的菌株水平群体,而非冗余的组装。
对于三种主要物种,各从最终产品中选择了一个完整性大于80%、污染小于5%的单一高质量MAG,用于针对相应参考基因组的全面比较分析。选择基于最高测序覆盖度的代表性MAG,从而确保最大的基因组完整性和分析稳健性。比较基因组比对发现了与参考基因组相比具有较低同线性和序列相似性的独特基因组区域。功能注释显示,这些低同线性区域主要与前噬菌体相关元件和其他移动遗传元件有关。这种可变基因组区域的存在强调了优势奶酪相关类群内的菌株水平基因组异质性,并凸显了基因组解析宏基因组学超越单纯分类学分析的重要价值。这种基因组变异性表明优势奶酪相关种群内存在持续的微进化过程。
4. 抗性组与安全标志物
在所有样本中总共鉴定出433个抗生素抗性基因(ARG)匹配,对应44个独特的抗生素抗性 Ontology 条目和27个抗生素抗性基因家族。最终产品阶段比成熟阶段拥有更多的ARG匹配数。样本间比较证实,最终产品在总匹配数、独特ARO数和抗生素抗性基因家族数上均显著更高。基于Jaccard和Bray-Curtis距离的β多样性分析进一步表明成熟和最终产品抗性组之间存在显著的组成差异。
抗生素外排和抗生素失活是主要的抗性机制,在两个阶段的大多数样本中均存在。在药物类别水平上,抗性决定因子主要与四环素类和氨基糖苷类相关,而磺胺类和β-内酰胺类相关基因丰度较低。尽管成熟和最终产品阶段之间的整体抗性组结构大致保持一致,但在最终产品组中观察到了ARG多样性和基因家族数量的定量富集。检测到的ARG反映了奶酪微生物组的遗传潜力,并不意味着表型抗性或抗菌药物敏感性。
5. 噬菌体与宿主相互作用
通过宏基因组分析初步鉴定了672个推定的病毒序列。使用CheckV评估病毒基因组质量,仅保留被分类为“高质量”的重叠群用于下游分析。这种严格过滤将数据集减少到29个高质量病毒基因组(占所有检测到的病毒重叠群的4.3%)。
使用基于k-mer的病毒-宿主预测工具PHIST进行推定宿主分配。所有报告的宿主-噬菌体关联在经过多重检验校正后均具有统计学显著性。在属水平上,大多数高质量噬菌体被分配给优势乳酸菌,包括 乳球菌、副干酪乳杆菌和 植物乳杆菌。在物种水平上,最常预测的宿主是 乳酸乳球菌和 副干酪乳杆菌,其次是 植物乳杆菌。六个高质量病毒基因组未能产生可信的宿主分配。
高质量噬菌体优先与优势乳酸菌关联,表明噬菌体-宿主相互作用主要围绕奶酪微生物组的核心成员构建。这种相互作用可能通过溶原性整合、重组事件和水平基因转移促进基因组可塑性,从而在技术相关类群内塑造种群水平的基因组变异性。本文提出的宿主分配是推定的,基于序列相似性而非经过实验验证的噬菌体-宿主相互作用。
6. 微生物组的功能潜力
本研究对KEGG注释基因家族的分析集中于碳水化合物、氨基酸和脂质代谢,因为这些功能类别代表了奶酪成熟过程中微生物生长、底物利用和代谢物产生的主要生化过程。
在KEGG A级类别09100内,总共检测到11个KEGG B级子系统和123个KEGG C级通路,对应所有成熟阶段的726个独特KEGG直系同源物。检测到的子系统总数在LSK12–LSK15之间具有可比性,表明成熟期间全局代谢丰富度稳定。值得注意的是,在通路水平观察到的变化表明代谢模块相对功能权重的转变,而非总基因丰度的统一改变,暗示优势微生物种群内存在通路水平重组。
在所有成熟阶段,碳水化合物代谢 consistently 构成了代谢库的最大部分。当标准化到母类别“代谢”时,其相对贡献在成熟过程中逐渐增加,从LSK12的大约22.5%上升到LSK15的超过24%。第一周和第四周之间的效应量比较证实了比例表征的 positive shift,表明在成熟过程中对碳水化合物相关过程的功能 emphasis 增加。
与氨基酸代谢相关的基因代表了第二丰富的代谢类别。尽管它们的绝对CPM值在成熟期间减少,但它们对总代谢的比例贡献保持相对恒定,在所有样本中约占18.8–19.5%。这种模式表明,尽管代谢基因库发生了 broader alterations,但与氨基酸相关的功能 capacity 得以保留。
脂质代谢构成了代谢基因库的最小部分。尽管观察到绝对丰度略有减少,但其对代谢类别的相对贡献在所有成熟阶段稳定在大约6.0–6.2%。这表明在奶酪微生物组中,脂质相关功能具有一致有限但持久的代表性。
从代谢基因分布的KEGG B级概述出发,对代表性KEGG C级通路进行了分析,以确定特定功能模块如何塑造观察到的模式。半乳糖代谢是碳水化合物代谢中的一个重要子通路,在成熟过程中其比例贡献呈现渐进式增加。当标准化到KEGG碳水化合物代谢类别时,其相对表征从LSK12的大约15.3%增加到LSK15的23.2%。效应量估计证实了第一周和第四周之间存在明显的 positive shift,表明在奶酪成熟后期阶段,半乳糖利用通路的功能突出性增强。
相比之下,苯丙氨酸、酪氨酸和色氨酸生物合成在氨基酸代谢中保持了稳定的比例贡献,尽管绝对