《PLOS Biology》:A bacterial ecocline in Klebsiella pneumoniae may explain its backboned phylogeny
编辑推荐:
本文提出,肺炎克雷伯菌(KP)种群中存在的、可解释其“脊骨”式系统发育结构的基因组变异,反映了对一个数量性状的分化选择。通过模拟验证,作者首次提出了“细菌生态梯度”模型,为理解细菌种群内连续性的遗传变异结构提供了全新框架,并揭示了细菌通过数量性状进行适应性分化的潜在机制。该研究超越了传统以抗生素耐药性为焦点的细菌数量遗传学,为从自然选择视角解读细菌物种形成和生态适应开辟了新途径。
细菌种群结构通常用克隆繁衍等种群统计学过程来解释,但也能反映自然选择,从而提供功能和生态学的见解。肺炎克雷伯菌(KP)是一种在全球有效传播、具有高重组率的病原体,理论上其基因库应高度混合。然而,基于不同菌株构建的系统发育树却显示出一种“脊骨”结构。这项研究提出,这种结构反映了“细菌生态梯度”,其成因是作用于一个数量性状的分化选择。
系统发育脊骨反映了一个变异组分
对KP菌株核心基因组单核苷酸多态性(SNP)的分析显示,其系统发育树呈“星状”但整体呈椭圆形,谱系通过一个“脊骨”连接,而非从一个点放射而出。主成分分析(PCA)表明,第一主成分(PC1)解释了总变异的16.7%,并且与系统发育脊骨高度相关:PC1值极端(最高或最低)的菌株位于脊骨的两端,而从中间分叉的菌株具有中间值。通过“半匹配检验”验证,PC1信号在不同数据子集(如按系统发育树分组、按染色体片段分组、按SNP载荷分组)中高度可重复,表明这是一种全基因组范围的、稳定的变异模式,不同于由残存克隆结构或局部基因座驱动的信号。相比之下,模拟的中性进化种群或具有地理种群结构的弧菌(VP)数据,未能完全复现KP中PC1的这种稳健性和解释力。
与PC1最相关的基因座在基因组中成簇分布
对PC1 SNP载荷的分析发现了四个清晰的峰值,每个峰值包含许多在10 kb以内的SNP。通过与PC1最相关(平方载荷>300)的变异位点进行连锁不平衡(LD)分析,这些变异被分为44个LD区块,其中前四个区块包含了大部分的高载荷变异。对这几个关键区块的基因功能注释提供了一些线索:
- •
区块1:包含了编码Kpa菌毛的基因,其中差异最大的基因(KP1_0338/kpaE)编码黏附素亚基。高载荷和低载荷变异在进化上明显分化,可能源于种间导入。
- •
区块2:包含一个编码丝状血凝素N端结构域蛋白的基因(KP1_1632),可能也与黏附相关。
- •
区块3:可细分为3a、3b、3c子区块,包含与铁获取(kfuABC)、c-di-GMP代谢、糖利用/摄取/调控以及纤维素合成等相关的基因。这些基因之前在侵袭性临床分离株和牛乳腺炎菌株中被发现富集。
- •
区块4:包含一个编码翼状螺旋-转角-螺旋转录调节因子的基因(KP1_5387)。
功能富集分析显示,虽然核心基因的平均PC1载荷在不同功能类别(COG)间无差异,但辅助基因(尤其是代谢和细胞过程相关基因)的绝对载荷值显著高于未知功能或复制、重组相关基因。这暗示辅助基因可能受到更强的选择压力。
毒力、抗生素和分离源信息提供的线索有限
分析表明,KP的总体种群结构并非主要由地理起源、抗生素耐药性或毒力决定。尽管对关键基因KP1_0338的分析发现其变异与水源和马源分离株存在统计学关联,但进一步的投影分析表明,PC1作为一个整体与宿主来源没有明确关联。因此,观察到的种群结构不太可能由简单的宿主特异性选择压力塑造。
简单的中性模型无法复现脊骨结构
模拟一个具有突变和同源重组的中性进化细菌种群,可以匹配真实数据的LD衰减曲线,但无法产生系统发育脊骨,且PC1解释的方差较小,在不同半匹配检验中也不稳定。模拟具有10个群体的线性阶梯石地理结构模型可以产生脊骨和相似的PC1解释力,但其SNP载荷分布与真实数据不符,且该模型与KP缺乏地理分化的已知事实相悖。此外,模拟基因组内重组热点或种群内突变率异质性的模型,也未能复现KP的关键模式。
KP变异与作用于数量性状的分化选择一致
研究提出,KP的系统发育树形状反映了作用于一个数量性状的分化选择。为了验证,作者模拟了一个具有单个数量性状的细菌种群进化,其中具有极端性状值的菌株拥有微小的适合度优势。模拟结果显示,在低重组率下,菌株会分化成两个性状值不同的离散群;在高重组率下,种群被均质化,产生星形系统发育;而在中等重组率下,则产生了与KP数据相似的、具有“脊骨”的系统发育结构,PC1与模拟的性状值高度相关。
进一步,模拟假设SNP对性状值的影响大小服从伽马分布。当伽马尺度参数非常大时(即少数SNP具有极大的效应),模拟结果能够复现KP数据中观察到的少量尖锐的PC1载荷峰值,以及高载荷SNP之间的LD模式。
最终,通过模拟基因组大小约为5 Mb、SNP效应值服从特定伽马分布(均值=1,尺度=5×106)的种群,研究者得到了与KP数据在系统发育脊骨、PC1与性状值的相关性、少量高载荷峰值以及高载荷SNP间LD模式等方面定性吻合的结果。
讨论:KP生态梯度假说的意义与验证
数量性状模型在动植物和人类遗传学中至关重要,但在细菌研究中,除抗生素最小抑菌浓度(MIC)这一特殊案例外,对自然种群中数量性状的遗传结构知之甚少。本研究通过模拟证明,作用于一个加性数量性状的分化选择,可以在重组和选择的平衡下,产生跨越整个物种范围的连续性(梯度式)遗传变异结构,即“细菌生态梯度”。这与由地理隔离介导的、通常存在于真核生物中的“生态-地理梯度”有所不同。
KP中存在的PC1梯度为“反向生态学”研究提供了范例:首先从遗传数据中识别出梯度变异,然后寻找相关的性状,最后理解该性状受选择的原因。现有对高载荷基因座的功能注释提示,可能的性状涉及黏附/扩散、c-di-GMP调控的固着/游动策略权衡以及铁获取等,但尚未形成统一的实验室可测量性状。与之前研究中发现的、基因间几乎无中间基因型的“生态物种”不同,KP中的变异是连续性的,代表了分化选择的一种新形式。
验证KP生态梯度假说的下一步,是证明这些极端载荷基因座在功能上具有一致性,即共同影响同一个生态相关性状,并证明该性状所受的分化选择强度足以抵消同源重组的均质化效应。如果假说成立,将为了解细菌数量性状的遗传结构、适合度权衡及其在自然选择下的进化提供突破性见解。