《Journal of Advanced Research》:Comparative genomics reveals two major lineages of
Bifidobacterium adolescentis in the human gut, driven by divergent adaptation in China and the United States
编辑推荐:
本研究针对青春双歧杆菌(B. adolescentis)基因组多样性与进化机制不明的问题,对395株菌株开展大规模比较基因组分析,发现该菌种已形成中美两大谱系,其功能异质性由同源重组主导,为开发地域特异性益生菌提供理论基础。
在人体肠道这个神秘而复杂的微生态系统中,数以万亿计的微生物与宿主共同演化,形成了精妙的共生关系。其中,青春双歧杆菌(Bifidobacterium adolescentis)作为成年人肠道中的优势菌群,占据着举足轻重的地位。这种革兰氏阳性、严格厌氧的细菌在60-80%的健康成年人肠道中定植,占粪便微生物群总量的比例可高达5%,尤其在16至45岁的成年人群中丰度达到峰值,暗示着其对成人肠道环境具有特殊的适应性。更为引人注目的是,百岁老人体内该菌的丰度显著升高,提示其可能与健康长寿存在关联。
然而,尽管青春双歧杆菌展现出诸多益生潜力——从抗焦虑、抗抑郁到广谱抗菌抗病毒活性,再到缓解阿司匹林和应激诱导的肠道通透性增加——其功能特性却呈现出高度的菌株特异性。不同宿主来源的菌株在代谢能力和免疫调节功能上表现出显著差异,即便是来自同一宿主的七个分离株也在亲水性和自聚集能力上存在显著变异。这种功能异质性的根源在于基因组的高度可塑性。已有研究发现,不同菌株的胞外多糖生物合成基因簇在序列和组织结构上差异巨大,缺乏一致性结构。更为复杂的是,虽然青春双歧杆菌普遍存在于人类肠道中,但其丰度受到饮食的强烈影响:高碳水化合物摄入者体内该菌丰度较高,而高蛋白或高脂肪饮食则与其水平呈负相关。
面对这一背景,一个关键科学问题浮出水面:在全球化时代,不同地理人群的饮食结构、生活方式和医疗实践差异,是否在塑造青春双歧杆菌的基因组特征上留下了深刻的印记?遗憾的是,此前的比较基因组学研究仅涵盖18株菌株,且地理采样范围狭窄,对该物种的群体水平基因组特征、功能多样性及进化动态认识极为有限。正是为了填补这一知识空白,研究团队开展了迄今最大规模的青春双歧杆菌比较基因组学研究。
这项发表在《Journal of Advanced Research》的研究整合了395株高质量基因组,其中包括82株来自湖北襄阳和内蒙古呼和浩特的新分离株,以及313株来自公共数据库的已发表基因组,样本覆盖中国(169株)、美国(146株)、澳大利亚(25株)、意大利(15株)、英国(13株)等多个地理区域。通过多维度分析框架,研究系统阐明了该物种的泛基因组结构、群体遗传分化、碳水化合物代谢适应、抗生素抗性基因分布及进化动力学的全球图景。
研究采用的关键技术方法包括:基于CheckM的基因组质量评估(完整性>95%,污染<5%);使用Prokka进行基因预测,eggNOG-mapper进行功能注释;通过dbCAN 2鉴定碳水化合物活性酶(CAZyme);利用Roary pipeline进行泛基因组和核心基因组分析;采用Snippy pipeline进行单核苷otide多态性(SNP)检测,并结合Gubbins过滤重组区域;使用RAxML-NG构建最大似然系统发育树;运用PopCOGenT检测水平基因转移(HGT)事件;通过IslandViewer 4预测基因组岛(GI);借助PopLDdecay分析连锁不平衡(LD)衰减模式;使用OPLS-DA进行多变量统计分析。
基因组多样性与泛基因组结构
通过对395株菌株的基因组特征分析,研究发现平均基因组大小为2.23±0.09 Mb,GC含量为59.35±0.22%。值得注意的是,新分离的中国菌株在基因组大小、编码序列(CDS)数量、转运RNA(tRNA)和核糖体RNA(rRNA)基因数量上均与公共数据库中的菌株存在显著差异,特别是rRNA基因数量显著高于先前报道的中国菌株,提示既往测序工作可能存在区域或方法学偏差。泛基因组分析显示该物种具有开放的泛基因组结构,遵循幂律模型y=2190×x(R=0.9994),意味着新测序工作将持续发现新基因。在总计12,402个基因家族中,云基因(存在于<15%的分离株中)占81.8%,而核心基因(存在于100%的菌株中)仅占5.0%,凸显了该物种巨大的附属基因组和广泛的遗传异质性。
区域系统发育结构与基因组分化
基于614个单拷贝核心基因构建的系统发育树揭示了清晰的地理分层模式:349株形成A、B两大分支,其中151株中国分离株主要聚集在B分支,121株美国分离株分布在A分支。澳大利亚菌株(17/25)主要位于A-2亚群,与美国菌株亲缘关系较近。ANI(平均核苷酸一致性)分析进一步证实了这种地理聚类模式。OPLS-DA分析显示,泛基因组和核心基因组谱系均能显著区分不同地理来源的菌株,中美菌株呈现明显分离。值得注意的是,美国菌株具有最大的泛基因组(4,868个基因家族)和最多的附属基因,而中国菌株的核心基因家族数量(1,136个)位居前列。
突变与SNP分析揭示的区域遗传分化
全基因组共鉴定出61,275个SNP,包括18,373个非同义和38,668个同义突变,转换/颠换比为5.11。基于SNP的OPLS-DA清晰分离了不同地理群体,但经重组过滤后的核心SNP系统发育树却未显示强烈的地理聚类。这一看似矛盾的现象源于核心基因树保留了远古谱系分化的信号,而重组过滤后的SNP主要反映近期垂直遗传的点突变。高频的同源重组不断同质化地理群体间的局部基因组,从而抹去了SNP树中的精细群体结构。通过VIP(变量重要性投影)分析筛选出10个关键区分基因,包括beta-galIII、bfrA、gtfA、crcB_2和yteP等,这些基因在中美菌株中呈现相反的富集模式,可作为追溯菌株地理来源的潜在分子标记。
功能注释揭示的地理适应:碳水化合物代谢与CRISPR-Cas系统
功能注释分析揭示了显著的区域代谢差异。中国菌株编码最多的KEGG直系同源物(KO,1,071个)和CAZyme(76个),其中34个KO为特有,主要涉及信号转导和细胞过程,如ABC-2型转运系统ATP结合蛋白(K01990)、多重糖转运系统通透酶蛋白(K02025/K02026)等。美国菌株则拥有24个特有KO,富集于遗传信息处理通路,如DNA复制蛋白DnaC(K02315)、LacI家族转录调节因子(K02529)等。
在CAZyme层面,区域特异性更为显著。美国菌株特有CBM10、CE5、GH15和GH91家族;中国菌株特有CBM61、CBM77、GH112、GH125、GH28和GH85家族;意大利菌株仅特有CBM4。中国菌株富含糖基转移酶(GT)家族(特别是GT27和GT32),而CBM和碳水化合物酯酶(CE)家族较少,提示其功能偏向聚糖合成而非降解。关键区分特征包括15个CBM家族、4个CE家族和8个GT家族的显著差异,这些家族多与植物多糖利用相关。
防御系统分析显示35.7%的菌株携带完整的CRISPR-Cas系统,共鉴定出6种亚型。地理分布呈现显著差异:美国菌株富集class 2-subtype-II-C和class 1-subtype-I-G;中国菌株以class 1-subtype-I-G和class 1-subtype-I-C为主;澳大利亚菌株则class 1-subtype-I-C prevalence较高。这种区域分层暗示不同人群面临差异化的噬菌体或移动遗传元件(MGE)暴露压力。
水平基因转移与移动遗传元件分布
PopCOGenT分析揭示了广泛的近期HGT事件,但HGT网络未显示清晰的地理聚类,暗示基因流跨越区域边界,不受限于地理共现的谱系。这种泛混合模式反映了物种内高度的遗传连通性。MGE分析显示美国菌株携带的MGE数量显著高于中国菌株,尤其在整合与切除元件、稳定性/转移/防御元件方面更为富集,表明其具有更高的基因组重排、防御机制和水平获取潜力。
基因组岛分析揭示的HGT与功能潜力区域模式
基因组岛作为HGT获得的大片段染色体区域,是微生物适应、生态位特化和代谢扩展的重要载体。英国菌株平均GI数量最高(21.0±3.8),其次为美国(20.03±4.49)、意大利(20.0±8.9)、中国(19.65±4.28)和澳大利亚(18.32±3.4)。在GI区域内共鉴定出57个具有区域富集或缺失模式的CAZyme编码基因。CBM46仅在澳大利亚菌株的GI中检出且全基因组prevalence显著高于其他区域;CBM32在英国菌株GI中检出率更高;GH23在中国菌株GI中显著富集。相反,CE1在中国菌株中显著缺失,GH1在美国、英国和意大利菌株中显著富集。
抗生素抗性基因(ARG)分析鉴定出7个ARG,其中rpoB(99.2%)为保守的物种鉴定标记基因,位于染色体而非GI中。而tet(W/32/O)(23%)和ermX(10.6%)则主要存在于中国菌株(分别为71.4%和95.2%),且几乎完全位于GI内,强烈提示这些基因通过HGT获得,可能与中国的抗生素使用模式或耐药微生物群落共存有关。
重组驱动青春双歧杆菌的区域分化进化
为评估同源重组与点突变的相对贡献,研究计算了重组/突变比(r/m)。整体r/m比为2.69,表明重组在塑造遗传变异中作用大于突变。中国菌株r/m值最高(3.50),美国次之(2.98),而澳大利亚(0.54)、意大利(0.59)和英国(0.45)均低于1,提示突变是后三个地区的主导进化力量。LD衰减分析进一步支持这一结论:中国菌株平均r最低(0.096),美国次之(0.143),而英国最高(0.249)。LD衰减曲线显示中美菌株呈陡峭下降,而澳意英菌株斜率平缓,证实前者重组频率高、后者更具克隆性。
这项研究的重要意义在于首次在全球尺度上系统阐明了青春双歧杆菌的群体基因组结构和进化动力学。研究发现该物种已形成以中国和美国为代表的两大主要谱系,这种分化并非源于点突变的逐渐积累,而是由广泛发生的同源重组所主导。基因组岛作为功能创新的热点区域,承载了区域特异性的碳水化合物代谢酶和抗生素抗性基因,反映了宿主饮食、抗生素暴露等生态因子的选择压力。
特别值得关注的是,中美菌株在CAZyme谱上的显著差异——中国菌株富集植物多糖降解酶(如果胶酶YTEP),美国菌株富集乳糖代谢酶(如beta-半乳糖苷酶)——与两地饮食结构(高纤维vs.高乳制品)高度吻合,展现了微生物对宿主饮食的精细适应。同时,tet(W/32/O)和ermX在中国菌株中的高频出现及其与GI的关联,为监测肠道微生物耐药性传播提供了重要靶点。
从进化生物学视角,该研究揭示了重组在细菌物种形成中的复杂作用:高频重组虽能同质化群体间的局部基因组,却不足以抹去基于数百个保守核心基因构建的深层系统发育框架。这种"核心基因树强地理信号、重组过滤SNP树弱地理信号"的悖论,为理解细菌群体遗传结构提供了新的理论视角。
在应用层面,这些发现为开发地域特异性益生菌制剂和个性化微生态干预策略奠定了基因组学基础。鉴于不同地理人群携带的青春双歧杆菌在功能潜力上存在显著差异,未来的益生菌筛选和应用需充分考虑菌株的地理起源与宿主饮食背景的匹配性。同时,针对中国人群菌株中 antibiotic resistance genes 的分布特征,有必要建立相应的安全性评估和监测体系。
研究的局限性包括意大利、英国和澳大利亚样本量相对较小,缺乏个体水平的饮食和抗生素使用等元数据,以及分析流程依赖较多手动操作影响效率和可重复性。未来研究应在扩大地理采样、整合宿主生活方式数据、开发自动化机器学习分析 pipeline 等方面深化探索,特别是通过功能实验验证候选适应性位点的生理意义,并通过纵向队列研究建立微生物进化与个体因素的因果关联。