揭示极端环境下基因必需性的新视角:嗜热栖热菌基因组Tn-seq分析挑战细菌核心必需基因的普适性

《MicrobiologyOpen》:Tn-seq of Thermus thermophilus Genome Reveals Unexpected Tolerance to Insertions in Bacterial Common Essential Genes

【字体: 时间:2026年03月25日 来源:MicrobiologyOpen 4.6

编辑推荐:

  本研究通过建立一种改进的Tn-seq(转座子测序)方法,对极端嗜热菌Thermus thermophilus进行全基因组范围的基因必需性筛选。出乎意料的是,研究发现几乎所有基因都检测到转座子插入,无法像常见研究一样清晰区分必需基因。这一反常现象挑战了Tn-seq技术在鉴定基因必需性方面的普适性。研究者结合嗜热菌的多倍体特性(polyploidy)及蛋白质稳定性差异,对该结果提出了新的解释,为理解极端微生物的遗传适应机制及Tn-seq方法学的应用边界提供了新的重要视角。

  
在地球上各种极端环境中,生命以其独特的方式顽强生存。嗜热栖热菌(Thermus thermophilus, Tth)便是这样一种“烈火英雄”,它能在高达80℃的高温泉水中繁衍生息,是研究生命耐热机制的重要模式生物。其基因组相对紧凑,大小约2.1 Mbp,包含约2263个基因。然而,与许多细菌不同,嗜热栖热菌拥有一个鲜为人知的特点:它的细胞是多倍体(polyploid)的,在营养丰富的培养基中,平均每个细胞携带7-8个拷贝的基因组。这一特性如何影响其基因功能,尤其是在面对基因“损伤”时的表现,是一个有趣而未知的问题。
在微生物遗传学领域,Tn-seq(Transposon sequencing,转座子测序)技术是一种强大的高通量功能基因组学工具。它通过将携带抗生素抗性标记的转座子随机插入到细菌基因组中,然后对存活的细菌群体进行深度测序,来定位转座子插入位点。在绝大多数研究中,每个基因的插入指数会呈现典型的双峰分布:一个尖锐的峰代表了转座子插入会导致细菌死亡的必需基因(插入极少或没有),而另一个较宽的峰则包含了那些能够耐受插入而不影响生存的非必需基因。这项技术被广泛用于鉴定特定条件下细菌生存、毒力或适应所必需的基因,是理解病原体致病机制、寻找新药靶点的重要手段。
那么,当我们对嗜热栖热菌这个“耐热多倍体”应用这项强大的“基因功能扫描”技术时,会发生什么?它会像其他细菌一样,清晰地告诉我们哪些基因是生存所不可或缺的吗?研究者们带着这个疑问,对嗜热栖热菌HB27菌株展开了全基因组的Tn-seq分析。然而,结果却出乎意料,与以往任何报道都不同。他们发现,嗜热栖热菌的几乎所有基因中都检测到了转座子插入,插入频率的分布呈现出一个平滑的单峰曲线,而非典型的双峰分布。这使得像往常一样,清晰地鉴定出必需基因变得异常困难。许多在细菌中普遍被认为是核心必需、支持关键细胞通路的基因,如DNA复制起始蛋白DnaA、RNA聚合酶亚基RpoC、DNA旋转酶亚基GyrB、ATP合酶亚基等,都显示出相对较高的转座子插入数。这一发现挑战了我们对基因必需性的传统认知,也促使研究者深入探究:为何在嗜热栖热菌中,那些“本该”是必需基因的位点,却表现出了如此高的“容忍度”?这项发表在《MicrobiologyOpen》上的研究,为我们理解极端微生物的遗传学以及Tn-seq技术的应用边界,打开了一扇新的大门。
为了开展这项研究,作者们建立并应用了若干关键技术方法。他们设计了一个带有耐热卡那霉素抗性基因的Tn5小转座子,并在体外(in vitro)将其随机插入到嗜热栖热菌HB27的基因组DNA中。为了大幅提高转化子的数量,他们将转座反应产物通过基于Phi29 DNA聚合酶的等温多重置换扩增(MDA)进行富集。随后,将扩增后的DNA产物,首先转化到一个高转化效率、高重组能力的Δppol/addAB突变株中,构建了初始的转座子突变库(Ppol库),然后再将该库的基因组DNA转化回野生型HB27菌株,构建HB27库。对构建的文库进行Illumina MiSeq测序,并进行生物信息学分析,包括过滤、比对、标准化(计算Z-score)以及聚类分析,以评估每个基因对转座子插入的耐受性。此外,研究还整合了泛基因组(pangenome)分析,利用PPanGGOLIN流程构建了从嗜热栖热菌种到Deinococcota门水平的泛基因组,以分析基因保守性与Tn-seq结果之间的相关性。
3.1 文库构建与Tn-seq
研究者成功构建了高质量的嗜热栖热菌Tn5转座子突变库,包括在Δppol/addAB宿主中的初始库(Ppol库)和回转到野生型菌株的库(HB27库)。测序分析表明,转座子插入广泛分布于整个基因组,平均每45 bp就有一个独特的插入位点。对所有样本的基因Z-score进行的主成分分析显示高度相关性,表明文库构建和数据具有良好的一致性和可重复性。
3.2 Tn-seq插入频率无法清晰区分必需基因
研究者评估了每个基因的Z-score来判定其必需性水平。与大多数Tn-seq研究中观察到的双峰分布不同,嗜热栖热菌基因的Z-score呈现出一个平滑、连续下降的单峰分布,仅有极少数基因的插入频率极低。这使得设定必需基因的阈值变得困难。由于缺乏清晰的双峰曲线,研究者采用无监督聚类方法(K-means)将基因分为“高度耐受”和“中等”两个主要集群,并进一步从中选出了插入率最低的20%基因,称为“较不耐受”亚组。值得注意的是,许多公认的核心必需基因,如gyrBdnaArpoCmraYtopA等,被归类为“高度耐受”或“中等”,而非“较不耐受”。
3.3 相关类群中的基因保守性与Tth Tn-seq结果不相关
为了从更广的进化背景理解Tn-seq结果,研究者构建了从嗜热栖热菌种到Deinococcota门水平的泛基因组,以分析基因的保守性(核心、外壳、云基因)。他们发现,虽然随着分类等级降低,核心(persistent)基因家族数量增加,但被归类为“高度耐受”的HB27核心基因比例在所有分类水平上保持相对恒定(约25%)。将Tn-seq分组与泛基因组数据进行比较,结果显示两者相关性很低。与来自多种模式生物(如大肠杆菌、结核分枝杆菌等)的已发表必需基因数据进行比较,也发现必需基因与Tn-seq分数之间没有相关性,但与泛基因组中的基因保守性有中等程度的相关性。与可用的HB27基因表达数据(RNA-seq)的关联分析显示,高转录基因与Tn-seq Z-score呈轻微的负相关。这些结果表明,尽管嗜热栖热菌的核心必需基因在进化上高度保守,但其在Tn-seq分析中却表现出了出人意料的高插入耐受性。
3.4 必需遗传通路中积累Tn5插入
研究进一步分析发现,即使在通常认为必需的整体细胞机器(如核糖体、RNA聚合酶、DNA复制体)中,其编码基因也混杂着“较不耐受”、“中等”和“高度耐受”的类别。例如,呼吸链复合物I(NADH脱氢酶)是严格需氧的嗜热栖热菌中电子传递链的主要入口点,本应是关键甚至必需的,但其近三分之二的亚基编码基因被归类为“中等”或“高度耐受”。类似地,尽管与核糖体蛋白合成相关的基因在“较不耐受”组中富集,但仍有超过40%的rRNA和核糖体蛋白基因被归类为“中等”甚至“高度耐受”。
3.5 DNA修复途径的冗余性与Tn-seq插入耐受性相容
对于生活在极端高温下的嗜热栖热菌,DNA修复途径被认为至关重要。研究者总结了DNA修复相关基因的Tn-seq数据、泛基因组分类以及已有的实验数据(基因敲除是否可行)。整体印象是,在非胁迫的富培养基条件下,大多数DNA修复基因是可在个体水平上被敲除的。这与它们大多被归类为“中等”或“高度耐受”的Tn-seq结果一致。例如,同源重组中的关键蛋白RecA被归类为“中等”,而recA敲除菌株虽然存在但极不稳定。许多修复基因在嗜热栖热菌中存在功能冗余(如至少存在四对解旋酶-核酸酶组合:AddAB、RecJ/RecQ、NurA/HepA和SbcCD),这可能是单个基因得以敲除的原因。这些结果与现有知识相符,表明嗜热栖热菌似乎并不严重依赖单一修复途径,而是依赖于多条途径的同时活性,偏好于同源重组、无差错的DNA修复。
3.6 假设蛋白和未知功能域
研究者还分析了功能未知蛋白和未知功能域。约20%的未知功能蛋白属于“较不耐受”类别。他们利用Alphafold DB和DALI进行了结构预测,为部分未知功能域推定了可能的一般功能,但其为何对细胞重要到具有低转座子插入率,仍不清楚。
研究的讨论部分对上述惊人结果进行了深入剖析,并提出了核心解释。这项Tn-seq研究为已分析的基因组列表增添了一种极端嗜热且多倍体的细菌。与通常观察到的双峰分布不同,嗜热栖热菌的所有样本都呈现单峰分布,几乎没有完全没有插入的基因。研究者认为,嗜热栖热菌基因组的多倍体特性是解释这一反常现象的关键。在平均每个细胞拥有5-8个基因组拷贝的情况下,即使某个必需基因在部分拷贝中被转座子破坏,只要细胞仍保有足够数量的功能基因拷贝以产生维持生命所需的蛋白,携带插入的细胞就可能存活。在细胞分裂过程中,子细胞需要随机继承至少一个抗性盒子和一个功能必需基因拷贝才能保持存活。这与通过同源重组进行基因敲除时的观察相符:当目标基因非必需时,通过连续在选择性平板上划线可以完全消除该基因;而当基因必需时,有时能获得小的转化子,但强迫抗性盒子扩增时,这些转化子往往无法持续生长。这种情形类似于Tn-seq中观察到的现象:插入重要基因的单个分离菌落可能表现出一定的生长,因此该基因在Tn-seq程序后显示出一定程度的耐受性,但该突变体可能无法持续存活。
此外,研究者提出了第二个可能的解释因素:蛋白质和mRNA的稳定性。在一个细胞中,特定蛋白的数量取决于RNA的稳定性、蛋白自身的稳定性、携带插入的基因组拷贝数、表达的调控等多种因素。一个自身非常稳定、依赖于非常稳定的mRNA、和/或具有自我调控电路的蛋白质,可能耐受存在于更少的基因组功能拷贝中,从而在Tn-seq中表现为“中等”甚至“高度耐受”,例如DnaA或SSB。相反,稳定性低、缺乏独立调控的蛋白则需要更多的基因拷贝,因此会表现为“较不耐受”。这一解释也可延伸至形成多亚基复合体的蛋白质。
尽管存在诸多例外,但研究在整体上仍捕捉到了大多数基因的预期模式。例如,在DNA修复基因方面,在已知的非胁迫条件下可敲除的23个基因中,有22个在Tn-seq中被标记为“高度耐受”或“中等”。多个修复因子和途径的冗余可能解释了此类基因的个体可敲除性。
综上所述,这项对嗜热栖热菌的Tn-seq研究引入了一种促进此类研究的通用方法,其结果总体上与基因必需性的预期功能模式一致,同时意外地发现了许多在多种细菌中作为必需基因同源物的保守基因存在例外。这些发现为关于基因破坏耐受性与细菌基因组(尤其是多倍体物种)中基因需求之间关联的固有假设提供了新的视角,并可能随着未来对更多微生物的了解和研究的深入而得到扩展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号