《Microbiological Research》:Transcriptional regulation in halophilic archaea: Promoter elements, key transcription factor families, and gene regulatory networks
嗜盐古菌(halophilic archaea)是一类适应高盐环境生存的极端微生物,其存活依赖于有效应对环境波动变化的能力。微生物采用多种策略调控基因表达,其中转录因子(transcription factors, TFs)发挥着关键作用。这些蛋白通过响应小分子配体或细胞内信号来调控基因表达。尽管转录调控在细菌(Bacteria)和真核生物(Eukarya)中已得到广泛研究,但古菌域(Archaea domain)中嗜盐古菌(haloarchaea)的这一过程仍知之有限。本综述汇编并回顾了调控嗜盐古菌基因表达的各类转录调控因子,涵盖了嗜盐古菌中转录起始与调控的主要蛋白和DNA元件,以及基因调控网络(gene regulatory networks, GRNs)。此外,研究人员还分析了细菌和古菌转录因子在家族丰度、大小、等电点和功能角色方面的差异,并综述了嗜盐蛋白DNA-蛋白质相互作用的决定因素。该分析揭示了嗜盐古菌基因调控的机制,为进一步探索和表征这些独特微生物的分子机制提供了坚实基础。
1. 引言
古菌域(Archaea domain)经历了持续的分类学重新界定。近期基于基因组分类数据库(GTDB)的标准化古菌分类框架将原有的超门DPANN、Asgard、TACK和广古菌门(Euryarchaeota)重新划分为16个不同的门。嗜盐微生物被归入嗜盐菌门(Halobacteriota),其中大多数属于嗜盐菌纲(Halobacteria),盐杆菌属(Halobacterium)、嗜盐富饶菌属(Haloferax)、嗜盐弧形菌属(Haloarcula)、嗜盐方形菌属(Haloquadratum)和嗜盐红菌属(Halorubrum)是盐场生态系统中最丰富的属。嗜盐菌需要高达3.5 M的主要为NaCl的高盐浓度才能生长,其通过特定的膜结合泵积累摩尔浓度的KCl至细胞质("盐入"策略)来应对高离子强度,因此所有分子都进化出在高浓度下保持稳定和活性的适应性特征。蛋白质表面富含天冬氨酸和谷氨酸等负电荷氨基酸,含有较多多 small疏水残基而较少的 bulky疏水残基。此外,嗜盐古菌为多倍体,含有一条主染色体和可变数量的质粒,且DNA富含GC含量以增强在高离子强度细胞质中的基因组稳定性。
长期以来,古菌被认为局限于极端环境,但近二十年研究表明它们也存在于非极端环境中。这些极端栖息地大多条件波动,需要精确的基因调控机制来调整基因表达水平。古菌在转录周期的起始、延伸和终止等多个阶段调控基因表达,但最常见的调控机制是包含转录因子的一成分系统。这些蛋白在基因特异性调控中起关键作用,通过与DNA相互作用改变基因表达,从而改变酶活性、代谢途径、生理和细胞响应。尽管近年来基因调控知识有所进展,但与细菌相比,嗜盐古菌中已表征的转录因子和蛋白-DNA相互作用的决定因素仍然有限。本综述旨在全面概述嗜盐古菌中转录因子和基因调控机制的现状,涵盖嗜盐古菌启动子元件、转录起始机制、转录因子库、其作用模式及与DNA的相互作用方式。
2. 嗜盐古菌转录起始:启动子元件与相关蛋白
古菌的核心转录机制包括DNA启动子元件和一组转录特异性蛋白。最小启动子区域包含TATA框(位于转录起始位点上游的AT富集序列)和嘌呤富集的B识别元件(BRE)。此外,还有两个增强古菌转录起始的DNA元件:起始子元件(INR)和启动子近端元件(PPE)。TATA框是所有基因类型转录所必需的,包括蛋白编码序列、rRNA和其他RNA基因。在嗜盐古菌中,TATA框共有序列最初报道为TTTWWWW(W代表A或T),位于-29至-24位置,中心约在-27位。有趣的是,嗜盐古菌中的TATA框位置并不十分保守,可相对于转录起始位点灵活移动±1或±2个核苷酸。但近期对Haloferax volcanii和Halobacterium salinarum多个基因启动子元件的更准确分析揭示了更保守的TATA框序列TTWT,中心位于-27和-28位。至少Haloferax volcanii中极高比例的启动子具有退化TATA,但这不影响其驱动转录激活的能力。
对多个嗜盐古菌转录本5'端的分析显示,BRE元件长度可变化为3至6个碱基对,在-34和-33位置包含两个腺嘌呤,多个嗜盐古菌启动子中的共有序列为CGAAA。值得注意的是,TATA框和BRE元件在不同古菌亚群之间存在差异,尽管TATA结合蛋白(TBPs)在整个古菌域中保守,其分子机制仍存在变异。嗜盐古菌中的差异可能源于其相对于非嗜盐物种的GC富集基因组。
INR元件对精确选择转录起始位点(TSS)很重要,位于TSS下游1 bp处。虽然该元件在某些嗜盐古菌物种(如Halobacterium salinarum)中难以检测,但在Haloferax volcanii中略有检出。相比之下,INR在产甲烷菌和硫球菌目(Sulfolobales)中保守良好,对不同类群具有不同重要性。尽管如此,近期研究表明起始子元件可能为启动子提供额外的选择性,至少在产甲烷菌中如此。PPE元件位于TATA框和转录起始位点之间,通常在-10和-11位置,共有序列为WW。该元件在体外研究中并非必需,但据报道可促进弱启动子中的转录起始。
转录起始需要TATA结合蛋白(TBP)和转录因子B(TFB)来招募RNA聚合酶(RNAP)。首先,TBP识别并结合TATA框;随后TFB结合BRE元件并增强TBP-TATA框复合物的稳定性。一旦形成,TBP-TFB-DNA复合物可通过形成前起始复合物(PIC)将RNAP招募至启动子区域。第三种古菌转录相关蛋白——转录因子E(TFE)也参与体内复合物形成,尽管其必需性尚不明确,但据报道它通过增强TATA框-TBP相互作用并刺激PIC形成,促进闭合复合物向开放复合物的转化以形成转录泡来促进转录起始。近期研究通过分析不同古菌基因组(基于DNA-蛋白结合能和结构特征),发现TFE可能结合PPE -10/-11和INR +1区域。
与其他生物不同,一些嗜盐古菌拥有多种TBP和TFB蛋白。如前所述,嗜盐古菌中的TATA框序列包含8个核苷酸,具有TTWT共同核心。该共同核心可被所有嗜盐古菌TBP同工型识别,而其余四个核苷酸则被个别TBP差异识别,结合不同启动子从而调控不同基因。
古菌启动子元件在序列和空间需求方面类似于真核生物,但与细菌启动子的典型DNA元件(-10/-35)无相似性。相反,细菌核心启动子由-35和-10基序组成,被结合RNAP形成全酶的Rho因子识别, directing复合物朝向其目标启动子序列。此外,转录泡远端DNA非模板链与RNA聚合酶中CRE口袋之间也存在特异性相互作用。因此,古菌和细菌拥有根本不同类型的转录机制。有趣的是,嗜盐核心启动子结构(如Haloarcula hispanica和Halobacterium salinarum)显示出真核和细菌样特征的组合,因为嗜盐古菌启动子可在Escherichia coli中赋予启动子活性。一般而言,古菌基础转录机制可视为真核对应物的简化版本,因为TFB、TFE和RNAP分别与真核TFIIB、TFIIE和RNAPII同源。如前所述,古菌和真核生物拥有密切相关的转录装置,依赖TATA框、BRE和INR。此外,真核转录DNA基序包含多种额外元件来微调转录(如DPE、CAAT框、GC框和DCE)。而且,真核转录广泛受远端调控元件(包括增强子和沉默子)调控,这些元件通过转录因子和大型共激活复合物(如Mediator)来调节转录起始。
随着生物信息学进展、表征技术和生物信息学发展,三个生命域的启动子表征都取得了进展。但与真核生物和细菌相比,嗜盐古菌启动子的功能分析仍然匮乏。总体而言,嗜盐古菌似乎缺乏强烈保守的启动子水平基序,尤其是TATA框,这使得启动子搜索和生物信息学及序列水平的分配变得困难。这可能部分归因于所使用的启动子区域数量和嗜盐古菌微生物类型存在的偏倚,凸显了进行更深入和纲水平分析的必要性。这激发了基于能量和结构参数定义启动子区域和识别新区域(即使存在退化启动子元件)的技术和研究的发展。
3. 转录因子的家族分类
转录因子是一种可能包含保守特异性DNA结合结构域(DBD)的一成分系统,该结构域赋予TF-DNA相互作用的特异性。其中一些蛋白可能还具有额外的结构域,通常称为配体结合结构域(LBD),能够结合具有不同DNA结合效应的小分子效应物。在古菌中,许多DNA结合转录因子具有保守序列的螺旋-转角-螺旋(HTH)、ribbon-螺旋-螺旋(RHH)和翼状螺旋-转角-螺旋(wHTH)结构域。相比之下,LBD在转录因子间表现出较大的结构变异性,可能不仅参与配体结合,还参与蛋白质-蛋白质相互作用或酶活性。
典型地,转录因子可通过干扰基础转录装置、启动子元件或两者来抑制或激活转录。一方面,当特定"抑制子"结合顺式调控序列(BRE元件)时,转录被阻断,抑制PIC形成或RNAP招募。另一方面,当"激活子"促进转录蛋白核心招募时,转录起始被刺激。但也发现了更复杂的机制,其中一个转录因子可同时作为激活子和抑制子。
过去二十年来,嗜盐古菌中几种转录调控因子的功能已被阐明。但与细菌对应物相比,已鉴定转录因子的数量及其功能表征深度仍然有限。主要挑战之一在于注释不一致和基因错误注释,这在嗜盐古菌基因组中尤为常见。BLASTp、RPS-BLAST和HMM等工具与PFAM注释的DBD、 curated转录因子数据库和已表征参考调控因子结合使用,已被证明对预测参与转录调控的基因产物有用。然而,古菌基因组中转录因子的持续低代表性已被报道。近期对古菌基因组的大规模分析强调,相当比例的古菌蛋白质组(约40-50%)仍未被表征,凸显了计算预测与真实功能景观之间的显著差距。这一局限性主要源于基于序列相似性方法(包括BLAST和HMM/Pfam模型)无法充分捕捉古菌蛋白的高度序列多样性和进化分歧,其中许多蛋白低于检测阈值或在当前数据库中缺乏代表性模型。值得注意的是,即使是已实验表征的调控蛋白也可能因这些限制而被错误注释为假设蛋白,表明假阴性是一个普遍问题。因此,嗜盐古菌中转录因子的库可能被系统低估,特别是对于偏离保守共有序列的谱系特异性或快速进化的调控因子。
作为回应,一些研究提出了整合方法,不仅纳入DBD序列相似性,还纳入LBD的实验证据或结构特征以改进转录因子分类和发现。在这方面,近期大规模in silico分析为扩展古菌DNA结合蛋白目录做出了贡献,为改进基因组注释和发现新的调控功能提供了宝贵资源。
为补充这些整合方法,已建立多个专门数据库来整合转录因子及其相关调控元件(如启动子预测和转录因子结合位点等)的信息。这些平台在分类范围和数据的性质上各不相同,为比较基因组学和古菌调控系统功能表征提供了关键资源。
总体而言,使用细菌和真核生物域的数据库对研究古菌调控极为有用,因为它允许比较和对比古菌域特有来源和实验数据的相对稀缺性。为克服这些技术和文献限制,人工智能(AI)工具(如基因组语言模型和自动注释框架)的整合将实现更快、更集中和更精确的研究。这些新兴技术将有助于统一标准和标准化分析方法,促进新调控功能的发现。实验验证和基于AI的数据库共同将有助于纠正传统预测工具在古菌尤其嗜盐古菌基因组中的偏倚,因为这些基因组具有高GC含量、显著退化和非典型启动子结构以及转录因子发生。
3.1. Lrp/AsnC家族
亮氨酸响应调控蛋白/天冬酰胺合成酶C家族(Lrp/AsnC family,又称feast/famine调控蛋白,FFRPs)不仅是古菌中丰度最高、分布最广泛的转录因子家族,在嗜盐古菌中也是如此,调控着多条中心代谢途径。该家族在细菌中已被广泛研究,也是嗜盐古菌中表征最广泛的家族,可能归因于其高丰度。它通常包含两个主要结构域:N端的wHTH和C端的氨基酸代谢调控(RAM)结构域,但也可能含有TRASH结构域(重金属运输、抗性和感应结构域)。古菌Lrp/AsnC的结构特征已与细菌Lrp进行了比较,报道了在DNA和配体结合能力以及调控机制方面具有可比的作用模式。尽管如此,古菌Lrp/AsnC家族包含更多样化和复杂的蛋白集合,可作为全局或基因特异性调控因子。
在嗜盐古菌Halobacterium salinarum中,八个Lrp同源物被指定为Trh。其中两个旁系同源物(Lrp和LrpA1)参与不同的调控机制。一方面,Lrp(Trh7)作为全局转录因子影响多个靶基因(涉及氨基酸代谢、转运和其他调控因子调控等过程)的转录。另一方面,LrpA1(Trh4)以更特异的方式调控天冬氨酸转氨酶。在同一嗜盐古菌中,转录调控因子LrpA2(Trh1)在芳香族氨基酸限制条件下强烈诱导,提示可能在芳香族氨基酸生物合成中发挥作用。Trh2蛋白含有一个名为TrKA-C的新功能结构域,该结构域仅限于嗜盐菌科(Halobacteriaceae)。TrkA-C结构域的存在暗示了对K
+/NAD
+变化的感应和基因调控。
通常,Lrp/AsnC调控因子与氨基酸和中心代谢相关。但Kaur等人(2006)发现了新功能:他们报道VNG1179C(一种含金属结合TRASH结构域的推定Lrp调控因子)对Halobacterium sp. NRC-1在Cu(II)胁迫下的存活至关重要,该Lrp转录因子被描述为yvgX基因(编码P1 ATPase YvgX外排泵)的转录激活子。
Lrp家族蛋白与转运蛋白的关联也在其他Lrp家族成员(如Halobacterium sp. NRC-1)中被生物信息学报道。例如,trh3基因(LrpA3)似乎在磷酸盐稳态中起关键作用,但这一假设尚未经实验验证。而Trh6转录因子提出参与脂质代谢,使用天冬酰胺作为诱导物;AsnC蛋白可能参与分泌过程和氧化应激。
在Haloferax alexandrinus DSM27206中,发现一种Lrp蛋白在银诱导胁迫下上调,提示可能在金属胁迫中发挥作用。近期研究中,来自嗜盐古菌Haloferax mediterranei的Lrp/AsnC蛋白(HFX_RS01210)被分析,提示在氧化应激、金属耐受和氮限制条件等胁迫条件中可能发挥作用。
虽然氨基酸似乎是已表征Lrp/AsnC转录因子的常规配体,但古菌尤其嗜盐古菌中的Lrp样蛋白经历了进化适应,扩展了其功能配体范围。而且,与细菌对应物相比,嗜盐古菌Lrp成员具有更多功能,能够作为全局调控因子和基因特异性调控因子。此外,它们负责调控不仅涉及能量和中心碳代谢,还涉及转运、金属和氧化应激等的基因。
3.2. PadR家族
PadR样蛋白(酚酸响应调控因子)作为具有wHTH DNA结合结构域的转录抑制Fd制备,包括GvpE和GvpD,调控Halobacterium salinarum和Haloferax mediterranei中的气体囊泡形成。该家族成员在DNA结合结构域上与MarR结构相关,但具有显著更大的C端二聚化结构域。GvpE蛋白类似于真核生物中通常参与基因调控的碱性亮氨酸拉链蛋白,而GvpD表现出与AAA
+ ATPase大蛋白家族的相似性。GvpE作为转录激活子发挥作用,而GvpD通过与GvpE相互作用并降低其可用性来抑制气体囊泡形成,最终影响转录。
此外,来自嗜盐古菌Halobacterium salinarum NRC-1的VNG0258H (RosR)蛋白被归类为MarR和PadR转录因子之间的杂交体。该调控因子参与Halobacterium salinarum NRC-1对过氧化氢和百草枯诱导的氧化应激的适应。RosR直接或间接调控300多个编码蛋白的基因表达,这些蛋白通过转录因子的大型调控网络参与修复极高水平活性氧(ROS)造成的细胞损伤。令人惊讶的是,该转录因子的晶体结构已被报道,是少数嗜盐古菌转录因子的三维结构之一。此外,其DNA结合基序已被报道,序列为TGT-N
10-ACA。相比之下,RosR在Haloferax volcanii和Haloferax mediterranei中涉及细胞运动,提示通过顺式-反式相互作用的灵活重布。
3.3. IcIR/ArcR家族
IcIR家族成员(又称ArcR)最初在肠杆菌科中发现,控制包括乙醛酸支路、多药耐药、芳香族组分降解、群体感应和孢子形成等多种功能。相比之下,古菌IcIR成员仍然 poorly表征。Halobacterium salinarum NRC-1中的IcIR样ArcR调控因子是arcABDCR操纵子的一部分,该操纵子通过精氨酸脱亚胺途径参与发酵生长。令人惊讶的是,Haloferax volcanii的基因组含有二十多个ArcR型转录因子旁系同源物,但arcACB基因并未在ArcR调控因子附近发现。
XacR是一种推定的IcIR样转录因子,据报道是Haloferax volcanii中戊糖分解代谢(包括D-木糖和L-阿拉伯糖)的激活子。除其激活功能外,XacR还能抑制其自身合成,表现出靶标依赖的双功能特性。在同一嗜盐古菌中,RhcR作为rhc基因的转录激活子发挥作用,这些基因参与L-鼠李糖通过二酮-水解酶途径的转运和降解,使用2-酮-3-脱氧-L-鼠李糖酸(KDR)作为诱导分子。此外,GacR调控因子也被表征,作为DeLey-Doudoroff酶的转录激活子,参与D-半乳糖降解。Johnsen等人(2020)报道了Haloarcula marismortui DSM 3752和Haloarcula hispanica DF60中的新型D-核糖氧化途径,其操纵子含有IcIR样转录调控因子(RR_RS09905和HAH_RS09320)。这些调控因子与Haloferax volcanii的XacR具有超过50%的序列同一性,提示它们可能作为Haloarcula物种中戊糖代谢的转录调控因子。事实上,MscR已被报道为Haloarcula hispanica中参与甘露醇和山梨醇摄取和氧化基因激活子。
有趣的是,一些icIR/arcR基因位于低盐条件下转录的基因组区域,提示可能在盐度胁迫中发挥作用,但这一假设需要实验证实。
3.4. HTH_10 (bat样)家族
在本综述撰写时,多种HTH_10家族转录因子已在嗜盐古菌中被描述。第一个HTH_10家族转录因子Bat(菌视紫红质激活子)在Halobacterium salinarum中被发现。bat基因的表达在低氧张力条件下直接诱导,并间接受光诱导,作为光和氧传感器。Bat蛋白激活bop基因的表达,该基因是紫膜中的光驱动质子泵,用于产生ATP合成的电化学梯度。值得注意的是,Bat蛋白的结合基序已被阐明。Bat蛋白与其他bat样蛋白协同调控菌视紫红质基因。
DmsR蛋白是一种能够控制dmsREABCD操纵子表达的转录调控因子,该操纵子与Halobacterium salinarum NRC-1中的二甲基亚砜(DMSO)和三甲胺N-氧化物(TMAO)厌氧呼吸相关。DmsR蛋白在其N端含有一个富含半胱氨酸的区域,可能参与响应氧浓度变化。研究人员证明DmsR转录因子在缺氧条件下是激活子,无论DMSO浓度如何。相比之下,Haloferax volcanii中的dmsREABCD操纵子受两个系统控制:DMSO响应的DmsR和另一个未知的厌氧调控因子。此外,DmsR调控因子在另外10种嗜盐古菌菌株的DMSO/TMAO还原酶操纵子基因间上游被发现,提示类似作用。Hattori等人(〈i〉报告了第一个嗜盐调控蛋白NarO,参与Haloferax volcanii中反硝化途径的调控。NarO在硝酸盐依赖方式下作为反硝化基因的正调控因子在低氧条件下发挥作用。此外,近期研究表明NarO还参与Haloferax volcanii中dmsREABCD操纵子的硝酸盐响应抑制。
值得注意的是,DmsR蛋白被预测含有类似于Bat家族激活子的DNA结合结构域,能够响应光和氧。然而,NarO不包含任何氧/氧化还原感应基序,提示了一种感知氧或氧化还原电位的新型古菌机制。
在Haloferax mediterranei中,两个推定的菌视紫红质激活子E6P09_08650和E6P09_00735在反硝化条件下显示上调,被建议为反硝化的潜在调控因子。
3.5. DtxR家族
DtxR转录因子家族由金属依赖性转录调控因子组成,参与控制细胞中与金属稳态相关基因的表达。原核生物中的金属稳态由两个主要家族的转录因子调控:铁摄取调控因子(FUR)和DtxR。FUR蛋白主要出现在细菌中,而DtxR型转录因子在细菌和古菌中广泛保守。
Schmid等人(2011)报道在Halobacterium salinarum中,四个DtxR样转录因子旁系同源物(SirR、TroR、Idr1和Idr2)响应铁可用性调控金属稳态,展示了复杂的转录调控网络(TRN)。Idr2诱导包括铁载体生物合成和金属转运在内的几种金属运输功能。Idr1对激活编码参与血红素生物合成、铁转运、铁载体摄取和氨基酸代谢的蛋白的基因是必需的。此外,第四个DtxR转录因子之间观察到高度的基因调控网络复杂性。Idr1在铁充足时激活SirR,而在铁限制时被Idr2抑制。而且,SirR在铁充足条件下抑制TroR的表达。结果表明Idr1在铁稳态中具有次要或冗余功能,而Idr2和TroR在铁耗竭下发挥关键作用。相比之下,SirR在铁充足条件下很重要。
在Haloferax volcanii中,TroR是铁稳态的主要调控因子,需要在铁充足条件下抑制铁摄取和激活铁储存。此外,TroR以铁依赖方式直接调控铁载体生物合成基因簇,并通过基因调控网络与Idr相关联。另外,SirR在铁充足条件下结合并抑制其启动子,并被提议调控锰摄取。
3.6. 其他转录因子家族
本节涵盖在嗜盐古菌基因组中丰度较高但尚未表征或研究不足的某些转录因子家族。
多重抗生素抗性调控因子(MarR)蛋白与多种功能相关,包括涉及芳香族有毒化合物、环境变化以及药物和胁迫抗性的代谢过程。通常,MarR蛋白是从高度特异性操纵子到多效性多基因全局调控因子的抑制子。这些转录因子是古菌中第二丰富的调控因子。尽管它们丰度很高,但只有少数MarR样转录因子被分析,且无一属于嗜盐古菌。古菌域中表征最好的MarR转录因子是来自硫化叶菌(Sulfolobus solfataricus)的BldR和BldR2蛋白,这两个蛋白被报道为参与调控对芳香族化合物的胁迫响应的激活子。迄今,尚无MarR蛋白在嗜盐古菌中被表征,这增加了对其在嗜盐古菌中存在的不确定性。
砷抗性(ArsR/SmtB)转录因子家族是另一个在古菌基因组中已鉴定的大量转录相关家族。ArsR/SmtB家族蛋白是与重金属胁迫诱导浓度相关的转录抑制子,在细菌中已被广泛研究。然而,对古菌ArsR家族对应物的研究仍然 poorly表征。在嗜盐古菌Halobacterium salinarum NRC-1中,arsR和arsD基因编码反式作用抑制子,赋予对As(III)和Sb(III)的抗性。Legerme等人(2016)将Haloferax volcanii中的推定ArsR转录因子(hvo_0246)与古菌运动性的调控联系起来。在同一嗜盐古菌中,通过DNA-蛋白技术,TroR转录因子(主要铁稳态调控因子)被报道结合到ArsR(hvo_1766)启动子区域,提示ArsR转录因子在金属稳态中间接调控。
TrmB家族,又称麦芽糖操纵子转录调控因子,最初在古菌Thermococcus litoralis中被发现。该转录因子家族存在于所有古菌门中。TrmB家族在2014年被综述,强调其在古菌中的多功能作用,在中央碳代谢(如糖酵解和糖异生)中发挥重要作用。在Halobacterium salinarum NRC-1中,TrmB蛋白(由VNC1451C基因编码)被报道为响应碳可用性(主要是葡萄糖和甘油)参与调控细胞氧化还原和能量状态的双功能调控因子。TrmB可结合113个启动子区域,编码进化上多样但功能相关的酶,可作为激活子或抑制子发挥作用。具体而言,TrmB在葡萄糖限制条件下结合DNA,促进糖异生和其他可整合入细胞表面S层糖蛋白的糖类合成。相反,当葡萄糖可用时,TrmB从DNA上解离,增强糖酵解基因的转录。此外,ChIP-Chip和转录组学方法还报道了在氨基酸、钴胺素和嘌呤代谢中的进一步调控功能。
在近期研究中,TrmB样OxsR被证明作为Haloferax volcanii中由次氯酸盐引起的氧化应激响应的硫醇基调控因子。OxsR是参与氨基酸代谢和硫醇转移基因的激活子,并对DNA修复系统起抑制子作用,是古菌中首个参与氧化还原信号转导的TrmB蛋白。更近期,来自Haloarcula hispanica的TrmB(HAH_1548)被表征,显示TrmB对葡萄糖饥饿下的生长至关重要,因为它直接激活糖异生基因的表达。同样,Haloferax volcanii中的TrmB蛋白是糖异生基因的关键调控因子,与TbsP蛋白(一种TrmB和MarR样调控因子)共同调控gapII基因,该基因编码糖异生的关键酶。此外,TrmB与TbsP之间的相互作用已被报道,影响多种表型特征,包括细胞形状、运动性和生物膜形成,表明该调控模块不仅中心于代谢控制,还连接到细胞发育和环境适应。
TetR/AcrR调控因子家族是细菌域中最常见的转录因子,占细菌基因组中转录因子总数的14.8%。细菌TetR蛋白已被广泛研究和综述,它们是参与多药耐药、渗透胁迫和分解代谢途径等多种细胞过程的抑制子。相比之下,古菌基因组含有约占总转录因子群体5%的TetR/AcrR,且仅有一个古菌TetR样转录因子被研究。FadR是来自Sulfolobus acidocaldarius的酰基-CoA响应蛋白,通过调控编码脂肪酶和β-氧化酶的23个开放阅读框的表达参与脂质和脂肪酸代谢的调控。FadR是古菌中唯一功能和结构已确定的TetR蛋白。尽管如此,来自Haloarcula marismortui的嗜盐古菌TetR蛋白的一个晶体结构已被报道,但其功能仍未表征。
BirA是Escherichia coli和其他细菌中参与生物素生物合成的双功能蛋白,作为生物素-蛋白连接酶和生物素操纵子的转录抑制子发挥作用。遗憾的是,BirA转录因子尚未在古菌微生物中被实验研究,但birA旁系同源物和生物素相关基因已在古菌基因组中发现,包括嗜盐古菌Halobacterium salinarum中。有趣的是,使用比较基因组学,双功能转录因子RbkR(参与核黄素代谢)已在几种嗜盐古菌基因组中被报道。这为深入研究嗜盐古菌中的维生素代谢开辟了新可能。
在过去十年中,系统发育谱分析(一种正交计算方法)预测了新的转录因子功能。例如,一种新型ThiN样转录因子ThiR被描述为在包括Haloferax volcanii在内的古菌中调控硫胺素代谢。
DeoR/GlpR型蛋白是通常作为碳源(如糖和核苷)摄取和分解代谢负调控因子的转录因子。DeoR同源物广泛存在于细菌中,也存在于选定的古菌中。在Haloferax volcanii中,GlpR蛋白在以甘油和葡萄糖作为碳源时抑制果糖代谢基因的转录。而且,近期体内和体外研究表明,GlpR直接抑制编码果糖和甘油摄取、降解和转运的基因,以响应碳可用性。相比之下,Haloferax mediterranei中的GlpR是在果糖诱导期间磷酸烯醇式丙酮酸依赖性磷酸转移酶系统(PTS)基因簇的激活子。
近期,一种新型转录调控因子GfcR蛋白在Haloferax volcanii中被鉴定为多种糖分解代谢基因(包括D-葡萄糖、D-果糖、D-半乳糖和甘油)的激活子。GfcR使用糖和甘油降解途径的中间产物作为诱导分子。同样,GfcR调控Haloarcula hispanica中的甘露醇、山梨醇和果糖降解。结构上,GfcR属于磷酸核糖转移酶(PRT)家族,被提议从PRT样酶进化而来。通过获得HTH结构域,它现在发挥转录调控因子功能,类似于细菌PurR和PyrR调控因子。
PhaR是一种属于AbrR样转录因子家族的新型DNA结合蛋白,与Haloferax mediterranei中的聚羟基脂肪酸酯(PHA)代谢相关。PhaR可在体内特异性结合并抑制phaP蛋白基因(参与PHA积累和颗粒形成)及其自身启动子。令人惊讶的是,PhaR可能独立于PhaP促进PHA合成。而且,近期研究报道了磷酸烯醇式丙酮酸合成酶样(PPS样)蛋白(PspR)作为phaR基因表达的负调控因子的特定功能。两种蛋白调控因子形成PHA生物合成的调控网络(PspR-PhaR),该网络可能在嗜盐古菌中广泛存在。
在Halobacterium salinarum中,PHO刺激子被建议在低磷酸盐条件下调控磷酸盐代谢。在Halobacterium salinarum基因组中发现四个来自Escherichia coli的phoU同源物,其中三个PhoU在N端含有SpoVT/AbrB基序,可能负责磷酸盐依赖性转录调控。
CdrSL是文献中描述的嗜盐古菌中唯一的RHH结构域转录因子。同源物CdrL特异性直接结合cdrS-ftsZ2启动子,调控其表达水平。CdrS已被报道调控微管蛋白同源物ftsZ2,以协调嗜盐模式生物Halobacterium salinarum、Haloferax volcanii和Haloferax mediterranei中的细胞分裂,是唯一参与古菌细胞周期的转录因子。
4. 古菌和细菌域中转录因子的基因组分布与区别
古菌和细菌中转录因子的结构、分布和丰度已在计算研究中被广泛分析。虽然其中一些研究包括嗜盐古菌,但没有一个专门聚焦于这一群体。尽管如此,细菌和古菌转录因子之间的诸多差异已被报道。
在丰度方面,大多数古菌基因组中预测参与基因调控的开放阅读框(ORFs)不到5%,而细菌基因组中为8-10%。古菌中转录因子编码家族的基因组丰度和多样性均低于细菌。此外,古菌转录因子往往更小(平均179 vs. 236个氨基酸),60-75%由单结构域组成。古菌转录因子还具有较低的等电点、较少的毒力相关转录因子代表性,以及相对于细菌对应物更高频率的内在无序区域。
古菌和细菌中转录因子的分布也因生活方式而异。一些研究报告称,自由生活的微生物倾向于编码更多的转录因子,可能是因为它们需要响应更广泛的环境信号。在古菌中,甲烷微菌纲(Methanomicrobia)成员表现出最低的转录因子库,而嗜盐古菌含有最高的转录因子基因组比例。系统基因组学证据表明嗜盐古菌从产甲烷祖先进化而来,这可能促进了其转录调控机制的扩展和多样化。一些作者提出,古菌基因组中明显的转录因子赤字可能部分是由于用于预测转录因子的计算工具的局限性。此外,古菌可能更依赖于其他精细化调控策略,如基因调控网络、小RNA、核糖开关和转录后修饰等。
5. 嗜盐古菌中的基因调控网络(GRNs)
尽管嗜盐古菌编码的转录因子少于细菌,但它们展现出显著的精细化调控策略,表明单个转录因子可能参与多个调控途径并参与复杂的组合控制。确实,近期研究表明古菌中的转录调控因子经常相互作用,形成相互连接的基因调控网络,增强调控复杂性。
在这种情况下,全局转录组学、系统生物学和全基因组实验揭示了古菌调控网络通常表现出与细菌和真核生物系统相似的特性。例如,具有多效性效应的调控枢纽很常见,转录因子不仅经常控制代谢操纵子,还控制其他调控因子,创建层级和模块化结构。Halobacterium salinarum中的研究发现了动态转录因子-转录因子相互作用和环境变化时的网络重布,特别是在氧化应激下。此外,不同古菌中转录-代谢网络的建模表明,这些系统遵循保守的设计原则,如冗余性、反馈循环以及代谢与基因表达之间的调控耦合,有助于代谢灵活性。这些基因调控网络已在多种代谢和胁迫响应途径中被报道,包括糖代谢(如GlpR-TrmB)、聚羟基脂肪酸酯生物合成(如PhaR-PspR)、铁稳态(如TroR-Sir)以及响应活性氧的细胞损伤修复(如RosR-TfBs等)。令人惊讶的是,嗜盐古菌转录因子可通过灵活的蛋白-DNA相互作用快速发散,如近期报道所示,提示功能重布。这些发现共同表明,古菌中的调控复杂性源于转录网络内的密集互连和功能可塑性,以提高变化环境中的生存能力。
6. 极端盐环境中蛋白-DNA复合物稳定性的决定因素
蛋白-DNA结合主要由静电和疏水贡献介导,对盐浓度敏感。盐度水平在嗜盐系统中尤为重要。这为研究嗜盐蛋白的DNA结合能力提出了挑战,尤其因为常规方案往往旨在限制盐浓度。尽管对细菌和非嗜盐古菌中蛋白-DNA相互作用进行了广泛研究,但使嗜盐菌在高盐环境中维持稳定蛋白-DNA相互作用的分子原理在很大程度上仍未被探索。
支配嗜盐古菌分子机制的高离子强度影响DNA和蛋白质的结构稳定性。一方面,嗜盐古菌基因组的GC含量(高达65%)与暴露于高盐浓度和高紫外光下的DNA稳定性相关。此外,嗜盐古菌中二核苷酸组成(主要是GA、AC和GT)的过度表征已被报道,反映了负残基的需求,将特定DNA含量与氨基酸组成联系起来。
嗜盐古菌的基因组结构由非典型DNA结构、拓扑动力学和层级组织之间的复杂相互作用定义。一方面,超螺旋DNA结构已与不同盐度相关联,提示拓扑DNA的盐依赖作用。而且,DNA超螺旋由DNA旋转酶和拓扑异构酶的协同作用调控,确保极端盐度条件下的适当拓扑稳态。尽管关于嗜盐古菌DNA拓扑的研究仍然有限,但现有证据表明其染色体组织成染色质相互作用结构域(CIDs),由DNA结合蛋白稳定,增强基因转录。另一方面,嗜盐蛋白中酸性残基(特别是天冬氨酸和谷氨酸)的富集促进蛋白在极高盐条件下的溶解度和稳定性。尽管存在这种整体酸性特征,DNA和RNA结合结构域通常维持局部碱性斑块,允许与带负电荷的核酸磷酸骨架发生静电互补,尽管这并非所有嗜盐DNA结合蛋白的普遍特征。
尽管蛋白-DNA相互作用在转录中的相关性,关于嗜盐古菌中蛋白-DNA复合物的结构数据仍然稀缺。嗜盐古菌中的研究揭示了这些相互作用在非盐水系统中描述的根本不同的物理化学原理下运作。在嗜盐和超嗜热古菌Pyrococcus woesei中,TBP-DNA相互作用伴随着水分子去除和蛋白静电负叶与带负电荷DNA之间阳离子的结合。该复合物的亲和力在高盐浓度下增强,离子在蛋白-DNA界面内被隔离。总体而言,电荷分布和静电电位可能是决定嗜温和嗜盐生物之间盐依赖性DNA结合行为的主要因素,至少在TBP蛋白中如此。显著的是,仅结合界面处三个核苷酸的突变就改变了阳离子结合能力,并将蛋白恢复为嗜温样行为。热力学分析表明,这些相互作用主要由有利的熵变化驱动,主要与复合物形成时结构化水分子的释放相关,而非由静电贡献驱动。
对嗜盐转录因子hsRosR的研究也揭示了离子在高盐条件下蛋白-DNA相互作用中发挥积极和多方面的作用。DNA结合位点和周围溶剂中的离子和水分子经历重排以物理上使复合物形成得以实现。结合反应是吸热的,可能由有利的熵驱动,与复合物形成时结构化水分子的释放一致。值得注意的是,结构比较揭示hsRosR识别在MarR/PadR家族成员中保守的回文DNA基序,且DNA结合模式与PadR等嗜温同源物高度相似,涉及wHTH介导的与主沟和次沟的典型相互作用。重要的是,尽管存在高盐环境,最终蛋白-DNA界面似乎并不涉及额外的结合阳离子,并且 closely类似于嗜温蛋白-DNA复合物。这表明盐和离子的主要作用不是直接介导最终结合界面,而是调节结合前的蛋白电环境和结构状态,使DNA的有效相互作用得以实现。因此,一旦在高盐条件下形成遭遇复合物,DNA识别就通过在很大程度上保守的结构机制进行。
在Haloferax volcanii中,增殖细胞核抗原(PCNA)(参与DNA复制的进行性因子)表现出以负表面电荷为主。值得注意的是,负责DNA结合的内部孔几乎完全丧失了碱性残基,突出了与其他DNA结合蛋白中典型静电互补形成对比的独特适应策略。在这种情况下,钠阳离子的聚集似乎通过补偿正电荷残基的缺乏和减少带负电荷蛋白表面与DNA磷酸骨架之间的静电排斥来稳定蛋白-DNA复合物。Haloferax volcanii的复制蛋白A3(RPA3)经历盐依赖性寡聚化状态变化,与蛋白稳定性一起调节其DNA结合能力。这些观察共同表明,虽然离子普遍需要调节静电环境、稳定蛋白结构和促进与DNA的初始遭遇,但它们对最终结合界面的直接参与并非普遍特征。相反,嗜盐蛋白似乎在结合实现后保留典型的DNA识别机制,盐主要作为使能因子而非最终复合物的结构组分。
在基因调控方面,仅三种转录因子已被结晶:Lrp/AsnC、PadR和TetR/AcrR家族的代表。三者均遵循嗜盐蛋白的预期特征,显示酸性残基的表面富集,导致溶剂可及区域的高度负静电电位。尽管如此,这些转录因子的DNA结合区域保留了局部正电荷,使与带负电荷DNA骨架的相互作用得以实现。
对Halobacterium salinarum PadR样转录因子的深入分析揭示,DNA结合以盐依赖性方式发生。碱性斑块中(包括DNA结合裂隙)阴离子的存在提示离子位移可能在调节结合亲和力中发挥作用。与DNA相互作用时,这些阴离子可能被置换,对复合物形成的热力学产生有利贡献。另一方面,Haloferax mediterranei Lrp/AsnC转录因子的结构和功能研究表明,配体L-谷氨酰胺的存在增强了DNA结合亲和力和特异性。这得到EMSA实验的支持,显示更强的复合物形成和增加的蛋白熔解温度(Tm),提示配体结合稳定了蛋白-DNA复合物。然而,盐对这一系列稳定化的贡献仍有待表征。
这些发现强调了扩展结构和生物物理研究以更好理解嗜盐转录因子如何在高盐极端条件下调整其DNA结合机制的重要性。嗜盐古菌环境特有的高离子强度不仅影响蛋白和DNA的稳定性,还在调节其相互作用中发挥关键作用。特别是,盐的存在似乎减少了负电荷表面之间的静电排斥并促进初始结合,即使它们最终被排除在最终复合物之外。阐明这些盐依赖性策略是充分理解嗜盐古菌中蛋白-DNA相互作用分子机制的关键。
7. 结论与未来展望
本综述分析了嗜盐古菌基因组中转录起始元件、嗜盐古菌转录因子库的现状及其功能相互作用,以及蛋白-DNA相互作用的决定因素。
嗜盐古菌基因组的转录起始元件涉及四个DNA元件:TATA框、BRE元件、PPE和INR。这些元件的位置和序列已部分鉴定;然而,序列比较方法在识别嗜盐古菌启动子区域中的这些DNA基序方面往往不足,可能由于其序列多样化、特定基序(如TATA框)的序列退化程度以及高GC含量。虽然某些启动子元件(如INR和PPE)对转录起始并非必需,但它们在特定启动子处促进基因激活,反映了可调的启动子结构。有趣的是,尽管具有类似于真核生物的启动子系统,嗜盐古菌启动子能够在细菌中赋予启动子活性,提示来自不同域的启动子元件之间的功能汇聚,可能履行类似功能,突出了嗜盐古菌转录系统的进化可塑性。在细菌中,选择压力触发新生调控基序的出现和进化(称为调控新生现象)。然而,这一现象在嗜盐古菌中尚未被探索。而且,鉴于嗜盐古菌中功能数据的片段性和有限性,我们当前的大部分理解仍从细菌和真核模型外推,这可能无法反映高盐条件下进化出的独特调控逻辑。此外,计算预测的主导、实验数据和验证的普遍缺乏以及目前专门针对古菌转录调控的专用和精心整理的数据库的缺失,代表了该领域的重大限制。这些挑战推动了基于能量的新结构方法来识别启动子区域,超越简单的序列保守性,凸显了进行更深入的、基于功能的研究的迫切需要,以揭示嗜盐古菌中启动子功能和架构的真正多样性和逻辑。要实现对这些系统理解的指数级飞跃,必须通过开发专门训练的预测工具(如近期开始出现的大规模in silico分析和AI驱动框架)来应对这些挑战。这将有助于统一标准、标准化方法论并改进古菌调控库的功能注释。
转录因子是微生物基因调控的核心,在古菌、细菌和真核生物之间表现出不同的特征。虽然计算工具对于全基因组注释不可或缺,但其在识别嗜盐古菌完整转录因子库方面的功效仍受几个关键因素限制。首先,古菌特异性PFAM模型的覆盖不足。当前的DBD图谱主要来源于细菌模板,经常无法捕捉古菌域固有的独特调控基序。其次,传统的基于序列相似性的方法对快速进化的调控元素表现出系统性偏倚。在嗜盐古菌中,适应极端环境波动的需要驱动了显著的序列分歧。因此,这些工具经常遗漏偏离保守共有序列的新颖或高度特化的转录因子,导致对嗜盐古菌调控景观的低估。
此外,生物信息学分析的结果可能因使用的基因组组装、采用的数据库版本以及注释流程的差异而产生变异性,所有这些都可能影响可重复性。尽管如此,对可比数据集的分析通常产生大致一致的整体趋势。
在此背景下,新兴的人工智能方法代表了一类新的、快速发展的工具,可能有助于解决传统基于序列相似性方法的一些局限性。通过整合序列、结构和基因组背景信息,这些模型代表了识别高度分歧或谱系特异性转录因子的有前途的解决方案,这些转录因子可能逃避传统BLAST或HMM框架的检测。因此,AI驱动方法可能改善嗜盐古菌调控蛋白的注释并帮助减少对其调控库的低估。然而,其预测性能仍依赖于训练数据集的质量和代表性,以及适当的基准测试和验证。
关于转录因子出现,微生物复杂性、环境因素和生活方式显著影响转录因子库。因此,已描述了不同比例的酶活性和毒力活性。此外,古菌比细菌含有更少和更小的转录因子,使用不同的调控库。进化选择压力可能驱动了古菌转录因子适度的结构、功能和库水平变化。一般而言,古菌与真核生物的基础转录机制高度相似,同时也与细菌共享调控机制。这支持古菌和细菌域在进化早期分歧、古菌域的一些成员可能产生真核生物的假设,如近期假设。
尽管嗜盐古菌中许多转录因子已被表征,仍有若干问题有待回答:嗜盐古菌微生物如何在高度动态环境中进行高效调控?基因调控冗余提供什么进化优势(如TrmB-IcIR-GlpR)?若干研究聚焦于不同调控层和转录网络如何协调实现代谢灵活性。简化遗传学与高通量测序技术(如ChIP-seq和RNA-seq)的结合系统性表征了不同嗜盐古菌的转录因子库。然而,大多数研究依赖于少数模式生物(主要是Haloferax volcanii、Halobacterium salinarum和Haloferax mediterranei),这可能无法代表嗜盐古菌分支中存在的全部调控多样性,凸显了在其他嗜盐古菌成员中进行进一步研究的必要性。这些进展报道了不同转录因子之间的复杂相互作用,形成错综复杂的基因调控网络。基因调控冗余增强了调控灵活性和弹性,使嗜盐古菌能够快速适应环境波动。转录因子功能的重叠以及顺式-反式相互作用的灵活性可能使网络快速重布,支持极端条件下的生存和生态位扩展。对这些机制的研究不仅增进了对嗜盐古菌调控的理解,还促进了新分子工具的开发。尽管本综述仅关注转录因子对基因表达的转录调控,但基因调控的其他层面也发挥重要作用,包括转录本加工、双组分系统、小RNA、核糖开关、基于组蛋白的调控和转录后修饰。这些机制共同代表了需要进一步研究的嗜盐古菌有前景的研究领域。
嗜盐古菌中的蛋白-DNA相互作用在极端离子条件下发生,需要独特的分子适应。它们由静电屏蔽、离子再分布和水合效应的组合调控。高盐浓度减少带负电荷DNA与嗜盐蛋白高度酸性表面之间的静电排斥,使结合得以实现。此外,复合物形成时结构化水分子的释放和离子的位移促进熵驱动的结合过程。离子特异性效应可进一步调节亲和力和特异性。然而,盐对结合热力学的精确贡献以及不同DNA结合蛋白之间的机制多样性仍然 poorly理解。未来研究应专注于扩展结构、生物物理和体内功能研究,以揭示嗜盐菌中调控的分子原理。而且,阐明DNA拓扑、蛋白稳定性和蛋白-DNA结合机制之间的协同作用是嗜盐古菌进一步生物物理和结构研究的关键优先事项。
为弥合当前对嗜盐古菌调控理解的差距,该领域必须转向下一代高通量技术的系统整合。虽然传统RNA-seq和ChIP-seq已为模式生物中转录因子库提供了基础图谱,但单细胞转录组学的实施对于解析使嗜盐古菌在波动高盐生态位中茁壮成长的细胞异质性和代谢可塑性可能是必不可少的。此外,基于CRISPR的功能筛选的部署将有助于克服功能冗余的挑战和简化遗传学的缓慢步伐,允许在密集基因调控网络中快速识别必需调控因子。这些先进的功能工具,结合解析高盐条件下蛋白-DNA相互作用的新兴生物物理技术,对于超越基于序列的预测走向真正机制性和域范围理解的嗜盐调控逻辑至关重要。采用这些方法学将增进我们对极端微生物生物学以及嗜盐适应和嗜盐古菌基因调控分子机制的知识。理解这些适应对于开发用于合成生物学和高盐条件下工业生物技术的耐盐调控回路至关重要。
本综述强调了嗜盐古菌转录调控的现状,并强调了仍有待探索的广阔领域,特别是在理解转录因子库的作用、它们通过基因调控网络的具体联系以及蛋白-DNA相互作用的分子决定因素方面。这些因素共同塑造了支撑代谢适应的复杂调控网络,并将嗜盐古菌突出为探索极端盐环境中转录调控进化和工程的独特模型。