决定新兴双金属氧酶超家族对金属依赖性的因素

《Journal of the American Chemical Society》:The Factors Governing Metal Dependence of an Emergent Superfamily of Bimetallic Oxygenases

【字体: 时间:2026年05月10日 来源:Journal of the American Chemical Society 15.6

编辑推荐:

  高分辨率图像 下载MS PowerPoint幻灯片 金属酶超家族通常根据其蛋白质骨架和活性位点进行定义。由于蛋白质结构的高度可调性,同一超家族的成员可以使用相同的金属辅因子催化多种不同的反应。某些超家族,如氨基水解酶相关的双核氧酶(AROs),通过利用多种金属辅因子展现

  高分辨率图像
下载MS PowerPoint幻灯片

金属酶超家族通常根据其蛋白质骨架和活性位点进行定义。由于蛋白质结构的高度可调性,同一超家族的成员可以使用相同的金属辅因子催化多种不同的反应。某些超家族,如氨基水解酶相关的双核氧酶(AROs),通过利用多种金属辅因子展现出更高的多功能性。我们已经证明,某些AROs可以使用二铁、二锰和/或混合锰-铁辅因子进行单加氧反应,但决定特定辅因子选择的分子因素尚不清楚,且该超家族在生物学中的分布范围也不清楚。在此,我们报告了生物信息学分析结果,将ARO超家族扩展到了大约17,000个独特的UniProt序列,远远超过了之前鉴定出的酶的数量。通过整合结构、光谱和热力学分析,并利用生物信息学 pipeline 识别关键的二级和三级结构残基,我们能够预测大多数已报道的ARO序列的金属偏好。这些注释通过对多个新ARO的表征得到了验证,其中包括一些参与天然产物生物合成关键氧化步骤的酶。这项研究建立了 ARO 中金属偏好的关键结构-功能关系,并强调了它们在众多生物过程中的重要作用。

**引言**
几乎一半的酶被认为需要金属辅因子才能发挥其功能。(1?3) 这些金属酶通过将金属中心与高度可塑的蛋白质骨架结合,扩展了这些金属离子介导水解反应、电子转移、多种自由基介导的反应以及氧化 C–H 键激活的能力,从而实现了显著的催化多样性。(4?7) 它们的结构和活性位点共同定义了不同的酶超家族。例如,超过770,000种不同的蛋白质被归类为自由基 S-腺苷甲硫氨酸(SAM)超家族,该家族具有一个三磷酸异构酶(TIM)桶状结构域,其中包含一个特征性的 CxxxCxxC 模基,用于配位 [4Fe-4S] 辅因子。(8?11) 现代基因测序技术和生物信息学技术的迅速发展使得对酶超家族进行全面自上而下的分析成为可能。然而,实验生化研究的进展速度要慢得多,导致许多蛋白质(超)家族尚未得到充分鉴定或注释。(12,13) 在极少数情况下,(14?16) 同一超家族内的酶会进化出使用不同的金属辅因子。研究这种单一骨架内适应不同金属辅因子的能力为蛋白质工程和生物催化提供了巨大潜力(17?19),因为它提供了一种相对直接的方法来理解蛋白质结构如何适应新的辅因子及其伴随的功能。Fe/Mn 超氧化物歧化酶(SOD)(20) 家族中的蛋白质使用单核辅因子,这些辅因子可以是 Fe、Mn 或过渡性的。(21) 活性位点的这种元素多样性要求对蛋白质组成进行重大修改,以适应不同辅因子的化学特性。大量研究表明,活性位点的金属偏好与一系列二级结构残基密切相关(20,22),这些残基被认为可以微调辅因子的氧化还原电位以及与其一级配位球相关的氢键网络。(23?25) 很少有含有氧化还原活性双核辅因子的酶超家族能够容忍多种辅因子。(26) 核苷酸还原酶 β 亚基(RNR-β)超家族(IPR000358)是一个关键例外,因为它包含特异性针对二铁(Ia 类)、(27,28) 二锰(Ib 和 Id 类)(29?31) 以及异金属 MnFe 辅因子(Ic 类)的蛋白质。(32) 虽然 RNR-β 本身的化学反应是非酶性的,但这些双金属辅因子和蛋白质结构与那些介导氧化 C–H 键激活过程的二铁依赖性酶非常相似,包括甲烷羟基化、(33?35) C–C 键断裂(36,37) 和 N-氧化反应(38,39)。这表明这些家族中的未鉴定酶可能使用非典型的二锰或混合锰-铁辅因子。事实上,已知 R2 类配体结合氧化酶(R2Lox)和与死亡结构域相关的衣原体蛋白(CADD)可以被 MnFe 辅因子激活。(40?43) 然而,由于该蛋白家族中没有表现出不同活性位点金属偏好的同源酶,因此无法进行类似的比较研究,就像在 SOD 家族中所做的那样。

最近发现的氨基水解酶相关的双核氧酶(AROs)在建立决定金属偏好的结构-功能关系方面具有巨大潜力。(44?48) 已经生化鉴定的 AROs 被证明能够在包含锰和铁各种组合的双核辅因子上进行酶促 C–H 键羟基化反应。显著的例子包括 2-氨基异丁酸羟化酶 AibH1H2(依赖于 MnFe)、(46) 磺酸 β-单加氧酶 SfbO(过渡性)、(47) PtmU3(依赖于二铁)(44) 和二萜羟化酶 DitZ(依赖于二铁)(48)(图 1A)。已经发现了越来越多与这些酶具有显著序列同源性的假定 AROs,其中许多参与了有价值的天然产物的生物合成,例如噻唑烷-4-羧酸氧化脱羧酶(BarH, LynB7, DolJ),它们催化 Dolastatin 10 中的噻唑环的形成以及其他生物活性聚酮-非核糖体肽杂交天然产物。(49?51) 这些酶的活性位点辅因子的金属偏好尚未得到严格确定。

**结果与讨论**
**确定 ARO 超家族的广泛性**
先前的报告将 PtmU3、AibH2、SfbO 和 DitZ 鉴定为 ARO 超家族的成员,并基于序列相似性,将 BarH 类噻唑烷-4-羧酸氧化脱羧酶 LynB7 和 DolJ 识别为潜在的 AROs。此外,我们之前的生物信息学分析通过它们与 Rieske 铁硫蛋白的基因组关联,鉴定出了 3,307 个候选 ARO 序列。(45?47) 在此,我们首先尝试通过传统的序列分析来识别能够定义 ARO 超家族的特征肽序列基序。对之前报道的 3307 个候选 AROs 的多重序列比对(MSA)显示,除了蛋白质序列的 N 端和 C 端附近高度保守的残基外,序列相似性较低(图 S1)。由于所有已知的 AROs 的蛋白质结构都属于 PF04909 蛋白质家族(氨基水解酶_2),该家族还包括生化鉴定的水解酶和脱羧酶(52,53),我们首先试图识别 ARO 特有的序列基序。在已鉴定的 AROs 中,发现了一个保守的 N 端 D-x-H 基序(图 1 B 和 C),它为 Site 1 金属离子(M1)提供了两个配位氨基酸残基。已鉴定的 AROs 的晶体结构表明,这个基序位于 TIM 桶状结构的第一个 β 可以保证上,这是氨基水解酶-2 结构的特征。(54) 相比之下,所有使用这种蛋白质结构的先前鉴定的脱羧酶和水解酶都具有不同的 N 端序列基序(例如 LigI、LigJ、GraF)(55?57),并且这些蛋白质的结构研究表明,它们的活性位点金属离子并不与 D-x-H 基序结合(图 S1)。这一分析表明,这个短的 N 端基序可能作为在计算机上定义 AROs 的一个标志。

**检查 ARO MSA 中强烈保守的 C 端区域**(图 S1)发现多个辅因子配位残基位于一个环上。这些氨基酸残基——一个组氨酸和两个羧酸残基——主要构成了 Site 2 金属离子(M2)的结合位点(图 1B 和 C)。这些残基存在于所有生化鉴定的 AROs 中,并表现为 D-x–P-H-x-D/E 氨基酸序列基序。最后一个氨基酸位置的变异性源于观察到 PtmU3 的晶体结构(图 1C)显示一个谷氨酸残基(IIGlu)直接与 M2 结合,而所有其他已鉴定的 AROs 在这个位置都有一个天冬氨酸残基(IIIAsp),后者与 M2 结合的水合配体形成强烈的氢键相互作用(44?47)。重要的是,这种氨基酸序列在任何具有 PF04909 蛋白质结构的已鉴定水解酶或脱羧酶中都不存在(图 S1),因此我们暂时将其视为 AROs 的一个区分特征。

我们试图利用这个 C 端基序来估计当前 ARO 蛋白质家族的规模。使用 ScanProSite 过滤了 2024年4月存入库 UniProt 的所有带有 PF04909 标签的蛋白质序列,这些序列都包含 D-x–P-H-x-D/E 基序。(58) 为了降低假阳性率,我们将搜索限制在仅包含足够氨基酸残基(约 200 个氨基酸)的蛋白质上,以构建底层的 TIM 桶状骨架(图 S2)。(59) 这种分析识别出大约 17,000 个潜在的 ARO 基因,几乎全部来自原核生物的基因组和质粒(见下文)。对这些序列的 MSA 分析表明,其他四个配位 M1 的残基(图 S3)的保守性超过 99%,包括 N 端的 D-x-H 基序。这表明:(a) 这 17,000 个序列几乎全部具有已鉴定 AROs 中发现的六个/七个金属配位残基;(b) PF04909 家族的典型非氧化还原酶在活性位点使用不同的残基集。(60,61) 然而,大多数这些基因产物被注释为“假定的氨基水解酶”。因此,我们认为这些基因产物目前的注释是错误的,我们的分析支持将它们重新注释为“假定的双核氧酶”。我们预计,这个特征性的 ARO 氨基酸基序的简洁性应该使其能够在未来的基因组注释工作中得到直接应用。

**确定 variably metalated SfbO 的还原潜力**
我们和其他人已经证明,一些 AROs 要么 (a) 需要二铁辅因子,要么 (b) 需要异金属 MnFe 辅因子,或者 (c) 是过渡性的,并可以使用多种锰和铁的组合来构成具有酶活性的蛋白质制剂。(44,46?48) 之前的生物信息学分析识别了潜在的 AROs,但没有提供关于决定活性位点金属辅因子独特金属依赖性的分子属性的见解。这些 AROs 中的高自旋 MnII 和 FeII 离子之间的一个根本区别在于它们氧化的相关热力学性质不同。例如,MnIII-EDTA 和 FeIII-EDTA 的一个电子还原电位分别为 820 mV 和 100 mV,相差约 0.7 V。(62,63) 此外,在 Fe/Mn SOD 超家族中,与锰特异性 SOD 蛋白质结合的 FeIII 的一个电子还原电位比与铁特异性 SOD 蛋白质测得的电位低约 400 mV,尽管这两种蛋白质在结构上非常相似。(23) 因此,我们假设使用氧化还原活性 Mn 离子的 AROs 必须具有与不能使用 Mn 离子而需要二铁辅因子的 AROs 不同的氧化还原性质。为了验证这一假设,我们首先研究了 SfbO 的氧化还原性质,其双金属活性位点可以用 Fe2 或 MnFe 辅因子完全金属化。我们发现,N,N,N’,N’-四甲基-对苯二胺(TMPD)与这些 variably metalated 形式的 SfbO 结合时,会导致 UV–可见光谱和电子顺磁共振(EPR)光谱的可重复变化,表明存在良好的氧化还原平衡。TMPD 可以被一个电子氧化(E0’ = +276 mV,在 pH 7 下),生成一个自由基阳离子(TMPD*),该阳离子在无氧条件下在 611 nm 处有强烈的可见吸收带,并且无限稳定。(64?66) 当无氧的 TMPD 溶液与 SfbO 结合时,从生成的 UV/可见光谱中可以明显看到 TMPD* 的形成(图 2A),但 TMPD* 的形成程度取决于活性位点中存在的金属。TMPD 和两当量 FeIII2 金属化的 SfbO 的解决方案产生的 TMPD* 明显较少(约 0.06 当量),而类似地制备的含有 MnIIIFeIII 金属化的 SfbO 的溶液产生的 TMPD* 显著更多(约 0.66 当量 TMPD*)。

**图 2**
图 2. MIII2-SfbO 与 TMPD 的反应性。(A) UV/可见光谱显示了 TMPD 与 FeIII2-SfbO(黑色)反应时生成 TMPD* 自由基的情况,与 MnIIIFeIII–SfbO(红色)相比。缓冲溶液(50 mM HEPES,pH 7.0)中的200 μM MIII2-SfbO与100 μM TMPD在厌氧条件下混合,并在数据收集前至少平衡15分钟。(B) Fe2III-SfbO(黑色)和厌氧条件下加入十当量TMPD(红色)的EPR光谱。顶部轴表示g值。光谱在15 K和20 mW微波功率下收集。(C) MnIIIFeIII–SfbO(黑色)以及加入两当量(红色)或十当量TMPD(蓝色)的EPR光谱。未观察到可归因于自旋耦合的MnIIFeII物种的新信号。光谱在15 K和0.6325 mW微波功率下收集。高分辨率图像下载MS PowerPoint幻灯片

在这些条件下,TMPD*的紫外-可见特征在3小时后未发生变化。这些观察结果表明,SfbO的两种金属化形式都能迅速氧化TMPD,但SfbO的MnIIIFeIII金属化形式作为氧化剂比其FeIII2金属化形式更具热力学优势,这与FeIII离子被MnIII取代的情况相符。为了确定这种电子转移反应的化学计量比,我们对含有TMPD和不同程度金属化SfbO的类似溶液进行了EPR研究。FeIII2-SfbO的X带EPR光谱是无特征的(图2B),但与十当量TMPD混合后,在g ~ 2处观察到尖锐特征,在g < 2处观察到宽特征。前者特征容易归因于有机自由基TMPD*,后者特征可归因于包含反铁磁耦合FeIIFeIII辅因子的S = 1/2自旋系统。具有d5-d6电子构型的混合价二铁二聚体通常在g值≤ 2处呈现EPR特征,这是由于亚铁离子的有效g值的各向异性。这一观察结果表明,TMPD通过单电子转移与Fe2III-SfbO反应生成混合价FeIIFeIII–SfbO。

如之前报道的,MnIIIFeIII金属化SfbO的X带EPR光谱在g ~ 2处包含一个多线峰,这归因于反铁磁耦合的S = 1/2自旋系统(图2C)。向这些溶液中依次添加两当量和十当量TMPD,会导致与多线峰相关的光谱强度逐渐减弱,同时伴随着与TMPD*相关的强烈g ~ 2特征的出现。与MnFe簇相关的信号减弱与TMPD介导的单电子还原过程一致,生成了具有偶数整数总自旋的EPR沉默的MnIIFeIII形式。如果TMPD能够进一步将MnIIFeIII–SfbO还原为MnIIFeII–SfbO,我们将预期会出现与这种奇数整数自旋系统相关的新的EPR特征。但在过量TMPD存在的情况下未观察到这种情况,这支持该试剂仅能够将SfbO的MIII2金属化形式还原,而不能将其还原为MII2金属化形式。值得一提的是,混合价MnIIMnIII金属化SfbO对强还原剂亚硫酸氢钠具有不寻常的稳定性,这归因于形成了一个电子 donnating 的桥接氢氧化物配体。总的来说,这些观察结果突显了在AROs中混合价MIIMIII形式辅因子的不寻常稳定性。

由于TMPD与FeIII2-SfbO或MnIIIFeIII–SfbO的组合能够生成稳定的平衡混合物,我们通过紫外/可见光谱或EPR光谱进行了滴定,以确定它们在pH 7.0下的单电子中点还原电位(Em)。脱气的MIII2-SfbO在厌氧条件下与已知浓度的TMPD孵育,并通过测量611纳米处的累积TMPD*自由基来量化平衡常数(图S4)。得到的数据表明,FeIII2-SfbO和MnIIIFeIII–SfbO的Em值分别为112 ± 13 mV和274 ± 7 mV。值得注意的是,这种电位差(ΔEm = 162 mV)小于已观察到的单核Mn-SOD酶的电位差(ΔEm ~ 500 mV),这与SfbO能够使用这两种辅因子催化羟基化反应的能力一致。我们推测,SfbO蛋白骨架已经进化为部分“平衡”活性位点的氧化还原性质,类似于已知可以使用Fe或Mn互换的Cambialistic SOD。

鉴于用TMPD确定SfbO的氧化还原性质非常简单,我们试图利用这一实验来量化整个酶超家族中不同ARO蛋白的氧化还原性质。我们预期这一实验现象可能与任意ARO蛋白优先使用Fe2辅因子或含有FexMn(2-x)辅因子(x = 0,1)的能力相关。我们按照先前的协议表达、纯化并重构了所有先前表征的含有二价铁辅因子的ARO蛋白,并通过ICP-OES确认了它们的金属离子含量(表S1)。我们选择将这些氧化还原研究限制在Fe2金属化的ARO上,因为只有一部分这些酶被发现支持氧化还原活性的MnFe辅因子(见下文),并且每种酶在体外都能可靠地与二价铁辅因子金属化。我们首先确认每种FeIII2金属化的ARO在厌氧条件下与TMPD结合时会产生归于混合价FeIIFeIII辅因子的EPR信号(图3A,图S5)。这表明所有测试的ARO在参与其二价铁形式的单电子还原过程方面表现相似。

图3
(A) 加入5 mM TMPD后Fe2金属化ARO蛋白的X带EPR光谱。黑色,PtmU3;红色,AeDitZ + 1 mM去氢枞酸(DhA);蓝色,RrDitZ + 1 mM DhA;绿色,A0A1M6UX50;紫色,W7L2Y2;金黄色,D3EI84;青色,SfbO。顶部轴表示g值。光谱在15 K和20 mW微波功率下收集,除了AeDitZ(0.6325 mW)。
(B) 测量pH = 7.0时Fe2金属化ARO蛋白的Fe2III-FeIIFeIII的还原电位。每种蛋白的Em’是在至少三种不同TMPD浓度下测量的(图S4)。误差条表示标准偏差。Uniprot ID缩写分别为W7L(W7L2Y2)、D3E(D3EI84)和X50(A0A1M6UX50)。
(C) 在空气中长时间暴露后MnFe金属化ARO蛋白的X带EPR光谱。所示光谱是在63.25 mW(前三种)或0.6325 mW(后四种)微波功率下收集的,以说明在高电位ARO中几乎无法归因于MnIIIFeIII信号的特征,而在低电位ARO中则容易生成这些STOT = 1/2的EPR信号。

对测试的ARO进行的氧化还原滴定表明,测量得到的Em’(FeIII2/FeIIFeIII)值与其相应的单加氧活性所建立的金属依赖性相关。例如,已知使用Fe2辅因子进行C–H键羟基化的ARO,如来自Pseudomonas或Rhodococcus菌的PtmU3和DitZ酶,其Em’值分别为(241 ± 6、206 ± 6和193 ± 6 mV),明显高于偏好Mn的羟化酶SfbO的Em’值(112 ± 13 mV)(图3B)。我们团队之前鉴定的另外两种功能未知的ARO(UniProt代码:W7L2Y2、D3EI84)的Em’值与SfbO相当。由于这些蛋白质组之间的Em’值有显著差异,因此我们将这些蛋白质分别称为高电位ARO蛋白(HARO:PtmU3、DitZ、A0A1M6UX50)和低电位ARO蛋白(LARO:SfbO、W7L2Y2、D3EI84)。

鉴于HARO和LARO蛋白之间的Em’值相差很大(Δ = 130 mV),以及ARO已建立的可变金属依赖性,我们推测只有LARO能够在活性位点使用Mn离子进行酶催化。为了验证这一点,我们试图评估这些MII2金属化的ARO(M = Fe, Mn)的O2反应性,因为所有已知的ARO都使用O2作为各自的化学反应氧化剂。首先,我们通过在厌氧条件下将图中列出的无金属形式的蛋白质与1当量的MnII和FeII混合,生成了不同金属化程度的活性位点的原位统计混合物。在这里需要指出的是,FeII和MnII离子的巨大动力学不稳定性使得无法纯化/分离任何这些离散的MII2金属化形式。因此,研究任何MII2金属化ARO(M = Fe, Mn)的独特反应性时必须假设金属离子与溶剂发生了交换。

在这个孵育步骤之后,我们假设O2暴露的过程将取决于辅因子的确切金属化状态,但特别有助于我们理解这些ARO的混合MnFe金属化形式的反应性。对于FeII2金属化的ARO,我们预期辅因子最终会被2个电子氧化,生成一个EPR沉默的FeIII2辅因子,正如许多Fe2依赖的氧合酶所发现的那样。对于MnII2金属化的ARO,我们预计不会观察到与O2的直接反应。对于异种双金属MnIIFeII金属化的ARO,我们预计O2暴露的结果将取决于活性位的Em’:只有具有最强还原活性的ARO才会允许发生产生S = 1/2信号的氧化过程。

经过过夜的O2暴露后,1:1:1(ARO: FeII: MnII)混合物进行缓冲液交换以去除未结合的金属离子,然后冷冻,并收集它们的X带EPR光谱(图3C)。这些数据显示,以低Em’(FeIII2/FeIIFeIII)值表征的ARO产生了大量可归于反铁磁耦合MnIIIFeIII辅因子的多线g ~ 2信号。相比之下,在同样制备的、具有高Em’值的ARO混合物中收集到的EPR光谱没有显示出这种特征信号,仅显示了典型的(H2O)6MnII特征。这些化学计量研究表明,HARO蛋白无法用MnII离子激活O2,而LARO蛋白在O2暴露下容易生成MnIIIFeIII辅因子。这些结果总体表明,HARO和LARO蛋白之间存在关键差异,导致它们对双金属辅因子的反应性有所不同。

这些实验研究只是在我们的数据库级别序列分析中识别出的约17,000个独特ARO序列的一个非常小的子集上进行的。假设存在数千种独特的HARO和LARO蛋白,它们的氨基酸序列存在集体差异,从而区分了它们辅因子的无机化学性质。为了研究这一点,我们对17,000个假定的ARO序列进行了序列相似性网络(SSN)分析。当SSN的边长E值≤ 10–40时,大多数(约96%)的ARO序列包含在一个大的簇内(图4A)。实验验证的HARO和LARO蛋白在这个簇中的不同位置反映了它们氨基酸序列的显著差异(表S2)。鉴于HARO和LARO蛋白之间的实验差异,我们重新绘制了SSN,以最小的严格程度区分HARO和LARO蛋白(图4B;边长E值≤ 10–55)。两个最大的结果簇分别包含了所有研究的HARO和LARO蛋白。除了目前讨论的蛋白质外,这两个簇中唯一其他经过生化表征的蛋白质是位于“HARO簇”中的LynB7和DolJ。然而,鉴于每个簇中表征的蛋白质分布相对均匀,我们假设这些蛋白质主要被分类为HARO或LARO蛋白。这一假设产生了可验证的实验预测:例如,LynB7和DolJ可以假定为HARO蛋白,且它们活性位点的高电位不太可能允许使用Mn离子。最重要的是,如果这个假设成立,我们应该能够统计地识别HARO和LARO蛋白簇之间的系统序列差异,并将这些差异与整个超家族中观察到的不同金属依赖性和反应性相关联。

图4
ARO超家族的序列相似性网络(SSN)分析。每个节点代表具有≥ 50%同一性的序列集合。黄色钻石代表4种HARO蛋白(PtmU3、AeDitZ、RrDitZ和A0A1M6UX50),蓝色钻石代表3种LARO蛋白(W7L2Y2、D3EI84、SfbO)以及先前报道的依赖Mn的AibH2。(46) 在(A)中,E值≤10–40时绘制边缘线,在(B)中E值≤10–55时绘制边缘线。高清晰度图像下载MS PowerPoint幻灯片

为了评估HARO和LARO序列相似性网络(SSFN)簇中包含的蛋白质集合之间的差异,我们开发了一种简单而强大的序列协方差分析方法(技术讨论和相关脚本文件见支持信息文件)。简而言之,使用17,000种假定的ARO蛋白的MSA为每个氨基酸分配了对齐位置(图S3)。包含超过30%空缺的对齐位置被从后续分析中排除。然后,将分配给HARO或LARO SSN簇的蛋白质条目合并在一起,以确定每个剩余对齐位置的氨基酸分布的协方差。由于该酶家族的序列多样性显著,基于身份的简单协方差分析并不具有启示性。相反,我们考虑了氨基酸侧链的加权平均疏水性(或电荷)来量化每个数值标识符的协方差。这种方法的灵感来自于[2Fe-2S]簇在高电位和低电位Rieske蛋白中不同的还原潜力,这被发现与活性位点周围环境中的疏水或可电离残基的存在相关。(74) 为了量化每个对齐位置的平均疏水性,我们使用了不同氨基酸从水转移到正辛醇的自由能(ΔGwoct,kcal/mol)(73),并将其值在暂定的HARO和LARO簇之间进行了比较。这些数据可以可视化为协方差图(图5A,图S6),显示平均疏水性差异(ΔΔGwoct = ΔGwoct(LARO) - ΔGwoct(HARO))与残基Cα位置到双金属辅因子中点的距离之间的关系。所有对齐位置都被映射到一个参考结构上,以获得自洽的距离矩阵。每个位置的统计显著性还使用了Cohen的d方法进行了分析(75)(图S6)。

图5
图5. ARO超家族金属依赖性的协方差分析。(A) ARO超家族MSA中对齐位置的协方差图(图S3)。排除了组成超过30%空缺的位置。X轴表示图4所示的LARO簇和HARO簇之间每个位置的平均疏水性差异,通过从水转移到正辛醇的自由能(ΔΔGwoct = ΔGwoct(LARO簇) - ΔGwoct(HARO簇))来量化。(73) Y轴表示每个位置从肽骨架Cα到双核辅因子中心点的最近距离,以SfbO结构作为参考。具有最高指示金属依赖性概率的位置应该具有较大的平均疏水性绝对差异,并且距离活性位点较近(蓝色阴影区域)。γ1–5是ARO超家族MSA中的位置#917、#1407、#2386、#2392、#2394(图S3)。活性位点的结构以及γ1附近的pCore,由ARO超家族MSA中的残基#1389、#1406、#1566、#2389组成(图S10),以及(M2II-SfbO (LARO)(PDB: 9BUA)和(M2II-RrDitZ (HARO)(PDB: 8UYR))。

高清晰度图像下载MS PowerPoint幻灯片

协方差图使我们能够严格剖析HAROs和LAROs中存在的保守氨基酸之间的差异(图5A,图S6C)。不出所料,这些约45 kDa蛋白质的许多残基要么(a)距离活性位点非常远(>20 ?远离辅因子),要么(b)在两个簇之间的疏水性没有显著差异(|ΔΔGwoct| < 1),这些残基在图中被标记为灰色,以反映它们区分金属依赖性的可能性较低。相比之下,接近图表左上/右角的对齐位置预计会对活性位的性质产生最大影响,因为这些侧链既靠近辅因子,它们的平均氨基酸组成在HARO和LARO簇之间也有显著差异。在图表的这些区域发现了五个特定的残基,标记为γ1–5(在图5A,图S6中显示为红色),由于它们靠近活性位点辅因子,它们很可能代表关键的次级球体残基。在这些残基中,有四个在LAROs中比在HAROs中表现出更强的疏水性,这与在Rieske蛋白中发现的趋势一致,即疏水次级球体表现出较低的还原潜力。作为旁注,通过比较每个对齐位置的平均侧链电荷进行的类似协方差分析仅在协方差图的相似区域中识别出了两个关键残基γ1和γ3(图S7)。下面,我们将讨论HARO和LARO蛋白上γ1–5的不同结构特征。

比较HARO和LARO蛋白的序列和结构数据突出了γ1残基的关键作用。协方差图表明,LAROs中的γ1残基平均而言比HAROs中的更为疏水(图5A,图S8和S9)。该残基对应于上述保守的N端D-x-H基序的可变部分(即,x = γ1;D-γ1–H),该基序为M1提供了两个金属结合位点(图S3)。由于这个序列基序位于TIM桶的第一个β链内,γ1残基的侧链朝向一个相邻的疏水核心(pCore)延伸(图5B和C,图S10和S11)。在结构已确定的LAROs(SfbO、W7L2Y2、D3EI84)和AibH2中,γ1被发现是一个Val/Ile残基,预计会与pCore残基有利地相互作用(图5B)。这会导致β链发生拐折,影响与M1配位的相邻Asp和His残基的构象。相比之下,HAROs中的γ1侧链是亲水的(PtmU3 – Ser;DitZ – Asp),但仍位于疏水的pCore旁边。这些不利于熵的相互作用增加了pCore和γ1之间的距离,导致β链的几何形状比LAROs中的更线性(图5B和C,图S11)。

换句话说,这些次级球体相互作用影响了金属配位的N端Asp和His残基的“咬合角度”。SfbO(LARO)中的DCβ-xCα-HCβ角度比DitZ(HARO)中的角度大20°以上,xCα-M1和DCα-M1距离分别长约1.5和0.5 ?(图5B和C)。这些结构趋势在D3EI84、W7L2Y2、AibH2和PtmU3的可用结构中也很明显,这与它们的氧化还原势/金属依赖性分类一致。观察到的不同咬合角度可能部分解释了所有静态晶体结构中N端Asp的可变性:在HAROs中,这个残基以κ2方式与M1配位,而在LAROs中以κ1方式配位。LAROs中更尖锐的咬合角度迫使Asp侧链采用单齿结合模式。

协方差分析确定γ2残基(图5A,图S6)在HAROs中比在LAROs中更为疏水。这个残基不在保守的N端或C端序列基序中,而是出现在代表ARO结构的第二个β链末端接近IAsp的位置。在HARO簇中,γ2几乎总是(>95%)为Phe或Tyr残基,而在LARO簇中,这个残基的多样性更高,但最常见的是一种小疏水性氨基酸(图S9)。在SfbO中,γ2是一个Thr残基,其醇类官能团与κ1结合的IAsp残基的非金属配位O原子形成氢键相互作用。在RrDitZ(PDB: 8UYR)和PtmU3(PDB: 6OMQ)中,没有观察到类似的氢键相互作用,而是γ2作为一个Phe残基位于κ2结合的IAsp残基旁边。显然,这些残基增强了在静态结构快照中观察到的IAsp配体可变性的差异,可能还有助于区分高电位和低电位的AROs。

协方差分析确定的第三个残基——γ3——只在HARO蛋白的一个子集中表现出差异(图S8D)。这个残基位于上述保守的C端基序上游的两个氨基酸位置(例如,γ3–x–D–x–P–H–x–[D/E]),因此位于TIM桶的第八个β链的末端。在71%的所有AROs中,γ3是一个小氨基酸(Ala、Gly、Ser、Cys)。对这些ARO的结构分析表明,小γ3残基并不直接作为辅因子的次级球体残基,而是为形成与IAsp氢键相互作用的结构水留下了空间。然而,在大约45%的HARO SSN簇中,这个残基是一个Glu残基,其较大的ΔGwoct值放大了协方差分析中计算的ΔΔGwoct差异。我们小组鉴定的DitZ酶(48)是典型的HARO酶,其γ3位置具有Glu残基。在RrDitZ的晶体结构中,这个Glu残基与κ2结合的IAsp直接形成了异常强的氢键相互作用。这种不寻常的谷氨酸-天冬氨酸氢键相互作用的作用尚不清楚。

在LARO蛋白中,芳香残基几乎仅在γ4残基中发现,但在HAROs中变化很大(图5A,图S9)。就序列而言,这个残基直接位于保守的C端序列基序(D-x–P-H-γ4-[D/E]内。在SfbO中,γ4是一个暴露在表面的Trp残基,与M2配位的IIAsp侧链形成π-堆叠相互作用。类似于在低电位Rieske簇中观察到的情况(74),这个庞大的残基可能有助于减轻来自溶剂的偶极相互作用,从而增强活性位点的电子密度并降低辅因子的还原潜力。实际上,Fe2金属化的SfbO-W341S(将γ4从Trp突变为Ser)的Em’测量值为151 ± 5 mV,比野生型Fe2–SfbO(图3B)高出约40 mV。在HAROs中,γ4的高变异性排除了对该子集酶的任何有意义的讨论,但反而强化了LARO在这个暴露表面位置观察到的芳香侧链的不寻常保守性。

协方差分析确定的最后一个残基γ5在LAROs中高度疏水,而在HARO中变化很大。有趣的是,γ5是一个高度暴露在表面的残基,其侧链不与辅因子或其配位配体直接接触。这个残基并不直接调节SfbO中辅因子的还原潜力,因为Fe2金属化的SfbO中W343S突变(将γ5中的Trp突变为Ser)对还原潜力几乎没有影响(ΔEm’ < 5 mV)。我们推测这个残基可能在与Rieske铁氧还蛋白(rFd)的蛋白质-蛋白质接口的形成中起作用,这里的数据支持这些rFd蛋白主要与LARO蛋白共同进化的假设。此前,我们注意到许多ARO的基因组邻域包含一个功能未知的rFd蛋白,但它们的保守共表达表明它们分别具有氧合酶和电子介质的功能(47)。有趣的是,这些rFd蛋白在LARO蛋白的基因组邻域中非常丰富,而在HARO的基因组邻域中几乎不存在(图S12A)。我们推测这些ARO/rFd蛋白组的功能类似于其他多组分单加氧酶,它们具有离散的氧合酶和还原酶组件(7,34)。假设这些蛋白在自然催化过程中形成瞬态蛋白质-蛋白质复合物,以促进蛋白质间的电子转移过程。支持这一模型的计算证据可以从为SfbO及其相应的rFd蛋白(UNIPROT ID: A0A540VG88;称为SfbR)计算的AlphaFold375对接模型中获得(图6A)。虽然SfbR的结构尚未通过实验确定,但该蛋白质的AlphaFold模型与其他小型rFd蛋白具有很高的相似性(74,76)。由于SfbO以四聚体(α4)形式结晶,因此计算的对接模型对应于SfbO4:SfbR4的α4β4复合物的最高评分构象。该对接模型展示了各个亚单位之间的互补界面,使得相应的双金属辅因子处于适合电子转移的范围内(约14 ?)。图6。(A) 由AlphaFold3计算的SfbO4:SfbR4复合物模型。(B) (i) 使用10 mM硫代硫酸钠厌氧还原的SfbR*;(ii) i + Fe2–SfbO(一个等摩尔蛋白质单体);(iii) i + Fe2–SfbO-W341S;(iv) i + Fe2–SfbO-W341S–W343S;(v) i + Fe2–AeDitZ的X波段EPR光谱。光谱是在15 K和0.6325 mW微波功率下收集的。高分辨率图像下载MS PowerPoint幻灯片。

在仔细检查AF3预测的SfbO-SfbR界面后,我们观察到γ5位点直接位于两个双金属簇之间,并与SfbR表面暴露的85Trp发生π堆积相互作用(图6A,插图;图S12B)。这种特定的界面相互作用不太可能是偶然的:AF3预测的另外两种结构已知的LARO(D3EI84, W7L2Y2)及其相应的rFd伙伴的对接模型(图S12C和D)也显示了类似的γ5位点上的π堆积相互作用。这些计算模型支持我们的假设,即γ5主要起到加强ARO:rFd蛋白界面的作用。

支持这一假设的实验证据来自对SfbR与SfbO及其突变体的溶液相EPR研究。SfbR蛋白被表达为麦芽糖结合蛋白(MBP)融合构架(SfbR*),并在用硫代硫酸钠还原后在其X波段EPR光谱中显示出多种特征(图6B)。这些特征与其他rFd蛋白中的Rieske簇的FeIIFeIII形式相似。(77,78) 当SfbR*与EPR沉默的FeII2金属化的SbfO结合时,g < 2处的特征明显增强,这种扰动可能是由于与SfbO的界面相互作用引起的。而当SfbR*与FeII2金属化的HARO蛋白RrDitZ结合时,后者在相应的γ5位点含有丝氨酸残基,其EPR光谱与单独的SfbR*相似。这些数据共同支持了芳香族残基γ5在ARO中的界面作用。

为了确定任意未表征ARO的金属依赖性,我们寻求建立特定的序列标准。根据上述讨论,某些残基如γ1直接影响活性部位的氧化还原性质和几何结构,可以预期它们会决定辅因子的金属偏好。然而,许多其他残基在HARO和LARO蛋白之间有所不同,例如γ5,这些残基可能具有不同的功能。为了区分这些功能并确定负责金属偏好的关键残基,我们表征了一组在γ1-5位点具有一个或多个氨基酸残基的ARO蛋白,这些残基与协方差分析中确定的保守疏水性模式不匹配或与先前表征的ARO只有部分序列相似性。

我们研究了八种新的ARO蛋白——其中三种因其疏水性γ1残基及其在SSN中的位置而被预测为LARO;五种含有亲水性γ1残基,包括三个在同一SSN簇中的蛋白,一个假定的ARO(PDB: 4DZI)位于一个独特的SSN簇中,以及另一个与LARO具有较高同源性的蛋白(图S13)。这些蛋白涵盖了不同的序列空间(表S2),与先前表征的ARO蛋白不同。每种蛋白都与一个等摩尔的Fe2+和Mn2+结合生成MnxFe2-x(X = 2,1,0)辅因子(见上文),并在空气中暴露过夜,使用与图3C中显示的EPR样本相同的制备协议。所有三种假定的LARO都产生了与MnIIIFeIII辅因子存在相关的EPR光谱(图7A)。对这些EPR特征的模拟(图S14,表S3)显示其哈密顿参数与其他已表征的LARO相似。其中一种蛋白(F4KXV9;图7B)的2.05 ?分辨率晶体结构显示DCβ-xCα-HCβ角为94度,IAsp采用了其他LARO中常见的κ1结合构象(图5B)。值得注意的是,F4KXV9中的γ5残基不是芳香族氨基酸,而是丙氨酸。这一观察进一步支持了γ5的身份并不决定辅因子偏好的假设。

图7. 其他新ARO蛋白的表征。(A) 在空气中广泛暴露后,MnFe金属化ARO蛋白的X波段EPR光谱,从上到下分别是:E0U9F9, A0A2K8M2W4, B1WQZ4, Q73XC0, F4KXV9, A0A1M6T6Z6, B6JH23。光谱是在15K和63.25 mW微波功率(E0U9F9, B1WQZ4, B6JH23)或0.6325 mW(其他五种)下收集的。在预测的HARO中,MnIIIFeIII信号可以忽略不计,而预测的LARO(底部三种)容易产生特征性的STOT = 1/2 EPR信号。(B) 二价F4KXV9活性位点的晶体结构。2Fo–Fc映射以灰色(3.0σ)显示。(C) E0U9F9介导的酶促反应,将(4R)-2-苯基-2-噻唑啉-4-羧酸(PTCA)转化为2-苯噻唑(PT),以及酶促测定的代表性UV-HPLC轨迹。(D) 每个单体用2摩尔MnII和FeII金属化的E0U9F9的活性。

剩余五种蛋白质混合物的溶液所得到的EPR光谱(图7A)没有显示出MnIIIFeIII辅因子的生成,这与它们被归类为HARO是一致的。其中一种蛋白E0U9F9与先前报道的噻唑啉-4-羧酸氧化羧化酶基因(包括BarH, LynB7和DolJ)有约60%的序列同源性(表S4)。高严格性(E值<10–100)绘制的SSN进一步表明E0U9F9与这些BarH类似蛋白最为接近(图S15A)。对该SSN簇中的序列进行的系统发育分析显示,包含BarH, DolJ和LynB7的支系相对较小,并且与包含E0U9F9的主要支系分叉。尽管这些后者蛋白中没有一种与目前已知的天然产物相关,但它们的基因组邻域显示了一个保守的(约69%的发生率)噻唑啉合成酶基因(图S15B和C)。因此,我们假设E0U9F9及相关蛋白催化噻唑啉-4-羧酸衍生物的氧化羧化。与LynB7、BarH和DolJ不同,后者在大肠杆菌中重组表达后非常不稳定,我们发现E0U9F9非常稳定,适于光谱表征,并能耐受苛刻的金属螯合条件。

我们试图确定E0U9F9催化活性的金属依赖性。我们确定这种蛋白可以由两个结合的Fe离子组成(表S1),并且在有氧条件下,在350 nm附近显示出中等强度的紫外/可见特征,这些特征归因于与二价FeIII–OHx–FeIII辅因子相关的配体到金属电荷转移(LMCT)带。(71) 在厌氧条件下加入约1.0当量的硫代硫酸钠(DT)后,这些特征减弱,并在重新暴露于空气中后迅速恢复,表明FeII2和FeIII2辅因子状态之间可以可逆转换(图S15D和E),以及FeII2辅因子的O2反应性。Fe金属化的E0U9F9被发现可以催化(4R)-2-苯基-2-噻唑啉-4-羧酸(PTCA)氧化羧化为2-苯噻唑(PT)产物(图7C),这与LynB7的报道一致。(50) 为了确定这种酶促反应的金属依赖性,我们用不同比例的Mn2+和Fe2+重建了apo-E0U9F9,并评估了每种制剂生成噻唑的活性。由于LynB7和DolJ的不稳定性和残留金属离子的污染,这些研究无法进行。(46,50,51) 我们在E0U9F9上获得的结果(图7D)与依赖二价铁组成的辅因子一致,并且与这些蛋白在HARO SSN簇中的位置相符(图4B)。

我们对这里研究的15种ARO的总体结果表明,所有LARO都支持在其辅因子上的O2依赖性MnII氧化,而HARO仅支持O2依赖性FeII氧化。因此,我们暂时将HARO蛋白归类为需要Fe2辅因子的蛋白,而LARO蛋白则偏好Mn/Fe(或Mn2)辅因子。我们对这两组蛋白中显著不同的氨基酸残基进行了评估,这些残基似乎决定了金属偏好,总结在表1中。我们确定γ1、γ2和γ4是决定ARO辅因子金属偏好的关键残基。使用表1中显示的标准,我们可以在计算机上标注大多数已测序ARO的金属依赖性。决定Mn依赖性ARO之间变化的因素尚未确定。

表1. ARO超家族金属依赖性标注标准
γ1 γ2 γ4
在本研究中研究的蛋白质数量
Mn依赖性 疏水性 亲水性 芳香族
13 15 SfbO, D3EI84, W7L2Y2, F4KXV9, B6JH23
二价铁依赖性 亲水性 疏水性 非芳香族
11,95 2 PtmU3, AeDitZ, RrDitZ, A0A1M6U 50, E0U9F9, Q73XC0, B1WQZ4, G7CFV8

很可能为Mn依赖性LARO或二价铁依赖性HARO的蛋白质都具有这三个残基(γ1, γ2和γ4)。疏水性和亲水性残基的分类基于不同氨基酸从水到正辛醇的转移自由能(ΔGwoct),如先前所定义。(73) 芳香族残基包括Phe, Trp和Tyr。

为了将这些结果放在上下文中,我们尝试将Mn依赖性和Fe2依赖性的ARO与其来源生物的分类进行关联。我们首先绘制了一个低严格性(E值<10–110)的SSN,以生成功能相似的酶簇(图8A)。(9,80,81) 该SSN的每个节点根据我们的金属辅因子预测进行着色。有趣的是,一些门几乎只使用Mn依赖性的LARO,而一些使用Fe2依赖性的HARO(图8B)。这种金属依赖性的差异可能是由它们的宿主生物和 living 环境的进化决定的。例如,许多Bacillota生物,如Lactobacillus plantarum (82) 和 Bacillus subtilis (83,84),已知维持高胞质Mn浓度,我们在这里发现来自这些门的测序ARO也主要是Mn依赖性的。相比之下,所有先前研究或在此识别的BarH类似蛋白都来源于蓝细菌或粘细菌门,后者则是Fe2依赖性的。在蓝细菌的情况下,由于Mn2+被主动运输到细胞质外用于光系统II,因此细胞质中的“自由Mn2+”浓度较低。(85?87)

图8. (A) 根据标注的金属依赖性(表1)对ARO超家族进行SSN分析并着色节点。节点代表序列同源性≥60%且E值≤10–110的序列。着色方案在(A)和(B)中是相同的。(B) 不同门中不同金属依赖性ARO的分布(仅显示最丰富的15种)。(C) ARO蛋白序列周围基因组窗口(±40 kbp)内预测的生物合成基因簇的分布。X轴代表antiSMASH预测的次级代谢物类型。(93)

这些ARO蛋白在细菌和嗜盐古菌中广泛存在,它们的显著序列变异表明了其功能的多样性。虽然许多围绕这些ARO的基因组邻域表明它们的功能与代谢物分解有关(例如,AibH1H2参与2-氨基异丁酸的利用),但我们推测其他ARO可能在生物合成基因簇(BGCs)中发挥作用(例如,PtmU3和DolJ)。我们在Uniprot数据库(88)和PaperBlast(89)中进行了详尽的文献回顾,发现了多个涉及ARO参与BGC的报道。例如,MscE是抗真菌微生物产物sclerodermin的BGC中的HARO,(90) 多个HARO基因(SorK, SorR, SorS)存在于sorangicins的BGC中,(91) 以及来自Streptomyces sp. WM6386的一个未命名LARO(Uniprot: U5YQT4)参与磷酸酯BGC。(92) 为了更好地量化ARO在天然产物生物合成中的参与度,我们使用antiSMASH(93)进行了整个超家族的计算分析,以识别所有包含在已知BGC中的ARO。在大约17,000个假定的ARO序列中,我们发现约1,600个基因参与生成超过40种类型的次级代谢物(图8C)。这些蛋白质大多分布在不同的门中(放线菌门、假单胞菌门、蓝细菌门和粘细菌门),这些门包含与经典BGC相关的生物。我们希望这里的基因识别将有助于理解ARO的生物合成潜力。

研究表明,含有双金属辅因子的氧化酶可以催化需要多次电子/原子转移的复杂反应,它们的金属组成多样性进一步丰富了它们的化学性质。ARO超家族的规模和特性在本报告中得到了明确界定,这一超家族为研究金属依赖性的结构-功能关系提供了独特的机会。我们的研究表明,这些酶活性位点的氧化还原性质与其金属依赖性以及活化氧气的能力之间存在关联。我们开发了一种适用于超家族层面协方差分析的生物信息学方法,结合实验数据与机制层面的见解,能够预测所有已知ARO蛋白的金属依赖性。这些发现有望为未来关于ARO在健康、疾病和农业中多种作用机制的研究提供重要推动。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号