《Advanced Science》:Protein Structuromics Reveals a Loop-Controlled Half-Open Active Pocket Conformation Throughout Fe(II)/α-ketoglutarate-Dependent Dioxygenase Catalytic Cycle
编辑推荐:
Fe(II)/α-酮戊二酸依赖性双加氧酶(αKGD)超家族使其活性口袋架构能够支持各种C?H官能化反应,该架构由一个或多个环元件组成。然而,尽管这些环在特定催化过程中被推测参与底物识别或质子转移,但其在催化循环中保守的结构特征和更广泛的功能作用仍未完全明确。在
Fe(II)/α-酮戊二酸依赖性双加氧酶(αKGD)超家族使其活性口袋架构能够支持各种C?H官能化反应,该架构由一个或多个环元件组成。然而,尽管这些环在特定催化过程中被推测参与底物识别或质子转移,但其在催化循环中保守的结构特征和更广泛的功能作用仍未完全明确。在此,研究人员对αKGD超家族中的PF10014家族应用了蛋白质结构组学分析,该家族包含一个单一的长活性口袋环,因此为剖析环相关的结构-功能关系提供了一个易于处理的模型。该分析鉴定出一个名为“半开放活性口袋”的保守结构基序,该基序被认为是αKGD超家族的标志性特征。此外,针对PF10014家族代表成员——异亮氨酸双加氧酶(IDO)的增强采样模拟和诱变实验,揭示了构成半开放活性口袋架构的环在整个催化循环中的多方面作用,包括调节半开放活性口袋构象、底物识别与锚定,以及参与分子运输。这些发现提供了一个更广泛的结构-功能图景,其中该家族保守的半开放活性口袋中的柔性环作为一个具有多种功能的关键催化元件而发挥作用。
蛋白质结构组学揭示Fe(II)/α-酮戊二酸依赖性双加氧酶催化循环中环控制的半开放活性口袋构象
Fe(II)/α-酮戊二酸依赖性双加氧酶(αKGD)超家族在细胞代谢、氧感应和核酸修复等多种生物过程中扮演着关键角色。该超家族展现出的显著功能多样性源于其卓越的氧转移能力,这使得各种C–H官能化反应(如羟基化、去甲基化、环氧化和环重排)得以发生。由于其出色的催化功能,αKGD已被广泛用于从非经典氨基酸到天然产物等高价值化合物的生物合成。
有趣的是,尽管不同的αKGD成员催化多样化的反应类型,但支持这些反应的活性口袋架构共享相似的结构组成,通常包含来自家族保守的DSBH(双链β-螺旋)折叠的β-片层(β4)和一个或多个环。鉴于β-片层的显著刚性,不同成员之间的功能分化很可能与柔性环相关。例如,近期报道的αKGD超家族中与天然产物生物合成相关的酶TraH的晶体结构揭示了一个N端环,它作为“盖子”,经历底物依赖的动态构象重排,并在底物结合后进一步介导质子转移。αKGD天冬酰胺羟化酶的晶体学研究表明,其活性口袋包含两个环,其构象在底物结合态和未结合态之间存在显著差异。类似地,具有烷基化修复活性的αKGD成员AlkB的活性口袋架构也包含两个环,它们通过构象变化将烷基化底物锚定在最佳催化取向。相比之下,另一个αKGD成员异亮氨酸双加氧酶(IDO)的活性口袋仅包含一个长环,但该环同样经历构象重排以促进底物锚定。迄今为止,越来越多的证据强调了环元件在酶功能进化中的重要性。尽管这些环在不同酶中被推断参与离散功能,如底物识别或质子转移,但它们在催化循环中的保守结构特征和更广泛的功能作用仍未得到充分探索。因此,阐明构成活性口袋的环的结构和功能图景有望为深入理解αKGD超家族的功能进化提供见解。
尽管在不同αKGD成员的研究中已注意到构成活性口袋的环的功能,但这些环是否在αKGD超家族中广泛保守,以及它们在催化循环中是否执行额外作用,仍有待详细阐明。结构生物学的兴起极大地促进了基于结构的功能洞察的获取,然而αKGD晶体学数据的不足继续限制着对其结构和功能图景的探索。为解决这一问题提供了潜在方案的是,近期基于AI的蛋白质结构预测工具(如AlphaFold、ESMfold和RoseTTAFold)的激增,使得大规模蛋白质结构集的快速便捷获取成为可能。具体而言,用于检索结构同源物的工具(如Foldseek)允许探索广泛的蛋白质结构宇宙,而用于结构比较的程序(如TM-align)则可以为所检索蛋白质集内的结构关系提供见解。这种在组学水平上探索蛋白质结构景观的分析框架被称为“蛋白质结构组学”。然而,尽管探索αKGD的结构特征对其催化功能的理解至关重要,但蛋白质结构组学方法尚未应用于该酶超家族。
在本研究中,研究人员旨在调查αKGD超家族中形成活性口袋的环元件在整个催化循环中的功能作用。αKGD超家族中的PF10014家族(以IDO为代表)拥有仅包含一个长环的活性口袋,为研究αKGD超家族活性口袋的结构-功能关系提供了一个易于研究的系统。因此,该酶家族被用于蛋白质结构组学分析,通过该分析鉴定出一个名为“半开放活性口袋”的结构基序。该结构基序包含一个刚性β-片层和表现出广泛构象变化的柔性环。随后,通过增强采样分子动力学模拟指导的定点诱变揭示了IDO半开放活性口袋中环元件在整个催化循环中的多方面作用,包括活性口袋的构象调节、底物锚定以及参与底物/产物运输,并鉴定了参与这些功能的关键残基。这些发现强化了对构成αKGD半开放活性口袋的环元件的功能见解,并凸显了蛋白质结构组学在阐明多种蛋白质家族结构-功能关系方面的潜力。该研究发表在《Advanced Science》。
为开展研究,研究人员主要采用了以下几个关键技术方法:首先,应用蛋白质结构组学方法,整合AI辅助蛋白质结构预测(AlphaFold)、结构比对(Foldseek, TM-align)和聚类分析(UPGMA),系统地挖掘了αKGD超家族(特别是PF10014家族)的结构保守性与特征。其次,采用增强采样分子动力学模拟(vsREMD)来探索IDO活性口袋环的大规模构象变化,并结合定点饱和突变和动力学分析,鉴定了调控构象的“门闩”残基。最后,利用随机加速分子动力学(RAMD)模拟预测分子运输通道,并通过构建组合突变库和高通量筛选,验证了通道残基在分子运输中的作用。研究涉及的结构数据主要来源于InterPro数据库和AlphaFold蛋白结构数据库(AFDB),并以Bacillus thuringiensis来源的IDO为模式蛋白进行实验验证。
以下介绍研究结果:
2.1 PF10014家族在序列保守性低的情况下表现出高度的结构保守性
通过对PF10014家族进行序列和结构生物信息学分析,发现其成员间序列一致性普遍低于40%,表现出显著的序列差异。然而,通过AlphaFold预测的结构进行两两比较,超过99%的结构对显示出0.6至1之间的TM-score,表明家族成员间存在显著的结构保守性。结构可视化进一步显示,这些成员拥有与IDO结构中相似的核心结构域,尽管其N端或C端结构域差异很大。这些发现表明,PF10014家族成员的结构比其序列更保守,且IDO包含了该家族保守的核心结构域,是典型的家族成员。
2.2 基于蛋白质结构组学鉴定αKGD的结构特征
研究人员实施了蛋白质结构组学分析,整合了AI辅助的蛋白质结构预测、结构比对和聚类方法,对4,981个αKGD结构进行了分类。基于结构相似性距离矩阵,将αKGD结构划分为9个不同的结构簇。PF10014家族的所有成员均被归入同一个大簇(簇1)。αKGD之间的结构相似性主要归因于保守的DSBH折叠,而结构差异则主要定位于活性位点对面的区域,即环通常富集的区域。这些环与参与FeII螯合的β4一起构成活性口袋。根据活性口袋的环组成,αKGD被分为5种不同的结构类型。对代表性结构的分子动力学(MD)模拟显示,这些环比其整体结构更具灵活性。此外,分析发现相当比例(42%)的αKGD同源物的实验结构在这些环中存在残基缺失,且这些酶与各种反应相关,暗示环在αKGD催化中可能具有至关重要的作用。当视角转向整个活性口袋时,其结构特征与典型酶不同。例如,IDO的活性口袋区域表现出互补的刚性和柔性组分,这种结构被定义为“半开放活性口袋”,并被提出作为αKGD超家族的共同特征。
2.3 半开放活性口袋构象中“门闩”残基的鉴定
为了识别调控活性口袋环构象变化的关键残基,研究人员比较了常规分子动力学(cMD)和速度缩放副本交换分子动力学(vsREMD)的采样能力,结果显示vsREMD能更有效地采样IDO的大规模构象变化。通过vsREMD模拟和自由能景观分析,在300K时将IDO构象分为5个簇,主要区别在于形成半开放活性口袋的loop 2的构象。相关性分析和非共价相互作用统计表明,位于loop 2的Y100和β4片层的W168残基在维持loop 2构象中起关键作用,类似于“门闩”结构中的“铰链锁”和“固定扣”。通过对Y100和W168进行单点饱和突变和动力学分析发现,这两个位点残基的疏水性与催化常数(kcat)呈现强相关性。无论是削弱还是增强Y100和W168之间的疏水相互作用,都会导致催化效率显著降低。它们之间的相互作用必须保持在适当的强度,以确保loop 2在半开放活性口袋中开放和关闭构象之间的微妙平衡,从而支持高效的催化循环。
2.4 Loop 2中的锚定残基调控底物识别和催化活性
为验证loop 2参与底物识别和锚定的假设,研究人员通过计算模拟和突变研究鉴定了潜在的底物锚定残基。首先,确认IDO能羟基化5种疏水脂肪族氨基酸,并对L-Ile具有最高催化活性。接着,通过分子对接和MD模拟,从loop 2中筛选出10个与底物接触频率超过20%的潜在锚定残基。对这些残基进行单点饱和突变后发现,大多数变异体的活性降低,证实了这些锚定残基的重要性。同时,也识别出一些活性增强的变异体。通过对这些活性增强的变异体进行迭代突变,进一步优化了酶对不同底物的催化效率。最终获得了三个最优的三点突变体(MA1, MA2, MA3),它们对特定底物的活性分别提高了2至4倍。动力学参数表征表明,MA1和MA3的催化效率提升主要归因于米氏常数(K
M)降低,即结合自由能优化;而MA2的活性提升则主要源于周转数(kcat)增加,计算分析显示其突变增强了半开放活性口袋的灵活性,促进了底物接近生产性构象。
2.5 Loop 2中隧道残基参与分子运输
为探索loop 2是否参与底物/产物运输,研究人员采用随机加速分子动力学(RAMD)模拟,在酶-底物/产物复合物中识别了四条可能的运输隧道,所有隧道都涉及loop 2中的残基。通过量化隧道残基与配体的碰撞频率,筛选出30个潜在的隧道残基。针对这些残基(包括loop 2中的E97, V106, R107, F109等)设计了组合突变库(Tunnel-Lib),并利用基于发光的高通量筛选方法,对约5000个变体进行了活性筛选。筛选发现大多数变体活性降低,强调了这些残基的功能重要性。对少数活性增强的变体进行验证和测序,确定了两个优势突变体MT10和MT19,它们均含有loop 2中V106位点的突变。这两个突变体的催化活性提升主要归因于周转数增加,且突变残基多数远离底物。这些结果支持了loop 2参与分子运输的提议。
总结与讨论部分:本工作通过蛋白质结构组学系统性地阐明了αKGD超家族活性口袋的结构特征。研究确认αKGD超家族成员在结构上保守,归因于家族保守的DSBH折叠。广泛的结构比较进一步揭示,该超家族内的活性口袋架构相对保守。由于构成活性口袋的环通过构象变化调控其可及性,这种架构被定义为“半开放活性口袋”,并被提出作为αKGD超家族的特征性结构特征。此外,增强采样模拟引导的诱变实验揭示了IDO半开放活性口袋中loop 2的多方面作用,包括:(1) 通过构象变化调控半开放活性口袋的开/关状态;(2) 奠定底物识别和锚定的基础;以及(3) 参与底物/产物运输。这些结果表明,与环相关的半开放活性口袋不应仅被视为用于底物结合的柔性结构元件,而是作为一个整合的催化模块,将构象调节、底物定位和分子运输耦合在一起。
值得注意的是,类似的“半开放”构型在二十年前对另一种金属依赖性酶——肽脱甲酰酶的研究中已被描述。有趣的是,αKGD和肽脱甲酰酶都是生物体中的关键代谢酶。例如,作为αKGD成员的脯氨酰羟化酶在氧感应通路中快速执行羟基化反应以维持正常细胞功能,而后者则在蛋白质共翻译加工的狭窄时间窗口内执行新生肽链的脱甲酰化,以确保后续蛋白质成熟和功能化。因此,一个值得进一步探索的问题是,半开放活性口袋是否代表这些酶能够快速执行代谢任务的结构基础之一。
此外,在基于AI的蛋白质结构预测时代之前,对αKGD超家族结构-功能关系的研究受限于缺乏能够全面绘制这些酶结构景观的高通量方法。蛋白质结构组学通过利用大规模AI预测的结构数据来揭示家族范围的特征,克服了这一挑战,补充了基于序列的方法。这种方法在序列差异显著的情况下(如PF10014家族)尤其有效,对结构景观的见解增强了对结构-功能关系的理解。类似的蛋白质结构组学分析已被应用于发现基因编辑工具酶和理解病毒蛋白的功能,凸显了蛋白质结构组学在蛋白质资源挖掘、蛋白质功能进化和蛋白质工程方面的潜力。然而,当前的结构比较方法主要应用于整体蛋白质结构水平以推断结构分类关系,需要进一步发展比对算法以满足多样化的结构关系分类需求,例如本工作中研究的半开放活性口袋的局部结构比较和分类。
综上所述,本工作鉴定了αKGD超家族内保守的半开放活性口袋架构,并阐明了构成该结构基序的环的多方面功能。这些发现扩展了当前对αKGD超家族内结构-功能关系的理解,并强调了蛋白质结构组学在阐明此类关系方面的潜力,有望促进基于αKGD超家族的C?H官能化生物催化平台的发展。