经过数亿年的进化,天然酶已经形成了适合生物体生存的功能核心,但它们并不一定在工业条件下对特定化学反应具有最高的催化效率(Sheldon 和 Woodley, 2018; Lovelock 等, 2022; Lister 等, 2025)。因此,研究人员不再局限于发现天然酶,而是积极设计针对特定应用的酶(Arnold, 2018)。为此,定向进化作为一种强大策略应运而生,旨在通过提升关键生物催化性质(如稳定性、活性和选择性)来克服催化效率不足、底物范围狭窄以及在非生理条件下的稳定性差等问题(Forget 等, 2025; Sun 等, 2022; Bell 等, 2022; Zhang 等, 2022)。这些进展促进了工程酶的广泛应用,从而彻底改变了生物技术和生物医学研究等领域(Turner, 2009; Hafeez 等, 2020)。因此,开发适用于广泛情况的定向酶工程方法具有重要意义。然而,由于天然酶的高分子量、多结构域特性以及复杂的底物结构,对其进行进化仍然具有挑战性(Soskine 和 Tawfik, 2010; Geddie 和 Matsumura, 2004)。即使已知底物结合口袋的位置,对覆盖该口袋的所有残基进行突变仍需要大量时间,更不用说随之而来的组合爆炸性问题(Wang 等, 2021)。此外,酶的催化活性还依赖于动态的残基相互作用,而不仅仅是静态的活性位点(Otten 等, 2020; Acevedo-Rocha 等, 2021; Bhattacharya 等, 2022; Gutierrez-Rus 等, 2025; Marshall 等, 2023)。因此,如果没有高通量筛选能力,对大量突变库的实验分析将需要巨大的资源,尤其是在处理大型酶的组合复杂性时(Zhang 等, 2022; Marshall 等, 2023; Yu 等, 2022)。因此,缩小序列搜索空间至关重要,这推动了许多方法的发展,以设计有针对性的突变库来指导定向进化(Bhattacharya 等, 2022; Gutierrez-Rus 等, 2025; Marshall 等, 2023; Khersonsky 等, 2018; Wijma 等, 2015)。
在这种情况下,核磁共振(NMR)光谱提供了一种互补策略,它能够在催化条件下直接分析催化参数和特定残基的化学环境(Otten 等, 2020; Bhattacharya 等, 2022; Hu 等, 2021)。通过研究溶液中的酶的 apo- 和 holo- 状态,NMR 可以捕捉到活性位点,从而将进化工作集中在与催化相关的残基上,促进酶的定向进化(Bhattacharya 等, 2022; Gutierrez-Rus 等, 2025)。此外,NMR 光谱还可以解析酶在含有辅因子的催化条件下的特定残基化学环境(Mainz 等, 2013)。特别是 2D [13C,1H]-异核多量子相干(HMQC)实验是一种强大的工具,可以探测疏水核心和功能位点的化学环境(Tugarinov 等, 2007; Ruschak 和 Kay, 2010; Korzhnev 等, 2004),使其特别适合用于定向进化研究中的关键活性位点检测。这是因为疏水残基的甲基对局部构象变化非常敏感,即使在大型分子系统中也能揭示蛋白质动态或别构网络的微妙变化。然而,对这些活性位点的分配仍然具有挑战性,尤其是对于大型酶而言,由于快速的横向弛豫速率,标量磁化转移效率较低(Frueh, 2014)。尽管可以使用甲基-横向弛豫优化光谱(TROSY)NMR 或稀疏核奥弗豪泽效应(NOE)等方法来处理大型系统,但这些方法通常需要复杂的同位素标记方案或预先获取 NOE 数据,从而增加了复杂性和成本。因此,迫切需要更有效的分配方法来促进大型酶活性位点的 NMR 分析。
在这里,我们开发了一种结合 NMR 和计算方法的混合策略,用于定位活性位点并指导大型酶的定向进化。该方法将 NMR 得出的化学位移扰动(CSPs)与计算得出的距离约束相结合,通过匹配 CSPs 和距离约束并推导结构信息,预测并分配关键活性位点,为无法进行完整 NMR assignments 的情况提供了替代方案。我们以来自嗜热古菌 Pyrococcus furiosus(PfuPol)的高保真度 DNA 聚合酶(分子量约 90 kDa)作为模型系统(Lundberg 等, 1991)。成功定位了 PfuPol 中不同空间区域的活性位点,有效缩小了序列搜索范围。对这些活性位点进行饱和突变后,生物催化功能得到了显著提升,证明了这种综合方法在大型酶定向进化中的可行性和有效性,为酶功能和进化的新基础研究奠定了基础。