《Applied and Environmental Microbiology》:Mining and engineering of ene-reductases from marine sediment metagenome for prochiral ACE inhibitor synthesis
ABSTRACT
可持续生物催化过程的发展是绿色化学的一个重要目标。烯还原酶(ERs)因其能催化活化烯烃的不对称氢化而成为有吸引力的生物催化剂,但其工业应用常受限于狭窄的底物范围和稳定性。本研究探索了南海深海沉积物宏基因组,鉴定出41个推定的ER基因,其中22个在大肠杆菌中成功可溶表达。生化表征揭示了广泛的底物特异性,对多种α,β-不饱和化合物实现了高达90%的转化率。值得注意的是,三种酶(S2gene2614772, S2gene1139, 和 S2gene22028)表现出卓越的适应性,在宽pH范围(5.5–8.5)和低温(15°C)下保持高活性。然而,野生型ERs对前手性底物2-氧代-4-苯基-3-丁烯酸(一种血管紧张素转换酶抑制剂(ACEIs)的关键中间体)均未显示出显著活性。通过定向进化,我们获得了一个突变体(S2gene22028-G102S),其活性增强了30倍,在10 mM底物浓度下达到90%转化率。放大合成(5 mmol底物)得到了浓度为11 mg/mL的2-氧代-4-苯基丁酸(OPBA),展示了工业潜力。本研究强调了海洋宏基因组作为新型ERs的宝贵来源,并为ACEI前体的合成提供了一条高效的生物催化路线。
IMPORTANCE
开发用于药物合成的可持续生物催化剂是绿色化学的一个关键目标。本研究利用南海深海沉积物宏基因组中未开发的酶多样性来发现新型烯还原酶(ERs)。我们不仅鉴定了具有广泛底物混杂性以及对低温和pH波动具有卓越适应性的强健ERs,还成功工程化了一个变体以克服合成2-氧代-4-苯基丁酸(OPBA)这一血管紧张素转换酶抑制剂关键前体过程中的关键生物催化挑战。我们的工作强调了海洋宏基因组作为发现工业相关生物催化剂的宝贵资源,并展示了将宏基因组挖掘与蛋白质工程相结合以实现高价值药物绿色生产路线的能力。
INTRODUCTION
对高效和可持续药物合成的追求使生物催化成为绿色化学中的一项关键技术,其特点是反应条件温和、环境影响小且操作简便。ACS绿色化学研究所药物圆桌会议特别强调了温和条件下的选择性氢化作为一个关键研究目标,显示了新型生物催化剂在还原碳-碳键方面的重要性。尤其是,烯还原酶(ERs, EC 1.6.99.1)因其催化活化烯烃不对称氢化的能力而引起了相当大的兴趣,这是合成有价值的工业中间体的关键步骤。然而,ERs的广泛使用仍然受到固有局限性的阻碍,包括狭窄的底物特异性、稳定性不足以及难以处理药物领域中常见的空间位阻分子。
海洋生态系统,特别是像南海这样独特环境中的微生物群落,蕴藏着由极端物理化学条件(例如高盐度、低氧和静水压力)塑造的巨大酶多样性。宏基因组方法彻底改变了获取这一未开发资源的途径,使得从未培养微生物中发现酶成为可能。最近的研究已经鉴定出具有特殊特性(如耐盐性和冷适应性)的海洋来源氧化还原酶,这些特性对于工业过程非常理想。然而,来自海洋的ERs在很大程度上仍未得到探索,这代表了扩展生物催化工具箱的一个错失机会。
2-氧代-4-苯基丁酸(OPBA),一种前手性β-酮酸,是合成血管紧张素转换酶抑制剂(ACEI)的关键中间体,包括像依那普利和赖诺普利这样的畅销药物。OPBA衍生物的常规化学合成依赖于过渡金属催化的氢化,这受到固有局限性的限制,包括贵金属催化剂的高成本以及酮基过度还原产生不良副反应。虽然ERs在理论上适合此转化,但由于苯基部分的空间位阻,没有已知的天然ERs能有效生产OPBA。这一差距凸显了发现和工程化具有定制活性的ERs的必要性。
基于我们在海洋酶应用方面的长期兴趣,以及最近在药物中间体合成方面的兴趣,我们致力于在前手性ACEI中间体合成中发现、工程化和应用海洋来源的ERs。在此,我们首次系统地研究了海洋来源的ERs用于OPBA合成。通过整合南海深海沉积物的宏基因组挖掘、高通量酶表征和迭代蛋白质工程,我们鉴定出对OPBA具有高活性的ER变体。进一步的过程优化实现了可放大的合成,证明了工业可行性。我们的工作不仅为ACEI中间体建立了一条可持续的路线,而且强调了海洋生态系统是药物应用新型生物催化剂的丰富来源。
MATERIALS AND METHODS
Chemicals and reagents
NAD(P)H、2-氧代-4-苯基-3-丁烯酸和2-氧代-4-苯基丁酸(OPBA)分别购自阿拉丁试剂(中国上海)和湖南旗帜生物技术(HNFLAG)。Phanta Max Master Mix DNA聚合酶和大肠杆菌BL21(DE3)感受态细胞购自Vazyme Biotech(中国南京)。寡核苷酸合成和DNA测序由Tsingke Biological Technology(中国北京)提供。所有其他化学品和溶剂均为分析纯或更高级别,购自Bide、Aladdin或Macklin。
South China Sea sediment metagenomic DNA extraction and sequencing
深海沉积物样品(深度2400–4000米)于2022年6月至7月期间在中山大学号考察船上的开放航次中从南海采集。使用Mag-Bind Soil DNA Kit(Omega Bio-tek, USA)提取总基因组DNA,并使用TBS-380荧光计、NanoDrop2000和1%琼脂糖凝胶电泳评估其浓度、纯度和质量。
使用Covaris M220仪器(Gene Company Limited, China)将DNA片段化至约350 bp,使用NEXTFLEX Rapid DNA-Seq Kit(Bioo Scientific, USA)制备配对末端文库。连接接头后,在中国上海麦特绘谱生物科技股份有限公司的Illumina NovaSeq平台上使用NovaSeq 6000 S4 Reagent Kit(300 cycles)进行配对末端测序。
Sequence quality control and genome assembly
使用免费的在线Majorbio Cloud Platform进行数据分析。简而言之,使用fastp从配对末端的Illumina reads中去除接头序列和低质量reads(长度 < 50 bp或质量值 < 20)。使用MEGAHIT进行宏基因组组装,该软件使用简明的de Bruijn图。长度≥300 bp的重叠群被保留为最终组装输出,随后用于基因预测和注释。
In silicometagenomic screening for novel ene-reductases
使用Prodigal从组装的重叠群中预测开放阅读框(ORFs)。提取长度≥100 bp的预测ORFs,并使用EMBOSS 6.6.0和标准NCBI遗传码将其翻译成氨基酸序列。
使用三种已知烯还原酶(OPR1 [NCBI ID: NP_001234781.1]、OYE3 [NCBI ID: NP_015154.1]和YqjM [NCBI ID: WP_255003398.1])的氨基酸序列作为查询模板,对预测的ORFs进行独立的BLASTP搜索。候选酶序列的选择基于以下标准:与查询序列的同一性在10%到80%之间,比对长度在200到600个氨基酸之间,查询覆盖率大于90%,且E值截止值<1e?10。随后,使用SMART数据库分析候选序列的保守结构域,以确认典型烯还原酶结构域的存在。本研究中鉴定的41个推定烯还原酶的氨基酸序列包含在补充材料中。
Phylogenetic analysis
使用MEGA 11软件中的邻接法构建系统发育树,自举支持基于1000次重复。随后使用Interactive Tree of Life(iTOL)平台对生成的树进行可视化和注释。
Gene synthesis and expression of the putative 41 ene-reductases
ERs的编码基因经过大肠杆菌密码子优化,由Tsingke Biotechnology Co., Ltd.(中国北京)合成并克隆到pET28a(+)表达载体中。每个基因插入NdeI和HindIII限制性酶切位点之间,以产生N端His标签的融合蛋白。借鉴相关文献,本研究采用包含“LB小规模培养(LB-SC)和TB大规模培养(TB-LC)”的两步培养系统:LB-SC筛选高活力、纯菌株的种子液,而TB-LC通过优化营养条件和环境参数促进高效产物合成。
将重组菌株的单菌落接种到含有50 μg/mL卡那霉素的5 mL LB培养基中,在37°C、200 rpm下培养5小时。然后将种子液以2%(v/v)的接种量转移到含有50 μg/mL卡那霉素的250 mL TB培养基中,随后在37°C、200 rpm下培养3小时。通过添加0.2 mM异丙基-β-d-硫代半乳糖苷(IPTG)诱导基因表达,产生目标蛋白。并在17°C、180 rpm下继续培养20小时。通过离心在4°C、12,000 × g下10分钟收集细胞。为了获得表达的重组蛋白,将细胞沉淀重悬于磷酸盐缓冲盐水(PBS; 50 mM, pH 7.5)中,并在冰上使用JY92-IIDN超声波细胞破碎仪进行超声破碎。该过程在75%功率下以脉冲模式(超声3秒,间歇7秒)进行,总持续时间为30分钟,以确保有效细胞裂解同时最小化蛋白质变性。通过离心在12,000 × g下20分钟去除细胞碎片。将含有可溶性His标签酶的上清液上样到预先用加载缓冲液(20 mM磷酸钠,500 mM NaCl,25 mM咪唑,pH 7.5)平衡的5 mL Ni-NTA柱(Sangon Biotech)上。用洗涤缓冲液(20 mM磷酸钠,500 mM NaCl,50 mM咪唑,pH 7.5)洗涤柱子以去除非特异性结合的蛋白质。然后使用洗脱缓冲液(20 mM磷酸钠,500 mM NaCl,250 mM咪唑,pH 7.5)洗脱目标蛋白。合并含有纯蛋白质的组分,并进行超滤脱盐,在此期间用50 mM PBS(pH 7.5)交换缓冲液至少2个循环以彻底去除咪唑。纯化的蛋白质用20%(w/v)甘油稳定,分装并在?80°C保存以供后续使用。分别通过SDS-PAGE和Bradford Assay Kit(Quick Start, Bio-Rad, USA)分析蛋白质的纯度和浓度。
Catalytic activity assay for overexpressed ene-reductases
通过监测340 nm处NAD(P)H的消耗来测定烯还原酶的比活性(ε = 6.22 mM?1?cm?1)。反应混合物由1 mL 50 mM PBS缓冲液(pH 7.5)组成,其中含有2 mM底物和0.2 mM NADH。通过添加0.01–1 mg酶启动反应。对于粗酶测定,将粗裂解液(100 mg湿细胞/mL)离心,并将5–50 μL上清液(对应于粗裂解液总蛋白质浓度为1 mg/mL)添加到含有2 mM底物和0.2 mM NADH的反应混合物中。通过测量340 nm处吸光度的初始变化率来确定酶活性。所有测定在30°C下进行三次。一个酶活性单位(U)定义为每分钟消耗1 μmol NAD(P)H所需的酶量。
为了考虑来自大肠杆菌天然蛋白质的任何背景活性,使用含有空pET28a(+)载体的大肠杆菌BL21(DE3)细胞按照相同的表达和裂解程序制备的粗裂解液平行进行对照反应。所有重组ERs报告的比活性是减去该背景活性后得到的净值。
Optimization of enzymatic reduction reaction conditions
初始反应条件设置如下:10 mM底物(4-苯基-3-丁烯-2-酮),50 mM PBS缓冲液(pH 8.0),12 mM NADH,反应温度30°C,反应时间16小时。反应在总体积为1 mL的2 mL离心管中进行。基于这些条件,进行了进一步优化以评估pH、温度和辅因子的影响。
General procedure for enzymatic reduction of α,β-unsaturated compounds
酶促还原反应在50 mM PBS缓冲液(pH 7.5)中进行,其中含有10 mM底物,1 mg·mL?1纯化的ERs和12 mM NADH。反应混合物在30°C、700 rpm振荡下孵育16小时。反应后,用两倍体积的乙酸乙酯萃取混合物,并用无水Na2SO4干燥。然后通过气相色谱(GC)分析有机相。或者,将混合物适当稀释,通过0.22 μm膜过滤,并进行高效液相色谱(HPLC)分析。详细的分析方法在补充信息中提供。
Protein structure prediction and molecular docking
使用AlphaFold2预测烯还原酶的三维(3D)结构。使用AutoDock 4.2将底物2-氧代-4-苯基-3-丁烯酸和辅因子FMN分子对接进入酶活性位点。选择表现出合理相互作用模式和相对较低结合能的配体-受体复合物进行进一步分析。使用PyMOL(版本2.0.7)进行结构可视化和分析。
Site-directed mutation of S2gene22028 and S1gene1252928
使用重叠延伸PCR方法进行定点诱变,引物在补充信息中提供。PCR在25 μL反应体系中进行,包含0.5–1.0 ng质粒模板,1 μL每种诱变引物(10 μM),12.5 μL 2× Phanta Max Master Mix DNA聚合酶和10.5 μL H2O。扩增方案包括:95°C初始变性3分钟,随后进行30个循环的95°C变性15秒,在Tm(非重叠序列的熔解温度)退火15秒,72°C延伸3.5分钟,最后72°C延伸5分钟。将所得质粒转化到大肠杆菌BL21(DE3)中并通过测序验证。
OPBA synthesis using ERs and their mutants
评估了12种烯还原酶及其突变体对2-氧代-4-苯基-3-丁烯酸的催化活性。每个1 mL反应混合物含有10 mM底物,12 mM NADH和1 mg纯化酶,置于50 mM PBS缓冲液(pH 7.5)中。反应在30°C、700 rpm振荡下进行24小时。适当稀释后,混合物通过0.22 μm膜过滤,并使用配备DAD检测器和Agilent InfinityLab Poroshell 120苯基-己基柱(35°C)的Agilent 1260 Infinity II系统进行HPLC分析。流动相由(A)含0.1%乙酸的H2O和(B)乙腈(21% B)组成,流速为0.5 mL/min。检测在210和280 nm进行;注意只有底物在280 nm有吸收,而OPBA没有。
Analytical methods
底物的转化和产物的形成通过GC或HPLC分析,如对每种底物所指定。每种化合物的详细色谱条件(包括仪器、色谱柱、温度程序、流动相和流速)在补充材料的第1节中提供。
对于定量,商业采购了底物和产物的真实标准品,并用于确定它们各自的保留时间。通过使用校准曲线计算所需产物的产率。
RESULTS AND DISCUSSION
Mining ene-reductases from an untapped marine resource
与发现可持续催化剂的目标一致,我们转向南海的深海沉积物宏基因组,这是一个可能拥有强健酶的极端环境。这种方法避免了资源密集的微生物培养,代表了催化剂发现的一个更绿色的起点。
为了鉴定新的ERs,我们使用了三种先前表征的酶,即OPR1、OYE3和YqjM,作为查询探针,靶向烯还原酶典型的高度保守催化(Tyr192)和底物结合残基(His187, His190, 或 Asn190)。通过对源自南海微生物群落的宏基因组数据进行基于序列的筛选,我们鉴定出41个推定的烯还原酶基因。值得注意的是,对NCBI非冗余蛋白质数据库的BLASTP搜索证实,所有这些推定酶都是先前未表征的,大多数序列与已记录的蛋白质没有显著同源性。这些推定ERs的完整氨基酸序列包含在补充材料中。
通过构建序列相似性网络(SSN)和系统发育树,我们进一步评估了41个推定ERs之间的多样性和进化关系。虽然大多数蛋白质表现出相对较高的序列相似性并紧密聚集,但有几个没有与任何参考分支共聚集,表明在序列、结构和潜在功能上存在显著差异。值得注意的是,一些酶与三个探针序列显示出特别低的同源性,暗示它们属于ER家族先前未探索的分支。
所有41个源自南海深海沉积物宏基因组的推定烯还原酶基因被克隆到pET28a(+)中,并在带有N端His6标签的大肠杆菌BL21(DE3)中表达。源自海洋宏基因组的极端酶的异源表达仍然具有挑战性,因为它们具有独特的物理化学适应性。为了增强可溶性生产,我们实施了一系列优化策略。这些努力包括调节诱导条件(例如温度和IPTG浓度)、与各种增强可溶性的标签融合以及在替代表达宿主中进行测试。最终,我们成功实现了22种重组酶的可溶表达,而其余19种主要以包涵体形式积累。然而,鉴于不溶性在粗放环境中并不一定取消催化功能,我们直接从未纯化的细胞裂解液评估了所有41种酶的活性。
如图所示,所有重组菌株的粗裂解液对模型底物2-氧代-4-苯基-3-丁烯酸都显示出可检测的活性。值得注意的是,大约一半的41种宏基因组来源的烯还原酶显示出比两种参考酶OPR1和OYE3显著更高的活性,而另一半表现出相当的水平。这些酶的活性范围从3到50 U/mg,只有一个变体表现出低于5 U/mg的活性。大多数表现出强健的活性,数值集中在20 U/mg左右,这是使用总蛋白质浓度为1 mg/mL的标准化粗裂解液测量的。这些值满足了摇瓶发酵中烯还原酶活性的常见工业阈值。例如,湖南旗帜(HNFLAG)生物技术有限公司认为高于5 U/mg的活性适用于生产规模的应用。这立即凸显了海洋遗传资源在提供可直接应用的生物催化剂方面的潜力,减少了对合成或开采催化剂的依赖。
为了准确测定重组烯还原酶的比活性并最小化来自大肠杆菌背景活性的干扰,我们选择了12种代表性酶进行纯化。这些候选酶是从22种可溶表达的酶中选出的,基于高粗裂解液活性和强表达水平。如图所示,所有12种纯化的酶在预期的分子量处显示出清晰、离散的条带,表明成功纯化且降解最小。这些结果不仅证实了这些深海沉积物来源的酶在大肠杆菌中成功异源表达,而且证明了它们的结构完整性和显著的生物催化潜力,正如后续催化研究进一步证明的那样。
Biochemical characterization of the recombinant ERs: pH, temperature, substrate concentration, and cofactor dependence
为了最大化从南海深海沉积物宏基因组获得的重组ERs的催化效率,我们系统地研究了关键反应参数,包括pH、温度、辅因子特异性和底物浓度对酶活性的影响。这些生化特性的表征对于海洋来源的酶尤其重要,这些酶通常表现出对极端环境的独特适应性,例如在非典型pH和温度条件下增强的稳定性。尽管我们的目标底物是2-氧代-4-苯基-3-丁烯酸,但由于这些新型酶对目标化合物的活性普遍较低,我们使用4-苯基-3-丁烯-2-酮作为模型底物进行初步表征。还原活性在一系列条件下进行评估:pH从5.5到8.5,温度从15到40°C,以及使用NADH或NADPH作为辅因子。反应在10 mM底物下进行,产物形成通过HPLC定量。
如图所示,对12种纯化酶的表征揭示了清洁制造过程非常需要的特性。值得注意的是,大多数酶在PBS缓冲液pH 7.5时显示出最高活性,尽管有两个变体在pH 8.0时表现出最佳活性。值得注意的是,三种酶(S2gene2614772, S2gene1139, 和 S2gene22028)表现出卓越的性能,实现了10 mM底物的近乎完全转化。此外,它们在酸性和碱性条件(pH 5.5和8.5)下保留了显著的活性,转化了≥60%的底物,突出了它们对pH变化的耐受性——这一特性可能与其海洋起源有关。整个酶组的最佳温度一致为30°C。再次,S2gene2614772, S2gene1139, 和 S2gene22028展示了显著的冷适应性,即使在15°C也保持超过65%的相对活性,强调了这些深海酶潜在的冷适应性质。
辅因子偏好测定显示,所有12种纯化酶都可以利用NADH和NADPH作为电子供体。尽管某些酶在辅因子之间观察到微小的活性差异,包括S2gene2614772, S2gene1139, 和 S2gene22028,但差异并不足以表明严格的辅因子偏好。
为了进一步检查底物耐受性,我们选择了三种最活跃的酶(S2gene2614772, S2gene1139, 和 S2gene22028),它们在10 mM时实现了完全转化,并将底物浓度增加到30 mM。不幸的是,在这些条件下未达到完全转化,产率稳定在50%到70%之间。因此,我们没有对其余九种酶追求更高的底物浓度,它们在10 mM时已经显示出不完全转化。
鉴于ERs的NAD(P)H依赖性性质,高效的辅因子再生系统对于维持催化周转和降低操作成本至关重要。在本研究中,我们采用了葡萄糖脱氢酶(bmGDH)-葡萄糖系统,这是支持ER催化还原最广泛采用的NADH原位再生方法之一。葡萄糖脱氢酶(GDH)-葡萄糖系统用于NADH再生的实施确保了催化效率,同时最小化了辅因子浪费,这是过程经济性和可持续性的关键考虑因素。
Substrate scope of the purified ene-reductases
在建立了纯化酶和优化反应条件后,我们接下来评估了12种烯还原酶在多种底物谱上不对称还原C=C键的生物催化潜力。反应在1 mL PBS缓冲液(50 mM, pH 7.5)中于30°C下进行,使用10 mM底物,NADH再生系统(0.25 mM NAD+, 50 mM葡萄糖, 和 0.25 mg/mL bmGDH)和1 mg/mL纯化酶,持续16小时。选择了一组11种带有吸电子基团的α,β-不饱和化合物,包括酯(1, 2, 5)、醛(3)、酮(4, 6, 7, 8, 11)和羧酸(9, 10, 11)。
如图所示,12种ERs对含有两个吸电子基团的底物表现出高活性。对酯底物,如富马酸二甲酯(1)和马来酸二甲酯(2),以及酮底物,包括2-甲基-2-环己烯-1-酮(