《Frontiers in Molecular Biosciences》:Expanding the genetic code: phage-driven evolution of pyrrolysyl-synthetase for site-specific incorporation of synthetic phenylalanine and tyrosine derivatives
编辑推荐:
本研究利用噬菌体辅助非连续进化(PANCE)技术,成功对吡咯赖氨酰-tRNA合成酶(PylRS)进行了定向进化,显著提升了其对四种合成酪氨酸和苯丙氨酸衍生物(O-甲基-L-酪氨酸、O-烯丙基-L-酪氨酸、4-叠氮-L-苯丙氨酸、2-氯-L-苯丙氨酸)的识别与掺入效率。进化后的PylRS变体展现出数量级提升的催化活性与高底物特异性,并通过荧光报告基因和质谱分析得到验证。该工作不仅开发了用于遗传密码扩展(GCE)的高效正交翻译系统工具,也为理解与优化PylRS的底物特异性机制提供了新见解,在生物制药与基础研究领域具有重要应用潜力。
1 引言
在生命体系中,蛋白质是功能活性分子的主要类别。自然界构建蛋白质的单体通常仅限于20种标准氨基酸,以及硒代半胱氨酸(Sec)和吡咯赖氨酸(Pyl)这两种稀有氨基酸。同时,存在上千种非蛋白质氨基酸(ncAA),将其掺入蛋白质中可以改善其稳定性或活性等性质。实现遗传密码扩展(GCE)的主要策略之一是针对终止密码子(如“琥珀”终止密码子UAG)进行位点特异性的ncAA掺入,这需要外源性的正交氨酰-tRNA合成酶(aaRS)/tRNA对。其中,源自产甲烷古菌的吡咯赖氨酰-tRNA合成酶(PylRS)及其对应的tRNAPyl是应用最广泛的正交翻译系统之一。PylRS具有较大的氨基酸结合口袋且缺乏编辑结构域,这使其能够识别多种ncAA。然而,其天然形式底物范围有限,因此需要通过理性设计或定向进化来优化其效率与特异性。
噬菌体辅助非连续进化(PANCE)是一种简化且易于操作的定向进化方法,它利用M13丝状噬菌体的生命周期,将目标蛋白(此处为PylRS)的活性与噬菌体感染所必需的pIII蛋白表达相偶联,从而在选择性压力下富集活性更高的酶变体。本研究旨在利用PANCE技术,进化源自Methanosarcina mazei的PylRS及其一个嵌合体(ChPylRS),以增强其对四种酪氨酸和苯丙氨酸衍生物的特异性识别与掺入能力,为生物合成含有非经典氨基酸的蛋白质提供高效工具。
2 材料与方法
2.1 菌株与质粒构建
研究使用了多种抗生素进行筛选,并通过聚合酶链式反应(PCR)、吉布森组装、SLIC或金门组装等方法构建了系列质粒。关键质粒包括用于PANCE选择的辅助质粒(如pDB023f、pDB021CH(+)、pDB038系列等)、含有琥珀终止密码子的报告质粒pET-sfGFP-27TAG,以及表达PylRS变体的质粒pHPyl-PylRS-GlnS。使用的四种芳香族ncAA包括:O-甲基-L-酪氨酸、4-叠氮-L-苯丙氨酸、O-烯丙基-L-酪氨酸和2-氯-L-苯丙氨酸。
2.2 噬菌体文库
选择M13丝状噬菌体实施PANCE。将编码PylRS的目标基因(GOI)替换噬菌体基因组中的pIII(gIII)基因。构建了基于M. mazei的MmPylRS(mut)(含N346A/C348A双突变)和嵌合体ChPylRS(mut)(N端域来自M. barkeri,C端域来自M. mazei)的噬菌体文库。
2.3 PANCE流程
PANCE包含交替进行的阳性选择和阴性选择轮次。
阳性选择:在含有ncAA的培养基中进行。通过使用含有不同数量琥珀终止密码子的辅助质粒,逐步增加选择压力(从T7 RNA聚合酶基因中有两个终止密码子,到gIII基因中有一、二、三个终止密码子),并逐步降低培养基中ncAA的浓度(从10 mM至2 mM)。只有PylRS能有效利用ncAA氨酰化tRNAPyl并通读终止密码子,产生功能性pIII蛋白,噬菌体才能复制。
阴性选择:在不添加ncAA的培养基中进行,使用含有缺失型gIII-neg基因的质粒(pDB016+tRNAPyl和pDB007ns2a-neg)。若PylRS变体具有非特异性活性(即能利用天然氨基酸),则会表达缺陷型pIII蛋白,从而抑制该噬菌体变体的繁殖,以此剔除脱靶活性的变体。
每轮选择后,通过qPCR测定噬菌体滴度,以确保功能变体的富集。
2.4 测序与突变分析
对进化后的噬菌体池进行Illumina MiSeq平台测序,以识别PylRS基因中积累的突变。通过生物信息学流程处理数据,并与参考序列比对,鉴定出高频出现的氨基酸替换。
2.5 体内荧光检测
将进化后的PylRS变体与报告质粒pET-sfGFP-27TAG共转化至E. coliBL21 Star细胞中。报告质粒表达的sfGFP在第27位含有一个琥珀终止密码子。在添加或不添加对应ncAA的条件下培养细胞,诱导表达后,通过测量荧光强度(λex= 485 nm, λem= 528 nm)与光密度(OD600)的比值,来定量评估PylRS变体介导的ncAA掺入效率。
2.6 蛋白表达与纯化及质谱分析
将筛选到的高活性PylRS变体与报告质粒共表达,在对应ncAA存在下诱导sfGFP表达。通过镍柱亲和色谱纯化sfGFP蛋白。使用高效液相色谱-电喷雾电离质谱(HPLC-ESI-MS)对纯化的蛋白进行完整质量分析,确认目标ncAA在特定位点的掺入,并计算掺入效率。
2.7 蛋白结构建模
利用SWISS-MODEL在线服务,以已知晶体结构(如PDB: 5V6X, 2ZCE)为模板,对突变PylRS变体进行三维结构同源建模。通过PyMOL软件可视化分析突变位点的空间位置,推测其可能的功能影响。
3 结果
3.1 MmPylRS(mut)与ChPylRS(mut)基因的构建
成功构建了用于定向进化的起始酶基因:基于M. mazei、已包含N346A/C348A活性位点双突变的MmPylRS(mut),以及基于M. barkeri和M. mazei结构域嵌合的ChPylRS(mut)。这四个基因将分别针对四种ncAA(O-烯丙基-L-酪氨酸(AllY)、O-甲基-L-酪氨酸(MethY)、4-叠氮-L-苯丙氨酸(AzF)和2-氯-L-苯丙氨酸(2ClF))进行进化。
3.2 PANCE方案的开发
建立了一套包含四个压力递增阶段的阳性选择与交替阴性选择的PANCE流程。该系统的核心逻辑是将PylRS的氨酰化活性与噬菌体pIII蛋白的生产相关联,从而将酶的催化效率转化为噬菌体的复制适应性。阴性选择步骤专门设计用于消除不依赖ncAA的PylRS变体,提高了进化结果的底物特异性。
3.3 PANCE结果
经过超过50代的定向进化,针对每种ncAA都获得了一个独立的进化噬菌体谱系。噬菌体滴度在不同选择阶段的波动反映了酶对不断加严的条件的适应过程。测序结果表明,所有进化谱系中都独立固定了一个前所未有的Met300Thr突变。此外,还鉴定出了大量分布在PylRS的N端域(NTD)和C端域(CTD)的突变簇。
3.4 进化后的PylRS变体在体内对ncAA具有高活性和选择性
荧光报告基因检测表明,进化后的PylRS变体(AllYPylRS, MethYPylRS, AzFPylRS, 2ClFPylRS)对其各自对应的ncAA表现出显著增强的掺入活性。与未进化的野生型酶相比,活性提升了数十倍,最佳变体的荧光信号可达不含终止密码子的sfGFP阳性对照的50%以上。同时,在不添加ncAA时,这些变体的背景荧光很低,显示了良好的底物依赖性。交叉反应性测试显示,部分变体对结构相似的ncAA存在一定的交叉识别,但对其目标底物仍保持最高效率。质谱分析最终证实,目标ncAA被高效且特异地掺入到sfGFP蛋白的第27位,掺入效率超过89%。
4 讨论
本研究成功应用并优化了PANCE方案,用于PylRS的定向进化。与传统的理性设计或仅针对活性位点的进化不同,PANCE能够在全酶范围内筛选出协同作用的突变组合。研究发现的突变不仅包括已知能增强催化活性或扩大结合口袋的位点(如Asp2Asn, His62Tyr, Tyr306His),还揭示了一系列先前未被重视的新突变。
特别值得注意的是在所有四个进化谱系中都独立出现的Met300Thr突变。该位点位于催化核心附近,苏氨酸羟基的引入可能通过形成新的氢键网络,更有效地结合酪氨酸和苯丙氨酸衍生物的羧基基团,从而增强了对新底物的识别。
在N端域发现的突变(如AllYPylRS中的Asp2Asn和Glu88Lys,AzFPylRS中的Arg55Cys,2ClFPylRS中的His62Tyr)可能通过调整与tRNAPyl的相互作用来优化酶-tRNA复合物的形成。Pyl复合物的结构,显示突变位点(绿色)及潜在的氢键相互作用">Pyl复合物的结构,显示Tyr62突变位点(绿色)及潜在的氢键相互作用">而在C端域发现的突变(如MethYPylRS中的Glu337Lys)可能模拟了“PylSn + PylSc”类酶的特征,增强了CTD与tRNA的直接相互作用,从而可能重新平衡了酶与tRNA的结合模式。Pyl复合物的结构,显示突变位点(绿色)">其他CTD突变(如Ala107Thr, Asn280Asp等)则可能通过稳定酶的三级结构和扩大结合口袋,来容纳带有庞大取代基的苯环衍生物。
整合了阴性选择的迭代PANCE策略,是获得高底物依赖性PylRS变体的关键。该方法有效压制了具有脱靶活性的变体,确保了进化方向朝向严格的ncAA依赖性。最终获得的PylRS变体在活性和特异性上均表现优异,为在蛋白质中位点特异性引入带有叠氮、卤素等生物正交反应基团的氨基酸提供了强有力的工具,这类蛋白质在生物偶联、药物开发和基础生物学研究等领域具有广阔的应用前景。本研究不仅开发了新的遗传密码扩展工具,其发现的突变图谱也为深入理解PylRS的底物识别与催化机制提供了宝贵线索,并验证了PANCE在酶定向进化,尤其是涉及复杂底物特异性改造方面的强大潜力。