《Proceedings of the National Academy of Sciences》:Global analysis of protein degradation reveals instability of diverse regulators in Escherichia coli
编辑推荐:
本研究通过时间分辨化学蛋白质组学、文本挖掘与机器学习,系统绘制了大肠杆菌在对数期和稳定期的蛋白降解图谱,鉴定了包括c-di-GMP磷酸二酯酶PdeH、N端规则伴侣ClpS及铁硫载体等在内的多种稳态与应激反应调控因子的不稳定性。研究发现蛋白水解在调节运动性、生物膜形成等关键生理转换中扮演核心角色,为深入理解细菌的蛋白稳态(proteostasis)调控网络提供了新视角。
文本挖掘建立活性降解蛋白参考集
为了整合关于细菌中蛋白降解的现有知识,研究团队首先通过文献回顾手动整理了具有直接或间接证据表明其受到蛋白水解调控的蛋白质。为了扩充这一手动整理的数据集,研究构建并查询了一个包含30,238份文档的集成语料库,其中包括PubMed摘要和EcoCyc基因摘要。通过搜索包含大肠杆菌基因名称和蛋白降解相关术语的句子,获得了候选注释,并在专门的Shiny应用中经过人工检查后予以批准或拒绝。文本挖掘将手动整理的底物注释集扩大了38%,每个知识库都产生了独特的鉴定结果。最终整合的文本挖掘和手动注释结果,形成了一个包含364个蛋白质的密集网络,这些蛋白质在计算和实验相互作用中富集,表明它们之间存在功能关联。富集的功能注释来自UniProt和京都基因与基因组百科全书(KEGG)知识库,涵盖了DNA修复、金属稳态、σ因子活性等细菌中受调控蛋白水解的典型功能,也包括了RNA降解和乙酰化等在相关综述中未被广泛认识的功能。
BONCAT鉴定对数期的蛋白水解
接下来,研究利用生物正交非经典氨基酸标记(BONCAT)技术,通过对数期大肠杆菌MG1655细胞进行Azidohomoalanine(Aha)标记,分析了新生蛋白质群体的稳定性。为了在后续的全蛋白质组分析中消除生长对蛋白水解定量动态范围的限制效应,研究采用了翻译抑制剂氯霉素作为标记后处理。通过将标记细胞裂解物与四甲基罗丹明炔烃(TAMRA-alkyne)在铜催化点击条件下反应,并进行SDS-PAGE凝胶内荧光检测,评估了标记蛋白在观察窗口内的稳定性。结果表明,大部分新生的大肠杆菌蛋白质是稳定的。
为了全局分析蛋白质降解动力学,研究延长了观察窗口(0, 0.5, 1, 2, 4小时),并在大规模实验中将标记蛋白质与二苯并环辛炔琼脂糖(DBCO-agarose)树脂共价结合进行富集。富集的蛋白质经过酶切和串联质量标签(TMT)标记,然后进行结合高场不对称波形离子迁移谱(FAIMS)分离的液相色谱-串联质谱(LC-MS/MS)分析。研究共定量了1,810个蛋白质,并将其归一化的时间序列丰度拟合到指数衰减模型,提取速率常数作为蛋白水解不稳定性的估计值。通过将速率常数的密度分布按从文本挖掘获得的底物注释状态进行分层,观察到预期中的负偏态分布,表明只有少数蛋白质经历了降解。在筛选出的88个表现出显著不稳定性(估计半衰期<4小时;错误发现率FDR校正后的P值<0.05)的蛋白质中,注释底物显著富集(Fisher精确检验;优势比=4.8,P值=2.9×10-10),这表明该方法能鉴定已知的蛋白酶底物。此外,降解速率常数估计值与另外两项在基本培养基中对数期细胞的分析中报道的不稳定蛋白的速率常数呈中度相关。研究没有发现底物候选物偏向于周质蛋白。然而,通过ATP发光检测发现氯霉素处理引起了ATP水平的升高,这可能通过增强AAA+蛋白酶的持续合成能力来加速典型底物的降解速率,但不会人为扩大底物范围。
c-di-GMP磷酸二酯酶PdeH被ClpXP降解
研究鉴定出专门介导运动性的c-di-GMP磷酸二酯酶(PDE)PdeH为一个候选底物,其半衰期约为1.77小时。PdeH具有大肠杆菌MG1655中所有13个PDE中最简单的结构域组成,仅包含一个保守的EAL结构域和一个N末端延伸(NTE),其结构在AlphaFold2模型中预测可信度较低。为了验证PdeH的不稳定性,研究将其编码序列与FLAG表位标签融合,克隆到中拷贝表达质粒中,进行免疫印迹稳定性分析。尽管PdeH的C末端存在一个类似ssrA的三肽(LAL),暗示蛋白水解可能从该末端起始,但无论是用FLAG标签封闭N末端,还是引入连续的N末端截短,都稳定了PdeH,这表明其N末端介导了蛋白酶识别。在野生型MG1655细胞中异位表达的PdeH-FLAG表现出降解,而在clpP和clpX缺陷型背景中,这种降解被消除,从而确定PdeH是ClpXP的底物。
作为鞭毛调控级联中的III类基因,pdeH的转录由ClpXP的底物和主调控复合物FlhDC激活,这使得ClpXP同时调节PdeH的合成和降解。为了分离蛋白水解在塑造内源性PdeH丰度中的作用,研究对PdeH的第2至21位残基进行了丙氨酸扫描或丙氨酸连续突变。L19A点突变体以及X(8-13)A和X(15-19)A连续突变体表现出近乎完全的稳定,进一步表明NTE赋予ClpXP识别。为了确定这种蛋白水解识别的生理相关性,研究使用无缝Cas9克隆系统构建了在染色体pdeH位点携带稳定突变和C末端3xFLAG标签的菌株。内源表达水平的PdeH-3xFLAG表现出不稳定性,与蛋白质组学分析一致,而L19A和X(15-19)A突变体则完全稳定。由于稳定期PdeH丰度的下降驱动了固着性和中心生物膜调节因子CsgD的表达,研究随后监测了稳定期PdeH的丰度。在染色体pdeH位点携带L19A突变的细胞,在M9或LB培养基中培养时,稳定期的PdeH丰度升高。结论是PdeH的N末端是一个不稳定调节基序,促进ClpXP介导的这种酶在生长停滞时的消耗。
为了评估PdeH去稳定化是否影响可观察的表型,研究构建了在pdeH位点携带单一突变(无C末端3xFLAG标签)的菌株,并在添加刚果红(用于指示卷曲纤维沉积)的无盐LB琼脂上培养形成大菌落生物膜。MG1655菌株产生由外部生长区和内部脊纹组成的生物膜,具有大肠杆菌K-12大菌落的特征,而缺失卷曲纤维成核必需的csgB的菌株则缺乏表面形态和卷曲纤维沉积。与ClpXP在调节生长停滞中的作用一致,clpP和clpX缺失菌株在卷曲纤维沉积和表面形态上存在严重缺陷。缺失PdeH或通过突变保守EAL结构域活性位点残基E48A破坏其催化活性,引发了更细的脊纹和皱褶,这与之前观察到的PdeH缺失主要影响大菌落生物膜表面形态的结果一致。稳定的L19A或X(15-19)A突变分别诱导了明确、紧凑的环和粗糙的表面,在立体显微镜下可见,并改变了生物膜平坦内区的相对大小,L19A突变还减小了大菌落的尺寸。然而,这些效应与clpX或clpP缺失引起的效应相比是有限的。虽然PdeH的去稳定化可能适度影响大菌落生物膜的发育,但这些结果更广泛地证明了ClpXP的蛋白水解调控对于大菌落生物膜成熟过程中获得典型结构特征至关重要。
ClpAP调节因子及N端规则识别因子ClpS被ClpAP降解
研究观察到高度保守的N端规则识别因子ClpS发生降解,其半衰期约为2.37小时。ClpS作为分子伴侣将N端规则底物递送给ClpAP进行降解,并调节ClpAP对ssrA标签底物、蛋白质聚集体和ClpA本身的活性。ClpS包含一个底物和ClpA结合的核心结构域,其前是一个非结构化的NTE,据报道,该NTE通过作为降解模拟物进入ClpAP孔道来调节ClpA的ATP酶活性和ssrA选择性。与文献记载的ClpS在ClpAP降解反应中的体外稳定性相反,免疫印迹稳定性分析和蛋白酶定位表明,异位表达的ClpS-3xFLAG在体内受到ClpAP介导的降解。截短NTE可消除降解,表明ClpS的NTE与ClpAP孔道的结合许可了其自身的破坏。支持这一观点的是,ClpS NTE中的P24A和P25A双突变会使该蛋白易受ClpAP介导的降解,这表明某些条件允许ClpS被识别为ClpAP的降解底物。
Fe-S簇组装蛋白的差异稳定性
大肠杆菌将大约30%的细胞铁储存在低自旋亚铁血红素中心和作为辅基的铁硫(Fe-S)簇中,这些簇在支架蛋白上组装,然后转移到载体蛋白,再分配给其相应的脱辅基蛋白。研究观察到所有四种具有A型结构域的Fe-S簇载体蛋白(A-type carriers, ATCs)均不稳定,包括IscA、ErpA、SufA和NfuA,其中NfuA的A型结构域在保守的Fe-S簇配位半胱氨酸处发生了突变。研究还观察到ISC和SUF Fe-S簇生物合成途径支架复合物的两个组分IscU和SufD不稳定,它们对各自支架的活性至关重要。
研究将3xFLAG表位标签融合到这些ATCs和支架蛋白的末端,并将每个融合构建体克隆到质粒中进行异位表达和免疫印迹稳定性分析。N末端3xFLAG融合重复了蛋白质组学分析中观察到的丰度排序和差异稳定性。虽然金属配位被认为影响蛋白酶的结合,但在缺铁的M9培养基中,IscA和主要的需氧A型载体ErpA的不稳定性不依赖于Fe2+的补充。研究选择了这两种ATCs进行蛋白酶定位,发现IscA在lon缺陷型背景中部分稳定,而ErpA则完全稳定。结论是A型结构域可能赋予载体一种被Lon识别的特性,而其序列背景调节了这种识别。
BONCAT实现稳定期的全局蛋白质稳定性分析
利用BONCAT技术在细菌中鉴定蛋白酶底物的保真度得到确认后,研究接下来利用该方法的灵敏度,在作为微生物休眠模型的稳定期(与成熟生物膜具有基因表达共同性)中对新生蛋白质的稳定性进行蛋白质组学分析。研究发现,用Aha标记稳定期培养物产生的甲硫氨酸替换率不足,无法进行蛋白质组学分析。为了获得足够的标记,研究将严格调控的核糖体RNA启动子rrnBP1与编码NLL-MetRS的基因进行转录融合,使其在对数期积累,以便在稳定期用Azidonorleucine(Anl)进行标记。表达该盒的细胞培养24小时进入稳定期,用Anl脉冲标记4小时,然后重悬于从未处理培养物收集的无菌过滤废培养基中,并补充甲硫氨酸(Met)作为追踪处理。在该方案下,未观察到稳定期培养物在Met或Anl处理下恢复生长,也未在观察窗口内检测到对生存力的扰动。收集追踪期间的细胞裂解物,在铜催化点击条件下与TAMRA-alkyne反应,然后通过SDS-PAGE按分子量分离蛋白质,进行凝胶内荧光可视化。再次观察到TAMRA偶联蛋白质在观察窗口内广泛稳定,这表明Anl与Aha类似,在此掺入率下不会广泛地使受体蛋白不稳定。
为了进行全蛋白质组测量,研究扩大了该实验规模,在延长的观察窗口(0, 1, 2, 4, 8小时)收集细胞进行裂解。Anl标记的蛋白质以类似于对数期筛选的方式进行富集、酶切和TMT标记。该方案中的样品采用RTS-SPS-MS3方法进行分析,以减轻由前体离子共碎裂引起的比率压缩。对富集肽段的分析得到了1,339个定量蛋白质,丰度轨迹再次拟合到指数衰减模型以估计降解速率常数。稳定期的降解速率通常比对数值慢,这与在有限模型底物中报道的差异不稳定性测量结果一致。研究再次观察到,在56个具有显著不稳定性证据(估计半衰期<8小时;FDR校正P值<0.05)的候选蛋白中,已知的蛋白酶底物显著富集(Fisher精确检验;优势比=5.0,P值=7.0×10-8)。高置信度候选蛋白在整个定量动态范围内呈现出时间顺序的丰度下降。
稳定期底物与应激反应和分解代谢相关
在任一生长阶段表现出不稳定性的候选蛋白中,观察到注释底物的身份有适度的重叠,而未注释的底物候选物则相对特异于每个生长阶段。这些生理状态下注释底物的降解速率是相关的(Pearson's R = 0.58),这表明两种标记策略产生了可比较的测量结果,并且许多已知底物并非条件性不稳定。专门在稳定期数据集中鉴定的候选底物通常与应激反应相关,包括氧化应激调节因子SoxS和典型的N端规则底物PatA,而专门在对数期鉴定的候选物则与运动性和鞭毛组装相关,后者在稳定期终止。研究观察到的最不稳定稳定期候选物之一是RpoZ,即RNA聚合酶(RNAP)的非必需ω亚基,与生物膜生产和σ因子选择性有关。此外,还观察到亚基β和β’的不稳定性,它们先前被鉴定为在稳定期不稳定。
研究选择稳定期底物候选物,在对数期细胞中进行免疫印迹稳定性分析,因为在稳定期细胞中建立验证策略的尝试揭示了蛋白质表达和蛋白酶定位方面的重大挑战。与分解代谢相关的蛋白质,如FrdB、CsiE和LtnD,在一个或多个融合体中表现出不稳定性。研究还鉴定出BolA(介导稳定期形态,先前已被发现具有蛋白水解不稳定性)和BssR(与群体感应和吲哚转运相关的生物膜生产调节因子)的N末端3xFLAG融合体不稳定。蛋白酶定位表明,BolA可能被包括ClpXP、ClpAP和Lon在内的多种蛋白酶识别。
机器学习辅助的底物鉴定揭示蛋白水解
为了应对基于质谱的蛋白质组学中因丰度偏差和物理化学限制而无法实现全覆盖的问题,研究试图建立和验证一个预测分类模型,以确定在蛋白质组学分析中未鉴定出的哪些蛋白质也可能受到蛋白水解调控。训练数据包括蛋白质组学分析中定量的2,041个蛋白质,其中262个具有不稳定性证据的蛋白质作为阳性样本。总共9,794个不同的特征来自UniProt、EcoCyc、STRING和AlphaFold数据库,或从一级氨基酸序列计算得出。为此分类任务考虑了四种模型:L1正则化逻辑回归、随机森林、人工神经网络(ANN)和基于XGBoost的梯度提升逻辑回归。通过将训练数据进行分层和样本加权以解决类别不平衡问题的重复嵌套交叉验证来评估模型,并以平均平均精度为优化目标。平均而言,XGBoost模型达到了最高的平均平均精度(0.359),相比该数据集的基线精度(0.128)提高了2.8倍,并且接收者操作特征(ROC)曲线下面积(AUC)最高(0.746)。这比现有模型在不考虑降解速率的情况下区分不稳定与稳定蛋白质的性能(ROC AUC ≈ 0.6)有所提高。因此,研究选择了XGBoost模型,因其具有可操作的性能和可解释性,并使用完全训练的模型为2,093个在蛋白质组学分析中未鉴定出的未知蛋白质分配不稳定性概率。值得注意的是,在减少的1,093个物理化学属性和预测特征集上进行训练,性能虽有所降低但仍可部署,XGBoost模型达到了最高的平均平均精度(0.327),这表明该方法可能推广到注释较少的物种。
研究根据未知蛋白质被分配的不稳定性概率进行排序,并在STRING数据库服务器上进行竞争性富集分析,结果得到了与文献中及蛋白质组学分析中蛋白水解相关的功能。模型倾向于为文献中鉴定为蛋白酶底物的未知蛋白质分配较高的概率,而对于在整理中缺乏不稳定性记录证据的蛋白质,则平均被认为稳定或不稳定。已知的蛋白酶底物,如热激σ因子RpoH、抗生素抗性调节因子MarA以及FlhDC复合物的FlhC和FlhD亚基,被模型归类为蛋白水解不稳定类。
接下来,研究调查了未注释的预测底物的稳定性,这些底物是根据其预测特征的代表性及其已知生物学功能选择的。免疫印迹稳定性分析显示,两种σ因子调节因子IraD和FliS(分别结合RpoS衔接子RssB和FliA抗σ因子FlgM)、铁反应性胞外σ因子FecI、FNR同源物YeiL、酸抗性系统转录激活因子GadX、RpoS拮抗剂和运动性调节因子FliZ以及通过激活卷曲纤维和磷酸乙醇胺纤维素生产来驱动表面粘附的生物膜调节因子CsgD的丰度均随时间序列减少。此处观察到的IraD不稳定性支持了先前关于该蛋白质蛋白水解的简要评论。亚硝酸盐敏感性阻遏物NsrR没有表现出实质性的时间序列衰减,被确定为预测底物但在筛选中未得到验证。
Lon介导的FliZ和CsgD蛋白水解
鉴于鞭毛调控级联在实验和计算鉴定中的高度代表性,研究选择了CsgD和FliZ进行蛋白酶定位,发现这两种底物在lon缺陷型背景中完全稳定。值得注意的是,CsgD含有一个C末端LuxR型螺旋-转角-螺旋结构域,该结构域也存在于Lon底物RcsA和GadE中,并且其编码基因位于EcoCyc数据库中描述的最受转录调控的操纵子(csgDEFG)上,这两个特征均被模型认为是预测性的。
对鞭毛和卷曲纤维表达级联的遗传分析表明,I类主调节因子FlhDC通过驱动FliZ和PdeH作为II类和III类基因产物的表达,间接抑制卷曲纤维表达并维持运动性,从而抑制CsgD的表达。研究结果表明,这三个调节因子在体内都受到主动降解。因此得出结论,蛋白水解降解调节了鞭毛基因级联层次结构每个层次上关键调节因子的丰度,这可能加速运动性和固着性之间的转换。
讨论
本研究建立的大部分蛋白水解降解与运动性和c-di-GMP有关。定时降解PdeA驱动新月柄杆菌的细胞周期进程,因此c-di-GMP磷酸二酯酶(PDE)的受调控蛋白水解并非没有先例。PdeA N末端Per-ARNT-Sim结构域中的一个稳定点突变消除了其被蛋白酶伴侣CpdR的识别。PdeH的NTE在结构和功能上尚未明确表征,研究结果并不排除其在介导影响ClpXP识别PdeH的生物分子相互作用中的潜在作用。支持这一可能性的是,稳定的L19A突变在蛋白质一级序列中的位置相对于许多其他已知的ClpXP降解信号而言异常靠后。L19A和X(15-19)A突变对大菌落生物膜生理学的不同影响可能进一步表明PdeH的NTE可能扮演未被充分认识的调节或功能角色。比较分析发现PdeH在61个大肠杆菌菌株(包括共生菌和病原菌)中绝对保守。这种蛋白水解调控是否在其他肠杆菌科成员中发挥作用并影响c-di-GMP水平值得进一步研究。研究还注意到,拮抗PdeH的DGC(DgcE)曾被报道在体内降解,尽管负责观察到的稳定性的蛋白酶尚未确定。由于c-di-GMP处于许多生活方式转变和不可逆细胞命运决定的核心,PDEs和DGCs的受调控蛋白水解可能被证明是微生物生理学中的一个持续主题。
clpS启动子受低胞质Mg2+下调,并且稳定期升高的ClpA丰度降低了ClpS与ClpAP的比例,这表明ClpS的丰度和相对化学计量比被调整以应对应激。ClpS的降解可能有助于此目的,其在生理和过量化学计量下均发生降解,表明蛋白水解可能持续进行,尽管进一步的研究应探讨N端规则底物和ClpA结合的任何潜在稳定效应。在众多的生物化学、生物物理和结构研究中,ClpS如何逃脱ClpAP的降解尚未在当代模型中得到阐明。衔接子-底物共降解的可能性已被认为与ClpS-ClpAP系统的其他机制方面兼容,并且在枯草芽孢杆菌的调节能力的ClpCP衔接子MecA中可见。已发表的体外和体内ClpS稳定性分析的矛盾结果可能进一步表明,在某些重构的体外系统中,一个未考虑到的变量或未识别的因子参与了ClpS与ClpAP的底物交换。事实上,已证明对ClpS NTE的诱变可引发ClpAP对该蛋白的识别和降解,这表明某些条件可能允许ClpS被ClpAP破坏。此外,早期观察到的ssrA标签底物在体内对ClpAP的无法解释的稳定性,最终在SspB和ClpS衔接子被发现和表征后,归因于它们。
从ISC到SUF Fe-S生物合成途径的转换被提出通过分别损害呼吸复合物组装和增强氧化应激反应调节因子组装,来驱动对氨基糖苷类和氟喹诺酮类抗生素的耐受性。由于对数期分析反映了氨基糖苷类处理后的蛋白质组重塑,必需Fe-S支架复合物亚基的差异不稳定性可能有助于时间序列生存力测量期间的杀灭动态。更广泛地说,关于ATCs在不同生理状态下的相对活性以及蛋白水解在其中的作用,仍有许多有待了解,因为Fe-S组装中铁的来源及