《Biochemical and Biophysical Research Communications》:Redesigning myoglobin via functional site scaffolding for enhanced catalytic functions
赵振宇|王颖颖|滕晨英奇|薛怀倩|苏彬彬|王浩然|杨宇|李春
北京工业大学化学与化学工程学院医学分子科学与制药工程国家重点实验室,北京,102488,中国
摘要
蛋白质的重新设计经常受到稳定且坚固的骨架稀缺性的限制。尽管计算方法可以扩展蛋白质序列空间以生成新的骨架,但再现金属蛋白(如肌红蛋白)功能所需的精细结构特征仍然具有挑战性。在这项工作中,我们采用了基于深度学习的功能位点骨架策略,其中使用基于扩散的结构模型生成了骨架结构,通过反向折叠设计(ProteinMPNN)优化了序列,并随后使用结构预测算法(AlphaFold和OmegaFold)评估了结构一致性,从肌红蛋白的血红素结合口袋和次级配位球残基开始设计过程。通过生成和计算筛选超过100,000个序列,我们获得了一种微型化的肌红蛋白版本,称为bitMb,它保留了关键的血红素结合特征以及天然的O2结合行为。为了评估其催化潜力,我们将抹香鲸肌红蛋白中的已知有益突变引入bitMb中。与亲本bitMb骨架相比,所得到的变体表现出更高的过氧化物酶和碳烯转移酶活性,证实了该骨架的功能灵活性。此外,bitMb具有更高的热稳定性,熔点比野生型抹香鲸肌红蛋白高5.5°C,并且在高浓度有机溶剂中表现出显著的稳定性,在高达96.7%的甲醇中仍能保持血红素结合能力和酶活性。我们的结果表明,基于功能位点骨架的重新设计策略可以生成具有多种催化功能的坚固且多功能的蛋白质骨架。
引言
蛋白质的重新设计涉及合理选择骨架和定点突变以增强或引入新功能[[1], [2], [3], [4]]。这一过程通常从识别一个特征明确的蛋白质骨架开始,并策略性地引入突变以实现所需的功能。抹香鲸肌红蛋白(swMb)是一种简单且特征明确的血红素蛋白,由于其广泛的突变分析揭示了其功能多样性,因此成为蛋白质重新设计的理想模型系统[[4,5]]。通过突变调节底物结合口袋或微调与血红素或血红素配体的氢键或其他弱相互作用,已成功将其从一种结合氧气的蛋白转化为具有过氧化物酶和碳烯转移酶等多种活性的蛋白[[5], [6], [7], [8], [9]]。这些研究强调了底物口袋残基和次级配位球在调节蛋白质功能中的关键作用[[9]]。然而,尽管这些方法取得了成功,但它们受到特征明确蛋白质骨架的可用性的限制,并需要丰富的专业知识和广泛的生化知识。此外,天然骨架的稳定性有限,经过大量突变后往往会导致蛋白质不溶或表达不佳[[10]],从而限制了它们在蛋白质重新设计中的实用性。
计算设计方法通过使人们能够系统地探索蛋白质序列空间,显著推动了这一领域的发展[[11,12]]。像Rosetta这样的工具允许精确地模拟蛋白质折叠和稳定性,便于将功能基序引入合适的骨架[[13,14]]。深度学习的进步进一步增强了蛋白质计算设计的能力,允许快速探索蛋白质序列空间[[15], [16], [17]]。这些方法超越了传统的骨架-接枝策略,利用庞大的数据集从零开始创建坚固的骨架[[14,[18], [19], [20]]。功能位点骨架已成为计算蛋白质设计中的强大策略,专注于将功能基序嵌入设计的骨架中以实现所需的功能[[13]]。尽管这种方法具有潜力,但它也存在固有的风险,包括破坏蛋白质折叠结构以及出现替代的金属配位或异质电子状态。
在Baker及其同事的开创性工作基础上(他们成功地从最小的结合基序设计了一种血红素结合蛋白[[21]],我们将功能位点骨架策略扩展到包括底物结合口袋和次级配位球残基在内的更广泛范围。通过这种功能位点骨架策略,我们旨在重现天然蛋白质的功能基序,同时提高蛋白质的稳定性和活性。为了验证我们的设计,我们引入了文献中报道的关于swMb的突变,并评估了它们赋予不同过氧化物酶和碳烯转移酶功能的能力,以及O2结合能力。我们的结果为基于深度学习的蛋白质设计提供了见解,特别是在次级配位球相互作用至关重要的金属蛋白背景下。
计算设计与排序
使用RFDiffusion生成蛋白质的骨架结构[[22]];然后使用ProteinMPNN进行序列设计[[23]];使用OmegaFold、AlphaFold2和AlphaFold3预测结构[[24], [25], [26]],并根据生成的PDB文件获取pLDDT值,并将结构与输入基序对齐以获得TM得分[[27]]。
bitMb及其突变体的表达与纯化
为大肠杆菌表达优化了密码子的bitMb基因被亚克隆到带有His标签的pET22b载体中。还生成了其他突变体
计算设计
为了实现重新设计肌红蛋白的目标,我们采用了结构分析和基序识别、计算设计和排序的程序。计算设计和排序的工作流程遵循骨架生成、序列设计、结构预测和排序的一般步骤[[28]]。我们使用了一系列设计工具:RFDiffusion用于骨架生成,ProteinMPNN[[23]]用于序列设计,以及OmegaFold、AlphaFold2和AlphaFold3[[24], [25], [26]]用于
结论
血红素结合蛋白一直是蛋白质设计研究的主要焦点,以往的方法通常强调使用最小的骨架,最初由DeGrado和Dutton提出[[42]],并采用RosettaMatch和GALigandDock等对接和搜索策略来优化配体相互作用,从而设计出亲和力低至2.5 nM的新蛋白[[43]]。最近基于深度学习的方法(如RoseTTAFold All-Atom)明确模拟血红素相互作用,以实现更高的结合亲和力
CRediT作者贡献声明
赵振宇:正式分析、研究、可视化、撰写——初稿。王颖颖:正式分析、研究、撰写——审阅与编辑。滕晨英奇:研究、软件开发。薛怀倩:研究、撰写——审阅与编辑。苏彬彬:正式分析、研究、撰写——审阅与编辑。王浩然:研究。杨宇:概念构思、正式分析、资金获取、方法学设计、资源准备、软件使用、监督、撰写——初稿
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
作者衷心感谢国家自然科学基金(22578032, 21878020)的财政支持。作者还感谢林英武教授在晶体学方面的讨论和帮助,感谢北京工业大学分析测试中心的李兰女士在质谱数据收集和分析方面的协助,以及清华大学分析测试中心的工作人员在CD和EPR数据收集方面的支持。作者还感谢张瑶媛博士的支持