MPKaDB:一个用于探索膜蛋白pH依赖性的数据库

《Journal of Molecular Biology》:MPKaDB: A p K a Database for Exploring pH Dependence in Membrane Proteins

【字体: 时间:2026年03月04日 来源:Journal of Molecular Biology 4.5

编辑推荐:

  pH依赖的膜蛋白离子化残基pKa数据库构建及其应用研究。采用DeepKa方法从12,006个膜蛋白PDB结构中提取330万处酸性/碱性残基pKa值,开发了MPKaDB数据库及用户搜索界面,可快速获取蛋白pI值及关键活性位点的pKa数据。通过pH耦合静电分析揭示膜蛋白离子运输机制,并以钠钾反转运蛋白和三聚通道蛋白为例验证了数据库在解析pH调控蛋白结构与功能关系中的应用价值。

  
Jiahao He|Yansheng Chen|Jinxi Wu|Zhitao Cai|Wenting Jia|Qiuchen Yue|Yandong Huang
厦门集美大学计算机工程学院,中国厦门361021

摘要

许多膜蛋白的生物活性受pH值调节,然而实验测定其pH依赖性过程缓慢且成本高昂。在这项工作中,我们推出了MPKaDB(http://computbiophys.com/DeepKa/mpkadb),这是一个全面的pKa数据库,可以即时解析指定pH值下可电离残基的质子化状态。利用MPKaDB,我们对跨膜蛋白进行了pH耦合的静电特性分析。为了便于使用,我们开发了一个用户友好的搜索引擎,用于检索感兴趣的蛋白质,并返回特定残基的pKa值、细胞质面和细胞外面的等电点(pI),以及活性位点残基的自动化筛选。最后,我们提出了两个案例研究,展示了如何利用MPKaDB中的pKa值来探索膜蛋白结构与功能之间的pH依赖性关系。

引言

pH在许多生物过程中起着核心作用,包括通过膜嵌入蛋白(如钠-质子反向转运蛋白[1]、质子通道[2]、葡萄糖-质子共转运蛋白[3]和胆固醇转运蛋白[4])在细胞膜上运输离子或小分子。通常,这种质子耦合的质量传输事件发生在特定的pH范围内,并表现出高度的pH依赖性。例如,大肠杆菌(Escherichia coli)中的钠-质子反向转运蛋白NhaA仅在pH高于6.5时才发挥作用,其活性在pH约为8.5时达到最大[5]。因此,要理解这一机制,根据反应核心中可电离残基的pKa值识别质子载体至关重要[6]。上述钠运输过程主要由质子通道驱动,而这些通道的活性也受pH值控制[2]。除了筛选质子载体候选者外,准确描述沿质子传导路径的盐桥网络同样关键,这也依赖于对参与盐桥形成的可电离残基的可靠pKa值计算[7]。
目前已有超过一万种跨膜蛋白的晶体结构被实验确定。基于近一千种非冗余跨膜蛋白的统计数据显示,酸和碱是活性位点中不可或缺的成分(图S1A和S1B)。当功能具有pH依赖性时,应特别考虑它们的滴定行为。此外,酸和碱经常共同存在(图S1C),这表明可电离残基之间的耦合非常重要。
显然,pKa值是连接蛋白质功能与pH的关键。然而,由于pH引起的构象变化,膜蛋白的实验pKa值仍然很少[6]。因此,准确的pKa值预测变得十分紧迫。恒定pH分子动力学(CpHMD)已被证明适用于跨膜蛋白[6],但通常需要数小时到数天才能完成一个蛋白质的预测,因此不适用于工业工作流程中需要的高通量预测需求。
基于Poisson-Boltzmann(PB)方程的方案(如H++ [9])可以在几分钟内完成一个蛋白质的pKa值计算。然而,它们的性能高度依赖于介电常数。另一方面,PropKa采用了一种经验公式,将计算时间缩短到每蛋白质几秒钟[10],但其准确性有限[11]。基于深度学习的方法(如DeepKa)也可以为每个蛋白质提供秒级的pKa值计算[12][13]。研究表明,DeepKa的性能优于PropKa或H++ [14]。最近,DeepKa被用于研究钠-质子反向转运蛋白的pH依赖性构象转变[15]。此外,DeepKa还针对大肠杆菌(Escherichia coli)外膜孔蛋白OmpF(一种三聚体通道[16])进行了基准测试,证明了其创建膜蛋白pKa数据库的能力。
在这项工作中,我们使用DeepKa创建了MPKaDB数据库,其中包含了蛋白质数据库(PDB)中12,006种膜蛋白中330万个Asp、Glu、His和Lys残基的pKa数据[12]。该数据库可以从MPKaDB的网页(http://computbiophys.com/DeepKa/mpkadb)或GitLab(https://gitlab.com/computational-biophysics/deepkaserver/-/tree/main/DeepKaDB)免费下载。此外,还提供了一个用户友好的界面,可以通过PDB代码搜索感兴趣的膜蛋白。值得注意的是,MPKaDB已经集成到了现有的DeepKa网络服务器中[13]。基于MPKaDB中的pKa值,我们对膜两侧的静电特性进行了分析。最后,我们提出了两个案例研究,展示了如何利用MPKaDB探索膜蛋白的pH调控机制。

数据收集、注释和访问

当前的MPKaDB包含了PDB中12,602种膜蛋白中3,306,058个Asp、Glu、His和Lys残基的pKa值。我们使用Cd-hit [17]结合BLAST+ [18]从八千种跨膜蛋白中筛选出了非同质蛋白,序列相同性阈值为30%。最终,选择了968种蛋白质进行跨膜蛋白的静电特性分析。
MPKaDB中的所有pKa值都存储在一个包含五列的CSV文件中。

MPKaDB网络服务器介绍

该网络服务器提供了两个核心功能:一键下载整个MPKaDB数据库的ZIP压缩文件,以及一个通过有效PDB代码检索任何条目的搜索引擎(图1A)。如果找到了感兴趣的蛋白质,一个可点击的箭头会引导用户进入其结果页面,该页面包含两列信息。如图1B所示,左列提供了下载PDB文件的链接。下面列出了细胞质面的pICyto(z\leq0)和细胞外面的pIExtr(z>0)值。

结论与展望

我们推出了MPKaDB,这是一个专门针对膜蛋白的pKa数据库。当前版本记录了PDB中12,006种膜蛋白结构中的330万个Asp、Glu、His和Lys残基的pKa值。整个数据库可以作为单个压缩文件从MPKaDB网络服务器免费下载。还实现了一个用户友好的蛋白质搜索引擎,用户可以通过PDB代码立即检索任何条目。除了pKa值外,结果页面还提供了其他相关信息。

资助

Y.H.感谢中国国家自然科学基金(11804114)和福建省自然科学基金(2023J01329)的支持。

作者贡献声明

Yandong Huang:撰写、监督、项目管理、概念构思、验证、方法学。Jiahao He、Yansheng Chen、Jinxi Wu:软件开发、资源提供、方法学。Zhitao Cai:验证、方法学。Wenting Jia和Qiuchen Yue:软件开发。

数据可用性

该数据库可通过http://computbiophys.com/DeepKa/mpkadb或GitLab(https://gitlab.com/computational-biophysics/deepkaserver/-/tree/main/DeepKaDB)作为网络服务器免费获取。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号