PERCEPTRON-PTMKB:一个用于基于残基的翻译后修饰分析和倾向性评分的Web服务器

【字体: 时间:2026年02月13日 来源:Journal of Molecular Biology 4.5

编辑推荐:

  翻译后修饰分析工具及量化评估算法 | PTM预测 | propensity评分算法 | RESTful API集成 | 蛋白质组学工具

  
阿卜杜拉·本·费兹(Abdullah Bin Faiz)| 穆罕默德·肖艾布(Muhammad Shoaib)| 萨菲·乌拉·乔达里(Safee Ullah Chaudary)
生物医学信息学与工程研究实验室,生命科学系,赛义德·巴巴尔·阿里科学与工程学院,拉合尔管理科学大学,巴基斯坦旁遮普省54792

摘要

识别蛋白质残基的翻译后修饰(PTMs)对于理解蛋白质功能及其在细胞过程中的作用至关重要。研究人员已经收集了大量关于PTMs的实验数据,并将其整理到在线数据库中。然而,这些数据库并未提供与蛋白质搜索和识别工具的集成,这阻碍了研究人员在生物样本中无缝利用这些数据来解析PTMs。此外,目前缺乏根据蛋白质残基的邻近环境来评估PTMs的工具。在这里,我们提出了PERCEPTRON-PTMKB,这是一个专为使用实证数据集分析和评估PTM位点而设计的网络服务器。PERCEPTRON-PTMKB通过其倾向性评分算法提供对每个残基PTM位点的定量评估。搜索和倾向性计算流程也通过安全的RESTful API提供,从而能够将其无缝集成到蛋白质序列搜索引擎中。
PERCEPTRON-PTMKB可免费访问:https://perceptronptmkb.lums.edu.pk

引言

翻译后修饰(PTMs)是调节蛋白质功能活性、稳定性、相互作用和定位的关键生化机制。例如,p53的磷酸化会抑制其通过MDM2介导的降解,从而在基因毒性应激下促进DNA修复或细胞凋亡[3]。p53 C端赖氨酸的乙酰化可以稳定蛋白质[4]并维持细胞稳态。PTEN的泛素化有助于其与Importin-11的相互作用,进而将PTEN转运到细胞核内,使其定位在细胞核中,同时将其与细胞质中的E3连接酶分离,防止其降解[5, 6]。
识别和表征PTMs需要高分辨率质谱技术[7],以及先进的蛋白质搜索引擎[8]和识别流程[9]。为了协助这一过程,已经建立了许多PTM数据库供蛋白质搜索引擎使用。2003年,PhosphoSite数据库上线,其中包含了人类和小鼠蛋白质中的文献报道的磷酸化位点[10]。经过2011年至2018年的多次升级后,该数据库现在包含451,453个修饰位点[11, 12, 13]。尽管PhosphoSite是一个丰富的磷酸化位点资源,但它没有提供应用程序编程接口(API)来程序化地访问这些信息。同样,Phospho.ELM在2004年提供了556种蛋白质中的1,703个磷酸化位点的初步目录[14]。2008年和2011年,Phospho.ELM将其记录更新为42,574个丝氨酸、苏氨酸和酪氨酸磷酸化位点,并提供了有关结构和可访问性的额外信息[15, 16]。然而,与PhosphoSitePlus一样,Phospho.ELM中的PTM数据也无法通过程序化方式访问,而且其蛋白质记录也较为陈旧。dbPTM于2005年发布,收录了14,057个经过实验验证的PTM位点[17]。2025年发布的最新版本包含了98种PTM类型的2,243,890个经过实验验证的位点,使其成为最大的PTM数据库之一[18]。虽然dbPTM提供了丰富的PTM和蛋白质信息集成与分析功能,但它缺乏程序化接口,并且不提供用于整合到蛋白质组学流程中的PTM预测和评分算法。CPLM(蛋白质赖氨酸修饰汇编)于2011年发布,收录了3,311种乙酰化蛋白质中经过实验验证的7,151个赖氨酸位点[19]。该数据库在2013年、2017年和2021年进行了升级,现在提供了23种赖氨酸特异性修饰在105,673种蛋白质中的信息[20, 21, 22]。然而,CPLM仅通过其网页界面提供信息,不公开数据库访问权限。PTMcode于2013年发布,提供了10,000多种蛋白质中13种不同PTM类型的关联信息[23]。2015年的更新版本(PTMcode v2)将PTM类型增加到69种,并提供了丰富的可视化功能[24]。不过,PTMcode的使用受到限制,因为它不提供程序化数据访问。iPTMnet于2018年发布,提供了从文献中挖掘得到的PTM网络和蛋白质构象[25, 26]。2020年的更新允许通过RESTful API端点提供信息[27]。然而,iPTMnet不提供PTM位点预测功能,且其数据也较为陈旧。总体而言,现有的PTM数据库在以下方面仍然存在局限性:(i) 提供最新和全面的经过实验验证的PTMs及其相关氨基酸位点目录;(ii) 通过网页提供PTM和宿主位点数据的描述;(iii) 用于定量评估PTM位点的算法工具;(iv) 通过API端点供蛋白质组学流程程序化使用。
在这项工作中,我们介绍了PERCEPTRON-PTMKB,这是一个提供经过实验验证的PTMs和PTM位点全面目录的网络服务器。PERCEPTRON-PTMKB可以在蛋白质序列上进行PTM搜索和分析,根据氨基酸邻近环境计算单个残基的PTM倾向性,并通过安全的RESTful API服务将这些功能整合到蛋白质搜索引擎和系统工作流程中。PERCEPTRON-PTMKB在接收到UniProt[28]蛋白质标识符作为输入后开始PTM分析。然后从dbPTM中获取72个经过实验验证的PTM数据。接下来,从UniProt、RESID数据库[29]、AlphaFoldDB[30]、RCSB蛋白质数据库[31]和JPred[32]中收集关于蛋白质和PTM位点的信息。每个入选的PTM都会通过至少一个PubMed验证的标识符进行验证。此外,利用氨基酸序列,通过蛋白质二级结构字典[33]和溶剂可及表面积算法[34]计算二级结构构象。同时,PERCEPTRON-PTMKB计算具有实验验证的PTMs的残基倾向性。该工具还允许用户输入自定义蛋白质序列及其PTM类型以进行倾向性计算。所得倾向性评分以对数和log-log乘积的形式提供,为PTMs的预测建模提供了基础。PERCEPTRON-PTMKB通过交互式界面以及RESTful API实现提供分析后的PTM数据。
可以通过以下网址访问PERCEPTRON-PTMKB:https://perceptronptmkb.lums.edu.pk。此外,也可以通过安全的RESTful API实现程序化集成,以便进行高通量分析。

软件架构与设计

该网络服务器基于PERCEPTRON的[9]三层模型-视图-控制器(MVC)软件架构[35]进行扩展,包括前端、中间件和后端(图1)。前端由使用超文本标记语言(HTML)[36]和层叠样式表(CSS)[37]构建的交互式网页图形用户界面(GUIs)组成。JavaScript(JS)[38]促进了动态内容渲染和与中间件的通信,以增强设计的一致性和交互性。

结果与讨论

PERCEPTRON-PTMKB是一个用于分析和预测蛋白质PTM位点的公共网络服务器。该服务器汇总来自各种以PTM为中心的数据库的实验PTM数据,并应用二级结构预测工具和富集库来进行PTM分析和预测。PERCEPTRON-PTMKB作为一个安全、可扩展且响应迅速的网络服务器运行,提供了无缝的用户界面。用户可以提供蛋白质标识符或访问号作为搜索输入。

CRediT作者贡献声明

阿卜杜拉·本·费兹(Abdullah Bin Faiz): 软件开发、方法论、数据管理。穆罕默德·肖艾布(Muhammad Shoaib): 验证、形式分析。萨菲·乌拉·乔达里(Safee Ullah Chaudary): 验证、形式分析、概念化。

利益冲突声明

作者声明他们没有已知的可能会影响本文所述工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号