酿酒酵母(Saccharomyces cerevisiae)磷酸化位点AI就绪元分析

《Journal of Proteome Research》:An AI-Ready Phosphorylation Meta-Analysis for Saccharomyces cerevisiae

【字体: 时间:2026年05月16日 来源:Journal of Proteome Research 3.6

编辑推荐:

  PTMeXchange联盟研究人员通过对8个高质量数据集进行元分析,在严格控制假阳性识别的基础上,绘制了酿酒酵母(Saccharomyces cerevisiae)的56,694个磷酸化位点图谱,并将其分类为金-银-铜(Gold-Silver-Bronze)置

  
PTMeXchange联盟研究人员通过对8个高质量数据集进行元分析,在严格控制假阳性识别的基础上,绘制了酿酒酵母(Saccharomyces cerevisiae)的56,694个磷酸化位点图谱,并将其分类为金-银-铜(Gold-Silver-Bronze)置信度类别。首先,研究人员鉴定出55个显著基序,并将其归类为激酶类别以进行通路富集分析。随后,利用无序区域预测和AlphaFold 3在建模时考虑翻译后修饰(PTM)的能力,解析了磷酸化位点的结构背景。结果显示,磷酸化倾向于发生在无序区域的丝氨酸(Ser, S)和苏氨酸(Thr, T)残基上。AlphaFold预测表明,磷酸化位点可诱导蛋白质形成α螺旋,尽管许多“诱导螺旋”似乎异常短小,需进一步验证。随着人工智能(AI)在蛋白质组学中的应用,必须确保公开数据的准确性和高质量,以用于下游分析和模型训练。基于此动机,研究结果已在PRIDE(PXD071918)、PeptideAtlas和UniProtKB中公开,确保该PTM数据符合FAIR(可发现、可访问、可互操作、可重用)原则且“AI就绪”。

研究背景与问题:高质量磷酸化数据的“AI就绪”挑战

细胞信号传导依赖于可逆的翻译后修饰(PTM),其中磷酸化作为关键的分子开关,其异常调控与疾病密切相关。酿酒酵母因其激酶与人类直系同源物高度保守,成为研究磷酸化网络的经典模型。质谱(MS)技术是鉴定磷酸化位点(phosphosite)的主流手段,通常涉及磷酸化肽段富集及LC-MS/MS分析。然而,该领域长期面临两大挑战:一是假阳性位点污染数据库,主要源于既往研究多控制肽段水平的假发现率(FDR),而较少严格控制位点水平的假定位率(FLR);二是随着人工智能(AI)在蛋白质组学中的广泛应用,低质量或存在统计偏差的输入数据会严重影响模型训练与预测准确性。因此,构建一个经过严格FDR/FLR控制、符合FAIR(Findable, Accessible, Interoperable, Reusable)原则的高置信度磷酸化数据集,对于基础生物学研究及AI模型开发具有紧迫意义。

技术方法概要

本研究由PTMeXchange联盟完成,发表于《Journal of Proteome Research》。研究人员从PRIDE数据库筛选了8个酿酒酵母磷酸化数据集(PXD000554等),利用Trans Proteomic Pipeline(TPP)及Comet搜索引擎进行统一重处理。核心方法包括:采用pASTY方法(以磷酸化丙氨酸为诱饵)计算全局FLR;建立金-银-铜(GSB)置信度分类标准(Gold:FLR<1%且在≥2个数据集中出现);利用rmotifx进行激酶基序富集分析;结合IUPred2A无序区域预测与AlphaFold 3结构建模分析磷酸化结构背景。

研究结果解析

数据质量控制与GSB分类

通过对8个数据集进行标准化处理并严格控FDR(1%)与FLR,研究人员共鉴定56,694个磷酸化位点(S/T/Y)。通过引入GSB分类体系,有效控制了跨数据集整合时的错误率膨胀。其中,Gold类别代表高置信度位点,适用于激酶-底物网络构建等严格场景;Silver与Bronze类别虽置信度逐级降低,但保留了更多潜在生物学线索,可供特定分析使用。

激酶基序与通路富集

基于Gold位点及扩展的GSB位点集,研究鉴定出55个显著富集的磷酸化基序,并将其归类为脯氨酸导向(proline-directed)、酸性(acidic)、碱性(basic)等激酶类别。通路富集分析显示,这些位点显著富集于细胞周期、DNA损伤应答及碳代谢等关键信号通路,印证了酵母作为真核生物信号传导研究模型的有效性。

磷酸化位点的结构生物学特征

结合IUPred2A无序区域预测发现,磷酸化倾向于发生在蛋白质的无序区域,特别是丝氨酸和苏氨酸残基。利用AlphaFold 3进行PTM-aware结构建模表明,磷酸化可能诱导局部结构形成α螺旋。然而,许多预测的“诱导螺旋”长度异常短,其生物学真实性需后续实验验证。这一发现提示,磷酸化可能通过诱导局部构象变化(如无序-有序转变)来调控蛋白质功能。

数据共享与AI就绪性

为促进数据重用,所有结果均已通过PRIDE(数据集PXD071918)、PeptideAtlas及UniProtKB公开。该资源严格遵循FAIR原则,提供了完整的原始数据、处理流程及置信度注释,为机器学习模型训练提供了高质量、低噪声的“AI就绪”型磷酸化数据集。

讨论与结论

本研究通过PTMeXchange联盟的标准化分析流程,构建了迄今置信度最高的酿酒酵母磷酸化位点资源之一。研究结论表明:在酿酒酵母中,磷酸化主要发生在无序区域的丝氨酸和苏氨酸残基上;AlphaFold 3预测提示磷酸化可能诱导局部α螺旋形成,尽管许多此类“诱导螺旋”异常短小,需进一步验证;随着人工智能在蛋白质组学中的应用日益增多,必须确保公开数据准确、高质量且符合FAIR原则,以便用于下游分析和模型训练。该数据集为研究酵母及真核生物磷酸化网络提供了可靠的基础资源,同时也为PTM-aware的AI结构预测模型提供了关键的训练与验证数据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号