MaxSBM中用于鉴定SUMO及序列依赖性修饰的肽段搜索算法优化

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Molecular & Cellular Proteomics》：Improved peptide search for identification of SUMO and sequence-based modifications, in MaxSBM

【字体：大中小】 时间：2026年05月22日 来源：Molecular & Cellular Proteomics 5.5

编辑推荐：

　　翻译后修饰（post?translational modifications，PTM），如SUMO化（SUMOylation）和泛素化（ubiquitination），通过共价结合至赖氨酸残基调控关键细胞进程。尽管质谱技术可实现PTM的位点特异性鉴定，但现有多

翻译后修饰（post?translational modifications，PTM），如SUMO化（SUMOylation）和泛素化（ubiquitination），通过共价结合至赖氨酸残基调控关键细胞进程。尽管质谱技术可实现PTM的位点特异性鉴定，但现有多数搜索引擎主要针对小型、不裂解的修饰进行优化，难以检测大型、可裂解的蛋白质类修饰因子。研究人员将此类修饰定义为序列依赖性修饰（sequence?based modifiers，SBM）。为克服这一局限，研究人员在MaxQuant框架内开发了针对SBM的专用搜索策略，在肽段鉴定过程中充分考虑SBM的裂解行为。利用公开数据集，研究人员验证了该方法在SUMO2/3上的适用性。分析发现，SBM裂解具有独特的诊断特征和特征性质量偏移，本研究将其分别命名为诊断离子（diagnostic ions，d?ions）和修饰离子（PTM ions，p?ions）。通过利用这些特征，该方法在人类细胞系中将SUMO化肽段的鉴定数量提升约13%，在小鼠胚胎细胞中提升约22%，在小鼠脂肪细胞中提升约24%。该搜索方法使SBM的谱图注释水平提升，Andromeda评分中位数最高提高9%。综上，研究人员展示了SBM搜索策略在提升蛋白质类修饰发现能力方面的潜力。

研究背景与意义

SUMO化等翻译后修饰（PTM）在细胞核质运输、DNA损伤应答、基因转录调控等关键生物学过程中发挥重要作用，其异常与肿瘤、糖尿病等疾病密切相关。基于质谱（MS）的蛋白质组学虽已广泛用于PTM鉴定，但针对大型、易裂解的序列依赖性修饰（SBM，如SUMO、泛素），传统搜索引擎因未考虑其复杂裂解模式，鉴定灵敏度低。现有工具如MSFragger?Labile、pLink等存在兼容性差、依赖过时编译器等问题，亟需优化的分析方案。该研究由丹麦哥本哈根大学等团队完成，成果发表于《Molecular & Cellular Proteomics》。

关键技术方法

研究采用已发表的四个公共数据集：人类HEK细胞SUMO?HEK（PXD008003）、小鼠脂肪细胞SUMO?Adip（PXD024144）、小鼠胚胎细胞SUMO?MEC（PXD017697）及人泛素Ub?LysC（PXD006201）。在MaxQuant 2.6.8.0中开发MaxSBM模块，引入SBM特有的诊断离子（d?ions）和修饰离子（p?ions）至理论谱图空间。通过参数优化确定最优p?ions组合为p2、p3、p7。同时使用Percolator进行半监督重打分，并与MSFragger?Labile流程进行性能对比。所有统计分析与可视化均基于Python生态工具完成。

研究结果

Implementation of MaxSBM

研究人员构建了集成于MaxQuant的MaxSBM模块，针对SUMO2/3残留序列DVFQQQTGG设计d?ions与p?ions理论库。该模块扩展了Andromeda搜索引擎的理论峰列表生成逻辑，在传统b/y离子基础上纳入SBM特异离子系列，显著提升谱图匹配复杂度。

MaxQuant GUI configuration

MaxSBM通过图形界面“序列依赖性修饰”选项启用，支持用户输入修饰序列自动计算中性丢失质量。鉴定结果可在MaxQuant谱图查看器中展示p?ions注释，并输出至msms.txt与sites.txt文件，推荐结合Perseus平台进行下游分析。

Optimization of the search space for efficient identification of SUMOylation

通过对SUMO?HEK数据集的系统优化，研究人员确定包含3个p?ions（p2、p3、p7）为最优配置。d?ions虽不影响鉴定数量，但可提升谱图峰覆盖度、匹配峰数量及强度覆盖，作为SUMO化存在的内部验证依据。

Enhanced identification rates using MaxSBM

相比标准搜索，SBM 3配置使SUMO化肽段鉴定数提升13%，PSM总数提升7%，谱图强度覆盖度中位数从40%增至45%，Andromeda评分中位数提升9%。新增鉴定肽段主要来源于SBM 3与SBM 8搜索，且非SUMO肽段评分不受影响。

MaxSBM?exclusive SUMO sites conform to known biological properties

SBM独有SUMO位点富集于蛋白质无序区域（AlphaFold pLDDT值低），KxE基序遵从率达26.9%，与已知生物学特征一致，未显示假阳性倾向。独有靶蛋白仍主要定位于细胞核，符合SUMO化预期分布。

Comparison with existing tools for the identification of SBMs and complex PTMs

在未使用Percolator时，MaxSBM优于MSFragger?Labile。经Percolator重打分后，MaxSBM鉴定肽段数提升72.7%，较MSFragger?Labile高出25.2%。两种引擎结果部分重叠但互补，单PSM支持的肽段占比高，提示需谨慎评估置信度。

Deriving Biological Insight

在SUMO?MEC数据集中，SBM 3使SUMO化位点增加21.7%，新鉴定168个核定位靶蛋白，参与转录调控等功能。在SUMO?Adip数据集中，位点增加24.1%，新发现300个核定位靶蛋白，同样富集于DNA结合与转录过程。

讨论与结论

该研究证明，在DDA数据库搜索中纳入SBM裂解产生的p?ions，可在不降低特异性的前提下提升SUMO化鉴定的灵敏度与数据完整性。最优p?ions数量为3个，过多会扩大搜索空间导致反库匹配增加。Percolator重打分可大幅提升鉴定数量，但需注意单PSM肽段的可靠性。MaxSBM对泛素等大尺寸修饰提升有限，更适合中等大小、产生1?6个中性丢失的PTM。该模块已集成至MaxQuant，支持Windows与Linux系统，配套脚本与数据已开源，为SUMO化及其他SBM研究提供了稳健的分析工具，有助于深入解析蛋白质修饰调控网络。

联系信箱：

粤ICP备09063491号

热点排行