《Molecular & Cellular Proteomics》:Improved peptide search for identification of SUMO and sequence-based modifications, in MaxSBM
编辑推荐:
翻译后修饰(post?translational modifications,PTM),如SUMO化(SUMOylation)和泛素化(ubiquitination),通过共价结合至赖氨酸残基调控关键细胞进程。尽管质谱技术可实现PTM的位点特异性鉴定,但现有多
翻译后修饰(post?translational modifications,PTM),如SUMO化(SUMOylation)和泛素化(ubiquitination),通过共价结合至赖氨酸残基调控关键细胞进程。尽管质谱技术可实现PTM的位点特异性鉴定,但现有多数搜索引擎主要针对小型、不裂解的修饰进行优化,难以检测大型、可裂解的蛋白质类修饰因子。研究人员将此类修饰定义为序列依赖性修饰(sequence?based modifiers,SBM)。为克服这一局限,研究人员在MaxQuant框架内开发了针对SBM的专用搜索策略,在肽段鉴定过程中充分考虑SBM的裂解行为。利用公开数据集,研究人员验证了该方法在SUMO2/3上的适用性。分析发现,SBM裂解具有独特的诊断特征和特征性质量偏移,本研究将其分别命名为诊断离子(diagnostic ions,d?ions)和修饰离子(PTM ions,p?ions)。通过利用这些特征,该方法在人类细胞系中将SUMO化肽段的鉴定数量提升约13%,在小鼠胚胎细胞中提升约22%,在小鼠脂肪细胞中提升约24%。该搜索方法使SBM的谱图注释水平提升,Andromeda评分中位数最高提高9%。综上,研究人员展示了SBM搜索策略在提升蛋白质类修饰发现能力方面的潜力。
研究背景与意义
SUMO化等翻译后修饰(PTM)在细胞核质运输、DNA损伤应答、基因转录调控等关键生物学过程中发挥重要作用,其异常与肿瘤、糖尿病等疾病密切相关。基于质谱(MS)的蛋白质组学虽已广泛用于PTM鉴定,但针对大型、易裂解的序列依赖性修饰(SBM,如SUMO、泛素),传统搜索引擎因未考虑其复杂裂解模式,鉴定灵敏度低。现有工具如MSFragger?Labile、pLink等存在兼容性差、依赖过时编译器等问题,亟需优化的分析方案。该研究由丹麦哥本哈根大学等团队完成,成果发表于《Molecular & Cellular Proteomics》。
关键技术方法
研究采用已发表的四个公共数据集:人类HEK细胞SUMO?HEK(PXD008003)、小鼠脂肪细胞SUMO?Adip(PXD024144)、小鼠胚胎细胞SUMO?MEC(PXD017697)及人泛素Ub?LysC(PXD006201)。在MaxQuant 2.6.8.0中开发MaxSBM模块,引入SBM特有的诊断离子(d?ions)和修饰离子(p?ions)至理论谱图空间。通过参数优化确定最优p?ions组合为p2、p3、p7。同时使用Percolator进行半监督重打分,并与MSFragger?Labile流程进行性能对比。所有统计分析与可视化均基于Python生态工具完成。
研究结果
Implementation of MaxSBM
研究人员构建了集成于MaxQuant的MaxSBM模块,针对SUMO2/3残留序列DVFQQQTGG设计d?ions与p?ions理论库。该模块扩展了Andromeda搜索引擎的理论峰列表生成逻辑,在传统b/y离子基础上纳入SBM特异离子系列,显著提升谱图匹配复杂度。
MaxQuant GUI configuration
MaxSBM通过图形界面“序列依赖性修饰”选项启用,支持用户输入修饰序列自动计算中性丢失质量。鉴定结果可在MaxQuant谱图查看器中展示p?ions注释,并输出至msms.txt与sites.txt文件,推荐结合Perseus平台进行下游分析。
Optimization of the search space for efficient identification of SUMOylation
通过对SUMO?HEK数据集的系统优化,研究人员确定包含3个p?ions(p2、p3、p7)为最优配置。d?ions虽不影响鉴定数量,但可提升谱图峰覆盖度、匹配峰数量及强度覆盖,作为SUMO化存在的内部验证依据。
Enhanced identification rates using MaxSBM
相比标准搜索,SBM 3配置使SUMO化肽段鉴定数提升13%,PSM总数提升7%,谱图强度覆盖度中位数从40%增至45%,Andromeda评分中位数提升9%。新增鉴定肽段主要来源于SBM 3与SBM 8搜索,且非SUMO肽段评分不受影响。
MaxSBM?exclusive SUMO sites conform to known biological properties
SBM独有SUMO位点富集于蛋白质无序区域(AlphaFold pLDDT值低),KxE基序遵从率达26.9%,与已知生物学特征一致,未显示假阳性倾向。独有靶蛋白仍主要定位于细胞核,符合SUMO化预期分布。
Comparison with existing tools for the identification of SBMs and complex PTMs
在未使用Percolator时,MaxSBM优于MSFragger?Labile。经Percolator重打分后,MaxSBM鉴定肽段数提升72.7%,较MSFragger?Labile高出25.2%。两种引擎结果部分重叠但互补,单PSM支持的肽段占比高,提示需谨慎评估置信度。
Deriving Biological Insight
在SUMO?MEC数据集中,SBM 3使SUMO化位点增加21.7%,新鉴定168个核定位靶蛋白,参与转录调控等功能。在SUMO?Adip数据集中,位点增加24.1%,新发现300个核定位靶蛋白,同样富集于DNA结合与转录过程。
讨论与结论
该研究证明,在DDA数据库搜索中纳入SBM裂解产生的p?ions,可在不降低特异性的前提下提升SUMO化鉴定的灵敏度与数据完整性。最优p?ions数量为3个,过多会扩大搜索空间导致反库匹配增加。Percolator重打分可大幅提升鉴定数量,但需注意单PSM肽段的可靠性。MaxSBM对泛素等大尺寸修饰提升有限,更适合中等大小、产生1?6个中性丢失的PTM。该模块已集成至MaxQuant,支持Windows与Linux系统,配套脚本与数据已开源,为SUMO化及其他SBM研究提供了稳健的分析工具,有助于深入解析蛋白质修饰调控网络。