基于QuantUMS的质谱蛋白质组学精准定量方法

《Nature Biotechnology》:Accurate quantification in proteomics with QuantUMS

【字体: 时间:2026年05月28日 来源:Nature Biotechnology 41.7

编辑推荐:

  在基于质谱(MS)的蛋白质组学中,确保蛋白质定量结果的准确性仍具挑战性。研究人员开发了QuantUMS(quantification using an uncertainty-minimizing solution,基于不确定性最小化的定量解决方案),这是一种

  
在基于质谱(MS)的蛋白质组学中,确保蛋白质定量结果的准确性仍具挑战性。研究人员开发了QuantUMS(quantification using an uncertainty-minimizing solution,基于不确定性最小化的定量解决方案),这是一种基于机器学习的方法,可动态调节定量算法以降低定量误差。当应用于数据非依赖采集(DIA)蛋白质组学时,QuantUMS提升了定量的准确度与精密度,缓解了比率压缩偏倚(ratio compression bias),并增强了差异表达分析的性能。此外,该方法可提供定量不确定度指标,支持对单个定量结果的质量控制。

研究背景与意义

基于液相色谱-串联质谱(LC–MS)的鸟枪法蛋白质组学近年来在仪器灵敏度、采集模式及数据分析软件等方面快速发展,其中数据非依赖采集(DIA)因覆盖度高、重现性好等优势成为主流技术。然而,现有DIA定量方法仍存在显著局限:传统算法仅利用少量碎片离子信号,丢弃了前体离子(MS1)等多维度定量信息;共洗脱肽段的信号干扰导致比率压缩偏倚,尤其影响低丰度蛋白的定量准确性;且目前缺乏可靠的定量误差评估体系,仅能通过变异系数(CV)间接判断,无法识别单样本中的系统性偏差。这些问题限制了蛋白质组学在精准医学等对定量可靠性要求极高的场景中的应用。为此,研究人员开发了QuantUMS算法,通过统计建模整合多源定量特征,实现误差最小化与质量控制,相关成果发表于《Nature Biotechnology》。

关键技术方法

研究采用多中心公开数据集进行验证,涵盖混合物种基准数据集(人K562细胞与大肠杆菌胰酶消化物按预设比例混合)、人成纤维细胞扰动数据集、慢性淋巴细胞白血病(CLL)临床队列数据集,以及不同质谱平台(timsTOF Pro、TripleTOF 6600、Orbitrap Astral)生成的DIA数据。核心技术方法包括:QuantUMS算法开发——基于自动微分与梯度下降优化超参数,整合MS1前体离子与MS/MS碎片离子的强度及质量评分,构建加权聚合模型以最小化定量不确定度;对比基准测试——设置高精度与高准确度两种预配置模式,与DIA-NN传统定量模式(“legacy”模式)进行多维度性能比较;下游分析验证——采用Welch's t检验与limma包进行差异表达分析,结合经验错误发现率(FDR)评估定量准确性对生物学推断的影响。

研究结果

QuantUMS performs statistically justified minimization of quantification uncertainty

QuantUMS通过输入每个前体的MS1与MS/MS信号强度及对应质量评分,建模信号的对数偏差与对数方差,以加权聚合方式计算前体定量值,并将不确定度传递至蛋白水平,生成“定量质量”指标。在5分钟梯度的timsTOF Pro混合物种数据中,高精度模式的人蛋白定量平均绝对对数偏差(MAD)达0.10,大肠杆菌蛋白MAD较传统模式降低1.7倍(0.33至0.19);高准确度模式将大肠杆菌MAD进一步降至0.15,消除比率压缩的同时保持可比精密度。该优势在不同质谱平台(包括Orbitrap Astral)中均得到验证,且超参数优化仅需部分样本即可稳定反映仪器与样本基质特性。

QuantUMS boosts the sensitivity of differential expression analysis

在差异表达分析中,QuantUMS显著提升检测效能。于人成纤维细胞扰动数据集(20例样本,69分钟nanoLC梯度),高准确度模式在1%与5% FDR下检出的差异表达蛋白数量均为传统模式的2倍以上,较原研究使用的DIA-NN 1.8版本提升3倍以上;基于QuantUMS定量质量指标的过滤可进一步降低多重检验负担,提升检出效率。于CLL临床队列数据集(50例样本,100分钟nanoLC梯度),QuantUMS在所有表型关联分析中均较传统模式检出更多差异表达蛋白。研究指出,其优势在低生物变异的样本(如细胞系)中更为显著,而在异质性较高的临床样本中受限于生物学变异本身的影响。

讨论与结论

研究证实,QuantUMS通过整合多源定量信息与统计建模,解决了非靶向蛋白质组学中定量质量控制缺失的长期难题。其核心创新在于:首次实现了无需实验设计先验知识的定量偏倚校正,平衡了精密度与准确度的权衡;提供了可量化的单样本定量质量指标,替代传统CV评估,支持自动化数据过滤。未来,QuantUMS可拓展至选择性反应监测(SRM)等其他多通道定量技术,并与MSstats、Triqler等下游统计工具整合,构建全流程不确定性感知的蛋白质组学分析体系。这一方法将推动蛋白质组学在单细胞、空间蛋白质组学及临床转化研究中的可靠应用,为精准医学提供更高置信度的分子定量数据支撑。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号