基于蛋白中心策略与跨样本匹配糖蛋白质组学鉴定肝癌稳健位点特异性糖链生物标志物

《Advanced Science》:A Protein-Centric Strategy Coupled with Match-Between-Run Glycoproteomics Enables Discovery of Robust Site-Specific Glycan Biomarkers for Hepatocellular Carcinoma

【字体: 时间:2026年02月13日 来源:Advanced Science 14.1

编辑推荐:

  这篇综述提出了一种创新的蛋白质中心策略,结合跨样本匹配(MBR)糖蛋白质组学技术,系统性筛选易发生异常糖基化的蛋白,旨在发现用于肝细胞癌(HCC)诊断的稳健位点特异性糖链生物标志物。研究通过分析200例临床样本,将可定量位点特异性糖链数量提升6.2倍,并鉴定出包括纤维连接蛋白(Fibronectin)在内的26个关键糖蛋白。其中,纤维连接蛋白上的特定糖链N1007_H5N4S2展现出卓越的诊断性能,尤其在对早期和甲胎蛋白(AFP)阴性HCC的检测中显著优于AFP。研究为HCC的早期、精准诊断提供了新的思路和强有力的候选标志物。

  
引言
肝细胞癌(HCC)是全球癌症相关死亡的主要原因之一,其高死亡率与晚期诊断和治疗选择有限密切相关。蛋白质糖基化是一种关键的翻译后修饰,其失调被认为是癌症的标志。尽管目前已批准用于临床的肿瘤生物标志物大多是血清糖蛋白,如用于卵巢癌的CA125、用于前列腺癌的PSA以及用于HCC的甲胎蛋白(AFP)及其核心岩藻糖基化亚型AFP-L3,但仍有大量AFP阴性的HCC患者,因此发现具有异常糖基化的新型生物标志物候选物至关重要。当前糖蛋白质组学研究通常受限于单个质谱文件的定量能力有限,且主要关注失调的糖肽而忽略了其底层的糖蛋白。为了解决这些问题,本研究提出了一种蛋白质中心策略,旨在优先筛选易发生异常糖基化的蛋白质,以期发现先前被忽视的癌症相关蛋白。
研究设计与平台评估
本研究设计了一个整合高通量、高重现性、高灵敏度平台与蛋白质中心筛选策略的工作流程。研究共分析了200份临床血清样本,分为发现队列和验证队列。平台采用自动化高效液相色谱-亲水相互作用色谱策略进行糖肽富集,使用稳定的微流而非纳流液相色谱-串联质谱系统进行分析,并应用新开发的Glyco-Decipher软件及其跨样本匹配功能进行N-糖肽鉴定和定量,以提高灵敏度。质量控制样本分析显示,该平台在N-糖蛋白质组鉴定和定量方面表现出色,相对标准偏差低于6%,平均皮尔逊相关系数高于0.92,证明了其稳定性和重现性。跨样本匹配功能显著降低了数据缺失值比例,在发现队列数据集中,将具有缺失值的位点特异性糖链比例从85.2%降至19.4%,并使单次分析中可定量的位点特异性糖链数量增加了6.2倍。
跨样本匹配量化实现HCC位点特异性糖链的深度差异分析
在发现队列中,共鉴定到19,124个完整N-糖肽和18,430个位点特异性糖链。应用跨样本匹配后,统计分析在HCC与健康对照样本之间得到了1,038个显著失调的位点特异性糖链,相较于传统方法增加了4.8倍,极大地丰富了诊断标志物的候选库。均匀流形近似与投影分析显示HCC组与健康对照组明显分离,且HCC组表现出更高的糖基化异质性。对复杂/杂合型糖链亚型的分析发现,在上调组中,同时包含岩藻糖基化和唾液酸化的糖链比例显著更高,而下调组中仅唾液酸化的糖链比例较高,这提示疾病发生可能优先促进已携带唾液酸的糖链发生岩藻糖基化。
通过蛋白质中心策略筛选易发生失调糖基化的蛋白
对失调位点特异性糖链在蛋白质间的分布分析发现,携带大量失调糖链的蛋白相对较少,而携带少量失调糖链的蛋白更为普遍。为此,研究提出了蛋白质中心策略,即根据蛋白所携带的失调位点特异性糖链数量对糖蛋白进行排名,并选择排名靠前的作为易发生异常糖基化的候选蛋白。在发现队列中,共有253个糖蛋白对应1,038个失调位点特异性糖链。研究选取了前10%(26个)的糖蛋白,每个蛋白包含超过10个失调位点特异性糖链,用于后续分析。这26个蛋白所携带的577个失调糖链,占所有失调糖链的55.6%,覆盖广泛且具代表性。根据文献报道,这些蛋白被分为深入研究、中度研究和极少研究三类,其中大部分为极少研究的糖蛋白,是HCC生物标志物发现的潜在候选者。
差异位点特异性糖链数据集揭示与HCC进展相关的N-糖基化显著改变
利用Mfuzz方法将1,038个失调位点特异性糖链分为4个簇,每个簇表现出不同的丰度变化趋势。其中,簇2和簇3分别在疾病发生发展过程中呈现基本单调的上升和下降趋势。对这些簇中糖链的组成分析发现,簇1和簇2主要富集同时具有岩藻糖基化和唾液酸化的糖链,而簇3和簇4则富集仅唾液酸化的糖链。基因本体富集分析表明,这些变化反映了与HCC相关的动态生物过程,包括免疫反应、炎症和凝血调节。对26个优先蛋白的糖链进行聚类和成员值分析发现,一些蛋白的糖链显著富集于特定簇中,例如蛋白P01009的糖链主要富集在簇2,而蛋白P02763、P02751和P10909的糖链则在簇3中富集,这些蛋白上的异常糖基化模式存在差异。
纤维连接蛋白上的位点特异性糖链在检测早期HCC方面优于AFP
为了发现超越已充分表征糖蛋白的新型诊断标志物,研究重点关注了26个糖蛋白中诊断性能(AUC大于0.8)的位点特异性糖链。根据AUC大于0.8的糖链数量排名,前5位的蛋白分别为P01009、P02751、P03952、P27169和P35858。其中,P02751(纤维连接蛋白)是一个极少被研究的糖蛋白。研究发现,相同的糖链组成在不同糖基化位点上表现出不同的诊断性能,凸显了位点特异性糖链作为疾病检测潜在生物标志物的重要性。纤维连接蛋白上的9个位点特异性糖链显示出卓越的诊断性能,其相对丰度在健康对照与TNM-I期HCC病例间存在统计学显著差异,而AFP的丰度在两组间无显著差异。受试者工作特征曲线分析表明,这9个候选糖链在区分所有HCC、TNM-I期HCC和AFP阴性HCC与健康对照时,其诊断性能均优于血清AFP,这一结果在独立验证队列中得到进一步证实。特别地,位点特异性糖链P02751_N1007_H5N4S2表现尤为出色,在发现和验证队列中对HCC诊断的AUC值分别为0.917和0.946,对早期(I期)HCC诊断的AUC值为0.896和0.919,对AFP阴性HCC诊断的AUC值为0.894和0.908。
结合来自两个易发生异常糖基化糖蛋白的位点特异性糖链可提升诊断性能
鉴于多个生物标志物的组合可能增强诊断性能,研究接下来评估了由两个位点特异性糖链组成的组合板对HCC的诊断能力。通过六层筛选流程,从初始的166,176个独特组合中,最终筛选出4个在测试集和验证集中AUC值均大于0.940的最佳组合板。有趣的是,70个组合板中有68个在每个板中包含一个上调和一个下调的位点特异性糖链。筛选出的4个组合板也遵循这一模式。正如预期,所选4个组合板的AUC性能在区分HCC与健康对照时,在两个队列中均 consistently 优于单个特征。其中,组合板3(包含P02751_N1007_H5N4S2和P01009_N107_H9N3)表现出最佳诊断性能,在发现和验证队列中对HCC诊断的AUC值分别为0.950和0.973,对早期(I期)HCC诊断的AUC值为0.976和0.922,对AFP阴性HCC诊断的AUC值为0.948和0.867。
讨论
本研究通过整合蛋白质中心策略与先进的质谱工作流程,在HCC特异性糖基化失调方面取得了深入见解,并鉴定了稳健的血清生物标志物候选物。研究的创新主要体现在三个方面:首先,在大规模HCC队列研究中于位点特异性糖链水平应用跨样本匹配方案,推进了单次糖肽定量并提高了鉴定重现性和灵敏度;其次,引入了蛋白质中心策略来优先筛选具有多个失调位点特异性糖链的蛋白质,旨在发现传统方法较少研究的蛋白并表征其失调糖基化模式;最后,验证了由蛋白质中心策略筛选出的优先蛋白中的上调和下调位点特异性糖链组合而成的诊断组合板在检测AFP阴性和早期病例方面的稳健性能。在识别的26个易发生异常糖基化的蛋白中,纤维连接蛋白作为一个极少被研究的糖蛋白脱颖而出。其位点特异性糖链P02751_N1007_H5N4S2在检测HCC方面展现出卓越的诊断性能,显著优于血清AFP。为了最大化HCC检测的特征覆盖,研究使用来自26个蛋白的成对失调位点特异性糖链构建了机器学习模型。经过筛选,组合板3(P02751_N1007_H5N4S2与P01009_N107_H9N3的组合)表现出增强的性能。鉴于PIVKA-II/DCP与本研究鉴定的糖蛋白生物标志物参与肝癌发生的不同生物学通路,未来结合这些生物标志物有望在检测早期HCC或AFP阴性病例方面取得更优性能。
实验方法
研究使用了尿素、碳酸氢铵、二硫苏糖醇、碘乙酰胺、三氟乙酸、甲酸、胰蛋白酶等化学品和试剂。临床样本收集经大连医科大学附属第二医院伦理委员会批准。在整合平台中,使用自动化高效液相色谱-亲水相互作用色谱策略对完整N-糖肽进行富集。富集的糖肽使用与Orbitrap Exploris 480质谱仪联用的Ultimate 3000液相系统进行微流液相色谱-串联质谱分析。数据使用Glyco-Decipher软件进行搜索,并使用其内置的GlyPep-Quant定量软件进行跨样本匹配分析。经过过滤和归一化等预处理后,使用t检验进行差异分析,并构建随机森林模型评估组合板的诊断性能。
结论
综上所述,通过整合蛋白质中心策略与跨样本匹配增强的糖蛋白质组学,本研究能够检测到先前被排除在分析之外的低丰度糖肽,鉴定了稳健的HCC生物标志物,并为在癌症中优先筛选易发生异常糖基化的糖蛋白提供了一个框架。研究结果凸显了位点特异性糖链作为优越诊断工具的潜力,特别是在应对检测AFP阴性和早期HCC亚群这一关键挑战方面。尽管存在一些局限性,例如处于发现阶段、缺乏肝硬化患者样本以及缺少蛋白质水平的定量数据,但本研究为推进糖蛋白质组学研究从发现走向临床应用奠定了基础。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号