《Science Bulletin》:The emerging role of high-throughput proteomics in advancing precision medicine
编辑推荐:
蛋白质组学为精准医学提供动态分子机制解析,通过高throughput平台捕获疾病特异性蛋白表达谱,结合AI算法(如DIA-NN、MaxQuant)实现精准生物标志物发现、疾病预测及靶向药物开发。研究指出血浆蛋白组学可提前数年预测神经退行性疾病,且通过跨疾病分析发现共享与特异性分子通路。当前挑战包括样本预处理标准化不足及数据整合复杂性,未来需通过微流控与质谱联用技术提升临床转化效率。
Jia You|Yue-Ting Deng|Luo Chen|Lin-Bo Wang|Yu Guo|Ze-Yu Li|Jian-Feng Feng|Jin-Tai Yu|Wei Cheng
上海复旦大学附属华山医院神经科与国家神经疾病中心,脑功能与疾病国家重点实验室,脑启发智能科学技术研究所,中国上海200433
摘要
蛋白质是细胞功能的基本执行者,也是连接基因组与表型的关键介质,为理解人类疾病的分子机制提供了独特的视角。最近的技术突破使得能够量化数千种蛋白质,为在蛋白质组水平上探索人类健康开辟了前所未有的途径。随着蛋白质组数据生成规模和深度的扩大,将蛋白质组特征转化为临床实践的新机会不断涌现,为精准医疗铺平了道路。在这篇综述中,我们总结了利用蛋白质组学进行生物标志物发现、疾病诊断和预测以及药物开发的最新进展。我们还重点介绍了革新人工智能策略在蛋白质组分析和解释方面的应用。最后,我们讨论了实现蛋白质组学在精准医疗中全部潜力所面临的关键挑战、限制和未来前景。
引言
精准医疗代表了医疗保健领域的范式转变,旨在根据个体的生物学差异来定制预防、诊断和治疗策略[1],[2]。通过超越传统的“一刀切”方法,它试图通过更针对性和精确的干预措施来改善临床结果[3],[4]。在过去的几十年中,基因组学在揭示疾病易感变异及其潜在机制方面发挥了关键作用[5],[6],[7]。然而,基因组的静态特性限制了我们对疾病过程中发生的动态分子变化的了解[8]。因此,许多紧迫的临床挑战,如检测早期疾病信号、跟踪疾病进展和监测治疗效果,仍然难以解决。
蛋白质组学已成为解决这些未满足临床需求的强大工具。作为基因的主要功能产物和治疗靶点的主要来源,蛋白质能够即时且动态地反映人体的生理和病理状态[9],[10],[11]。高通量蛋白质组技术的进步使得在过去十年中能够同时评估大约1000到超过10,000个靶点的蛋白质丰度[12],[13],[14]。这些能力以前所未有的规模和深度彻底改变了蛋白质解码的方式,使蛋白质组学成为精准医疗不断完善的基石。例如,大规模蛋白质组学研究最近发现了能够在临床症状出现前几年预测神经退行性疾病的血浆生物标志物,为早期检测和个性化干预提供了非侵入性的方法[15],[16],[17],[18]。此外,研究还揭示了广泛疾病中的共有和特定分子特征,从而促进了跨疾病生物标志物的发现、更细致的患者分层以及改进的诊断、预测和治疗策略[19],[20],[21],[22],[23],[24]。
这篇综述重点关注高通量蛋白质组学在精准医疗中的新兴作用。我们总结了蛋白质组学技术的最新进展及其在识别有价值的生物标志物、实现早期和准确的疾病诊断和预测以及为药物发现和治疗决策提供信息方面的应用。特别关注人工智能(AI)可以为精准医疗中的上述实践带来的新视角(图1)。此外,我们还讨论了在临床环境中实施蛋白质组学的机遇和挑战,并探讨了其与其它组学方法的结合如何塑造下一代个性化医疗(表1)。
部分摘录
蛋白质组学在生物标志物发现中的应用
蛋白质组学在生物标志物发现中具有重要价值,因为它能够全面分析健康和疾病状态下的蛋白质表达、修饰和相互作用。与揭示静态遗传信息的基因组学相比,蛋白质组学能够捕捉人体内的动态变化,使其特别适合识别疾病特异性特征。高通量蛋白质组平台能够检测低丰度蛋白质和翻译后修饰
蛋白质组学在疾病诊断和预测中的应用
几十年来,静态的多基因风险评分(PRS)被广泛用于估计疾病易感性,而代谢组学则更接近表型终点和动态生理读数。相比之下,蛋白质组学通过捕捉由遗传变异和环境因素共同塑造的实时功能状态,占据了独特的信息优势,同时相对于代谢谱具有更高的稳定性。
蛋白质组学在药物发现和精准治疗中的应用
目前,药物发现主要涉及两种策略:基于靶点的发现和基于表型的发现。通常,基于靶点的药物发现通过抑制或降解特定蛋白质或生物过程来验证疾病相关性,然后测量化合物库对这些靶点的活性[76]。基于质谱(MS)的蛋白质组学有助于直接分析小分子与蛋白质组之间的相互作用。传统的靶点识别方法往往
人工智能在蛋白质组学分析中的辅助作用
人工智能(AI)与蛋白质组学的结合彻底改变了疾病风险预测、生物标志物发现和药物靶点评估[103]。蛋白质组的复杂性包括通过可变剪接、翻译后修饰和蛋白水解等机制产生的数十万种不同的蛋白质和异构体。这种惊人的多样性支撑了人类生物学的动态功能景观。然而,这些数据的复杂性和体积
挑战与限制
蛋白质组技术通过实现大规模蛋白质分析彻底改变了疾病研究,但将其整合到临床实践中仍面临多重挑战。一个关键的技术限制是缺乏标准化的样本预处理协议,这导致了实验室间的差异并影响了数据的可重复性[139],[140]。例如,不同的血液样本处理方法可能会显著影响蛋白质组未来展望
蛋白质组学的未来在于将蛋白质水平的发现转化为可用于疾病诊断、亚型分类、治疗靶向和治疗监测的实际工具[152]。随着质谱(MS)和微流控技术的成熟,如芯片实验室(lab-on-a-chip)结合Orbitrap仪器的平台正在实现更加标准化、高通量和临床可扩展的蛋白质组学工作流程[153]。与此同时,像DIA-NN和MaxQuant这样的AI驱动算法正在提高准确性和
结论
大规模血浆蛋白质组学研究为理解疾病和精准医疗带来了令人兴奋的突破。通过深入分析,蛋白质可以在临床症状出现之前反映早期的生物学变化,并帮助识别不同条件下的疾病特异性和共有通路。更重要的是,它们在预测疾病风险方面表现出色,通常比传统的风险因素或遗传评分更有效,强调了其在
致谢
本研究得到了非传染性慢性疾病-国家科技重大项目(2025ZD0546300)、中国国家重点研发计划(编号2023YFC3605400)、脑科学与类脑智能技术-国家科技重大项目(2022ZD0211600)、国家自然科学基金(82472055, 62433008;82530047, 82588301, 82271471;T2522009, 82402381;824B2035)以及学科领先项目的资助