加速医学合作计划帕金森病蛋白质组学:推动帕金森病研究的综合资源平台

《Movement Disorders》:Accelerating Medicines Partnership? Parkinson's Disease Proteomics: A Comprehensive Resource for Advancing Parkinson's Disease Research

【字体: 时间:2026年02月06日 来源:Movement Disorders 7.6

编辑推荐:

  本综述系统介绍了加速医学合作计划帕金森病(AMP PD)项目发布的蛋白质组学数据集,涵盖靶向(Olink?)和非靶向(数据非依赖采集,DIA)蛋白质组学技术。文章详细阐述了脑脊液(CSF)和血浆样本的纵向蛋白质组学分析结果,展示了差异表达蛋白与PD临床亚型、遗传变异(如LRRK2、GBA1、SNCA)的关联。该资源平台整合了多组学数据(全基因组测序WGS、转录组等),为发现PD诊断/进展生物标志物、揭示疾病机制(如线粒体功能障碍、神经炎症)提供了重要支持。

  
Abstract
Background
蛋白质组学分析的最新进展使其成为阐明帕金森病分子机制的重要方法,能够识别疾病相关蛋白质改变以及用于诊断、进展和治疗反应的候选生物标志物。
Objectives
加速医学合作计划帕金森病(AMP PD)项目是由美国国立卫生研究院(NIH)、多家生物制药和生命科学公司以及非营利组织组成的公私合作伙伴关系,由美国国立卫生研究院基金会(FNIH)管理。该计划旨在通过对患者数据和生物样本进行深度纵向分析,推进PD的分子和临床特征描述,目标是识别和验证PD的诊断、预后和进展生物标志物。
Methods
对脑脊液(CSF)和血浆样本进行了纵向蛋白质组学分析,包括靶向和非靶向方法。生成的数据集可通过AMP? PD知识平台公开获取。
Results
蛋白质组学数据集支持差异蛋白质分析,可用于探索与PD进展和异质性相关的分子改变。
Conclusions
这些研究通过为研究界提供统一的蛋白质组学数据集,为更广泛的AMP PD计划做出了贡献。作为更大的AMP PD数据的一部分,这项工作为PD社区提供了一个统一且可访问的蛋白质组学数据集,可用于发现、假设生成和用户自身研究的验证。
引言
蛋白质组学
蛋白质组学是大规模研究蛋白质的学科,旨在理解蛋白质的动态变化。随着蛋白质组学领域的技术发展,如今对生物体液进行大规模蛋白质组学分析以发现生物标志物已成为可能,特别是在表达蛋白质组学方面。质谱仪和基于亲和力的平台的进步正在推动蛋白质组覆盖范围和处理通量,允许在更多生物样本中量化更多蛋白质,此外,现在利用高灵敏度仪器进行单细胞蛋白质组学研究也已成为可能。随着该领域的快速发展,将这些尖端方法应用于神经退行性疾病的研究代表了一个合乎逻辑且充满希望的下一步。此类应用具有巨大潜力,可以阐明这些复杂疾病的分子和细胞基础,最终为生物标志物发现和治疗开发提供信息。
帕金森病
帕金森病(PD)是一种异质性疾病,具有广泛的病因学、致病因素和临床表现谱。大约3-5%的PD病例与已知PD基因相关的单基因原因有关。相比之下,大多数PD病例是特发性的,并受到复杂遗传结构的影响。最近的全基因组关联研究已识别出超过90个其他遗传风险变异,占非单基因PD遗传风险的16-36%。
PD的遗传风险与几个基因相关,包括SNCA、LRRK2、Parkin、PINK1、DJ-1、ATP13A2、MAPT、GBA1以及其他涉及PD发病机制和更广泛神经退行性变的多种生物途径的基因。尽管许多病例中没有遗传风险因素,但已显示特发性PD患者具有在单基因形式疾病中观察到的蛋白质组学表型。类似地,与PD相关的LRRK2突变标志——LRRK2激酶活性升高,也在没有此类突变的PD患者中观察到。这些发现表明,复杂的多基因影响可能汇聚于常见的蛋白质组学改变,从而在分子水平上重现单基因PD的某些方面。
因此,复杂的多基因性状可能导致蛋白质组发生类似于由PD相关单基因风险因素引起的变化。在特征明确的队列中大规模测量蛋白质组变化可能为PD的根本原因提供更深入的见解,识别新的生物标志物,并支持靶向治疗方法。
PD研究中的蛋白质组学
先前关于PD蛋白质组学分析的工作通过检查PD病例和对照的死后脑组织、脑脊液(CSF)和外周血中的差异蛋白质组表达水平,已识别出几种有前景的诊断候选生物标志物。许多这些差异表达的蛋白质与PD发病机制中涉及的生物途径相关,包括氧化应激、线粒体功能障碍、蛋白质降解受损和炎症。尽管取得了这些进展,但仍然迫切需要更大的独立队列中验证这些发现,并建立蛋白质表达谱与临床相关结果之间的稳健关联。这些努力对于将蛋白质组学发现转化为可操作的诊断和治疗工具至关重要。
加速医学合作计划帕金森病
使用大型独立数据集进行稳健验证在PD中尤其关键,PD是一种在遗传病因学和临床进展方面都具有相当大异质性的疾病。加速医学合作计划帕金森病(AMP PD)计划产生的蛋白质组学数据集代表了PD蛋白质组学研究中前所未有的发现和验证资源。该资源能够对周围血和CSF中蛋白质表达的时间变化进行高分辨率分析,评估表达谱的个体间变异性,并将蛋白质组学特征与统一的临床和多组学数据整合。
AMP PD的一个标志是其对开放科学和数据共享的承诺。这包括在AMP? PD知识平台中托管全面的PD相关数据集的传播,例如来自帕金森进展标志物计划(PPMI)和帕金森病生物标志物项目(PDBP)队列的蛋白质组学数据。一个核心目标是开发对研究界具有广泛实用性的数据集。因此,原始数据和汇总数据都可供使用,以适应从新手到高级计算科学家的各种专业水平的用户。
在撰写本文时,AMP PD知识平台包括所有参与者的统一临床数据,以及10,590个联合基因分型样本的全基因组测序(WGS)数据,4123名参与者的批量转录组学数据,包含10,609个全血批量RNA样本,通过靶向和非靶向分析捕获的695个个体的蛋白质组学谱,以及来自100名参与者的死后单核RNAseq数据,涵盖五个大脑区域,并与WGS和临床元数据相关联。
在第一阶段成功的基础上,AMP PD最近启动了加速医学合作计划帕金森病及相关疾病(AMP PDRD)。这项扩展的努力旨在纳入相关的突触核蛋白病和非典型帕金森综合征,如路易体痴呆(DLB)、多系统萎缩(MSA)、快速眼动(REM)睡眠行为障碍(RBD)和进行性核上性麻痹(PSP)。AMP PDRD的目标是促进生物标志物的发现和验证,推进多组学分子分析,并在更广泛的神经退行性疾病谱中完善内表型策略。
互补项目
除了AMP PD,几个联合项目和合作联盟也通过以数据为中心的方法显著推进了我们对PD和更广泛神经退行性生物学的理解。
全球神经退行性变蛋白质组学联盟(GNPC)是一项雄心勃勃的合作性神经退行性疾病生物标志物发现计划,汇集了学术界、政府和行业合作伙伴。GNPC的版本1统一数据集(HDS)包含来自20多个国际队列贡献的超过35,000个患者样本的蛋白质组学数据,总计近2.5亿个独特的蛋白质测量值。涵盖阿尔茨海默病(AD)、PD、肌萎缩侧索硬化症和额颞叶痴呆,HDS支持纵向和横断面分析,是神经退行性变可用的最大蛋白质组学生物标志物数据集。通过整合蛋白质组学和蛋白质基因组学分析,GNPC旨在阐明疾病特异性和共享的分子机制。
补充这些努力的是英国生物银行制药蛋白质组学项目,这是一个里程碑式的倡议,专注于以前所未有的规模绘制血浆蛋白质组。通过测量近53,000名参与者中约1500种传统上难以捉摸的蛋白质,该项目正在生成一个基础资源,以探索蛋白质表达与广泛临床表型之间的关联。
在这个不断发展的格局中,AMP PD贡献了一个独特且注释丰富的数据集,支持PD研究中对大规模、统一和临床整合的蛋白质组学资源日益增长的需求。本资源文章概述了通过AMP PD可用的蛋白质组学数据,提供了数据访问和分析的指导,并重点介绍了为促进更广泛研究界使用这些数据而开发的案例研究和工具。
患者与方法
队列
AMP PD Release 4使用了来自PDBP和PPMI队列参与者的血浆和CSF样本。所有参与者都提供了书面知情同意书,所有方案都获得了当地机构审查委员会和伦理批准。进一步的队列特定细节可通过AMP PD网站和各自的队列研究网页获取。
样本收集
样本收集和生物样本库通过印第安纳大学的共享基础设施和统一协议得到BioSEND和MJFF生物样本库的支持。可以访问PDBP和PPMI的详细生物样本库协议。
样本选择标准
血红蛋白污染<100 ng的CSF样本被优先用于非靶向蛋白质组学分析,以尽量减少血液蛋白质的干扰。为了能够进行纵向分析,根据在至少三个时间点有匹配的血浆和CSF可用,以及在AMP PD中有相应的临床和多组学数据来选择受试者。
尽管Olink?平台不要求CSF中血红蛋白水平低,但为了便于直接比较,在靶向和非靶向分析中都包括了匹配的受试者和样本(在可能的情况下)。来自PPMI和PDBP队列的参与者样本包括PD和健康对照,根据可用于纵向分析的多个时间点的可用性进行优先排序。虽然没有特别选择,但蛋白质组学数据集中存在少量前驱期参与者和已知PD基因突变的参与者。参与者没有根据药物使用情况被排除,因此在下游统计分析中应考虑药物对蛋白质水平的潜在影响。
靶向蛋白质组学方法
详细方法见附录S1中的补充材料。执行了标准的Olink? Explore 1536测定。
非靶向蛋白质组学方法
详细方法见附录S1中的补充材料。利用标准操作程序(SOP)进行样品处理、数据非依赖采集(DIA)和数据处理。
AMP PD数据管理
从提供者处接收的数据被重新格式化为标准的AMP PD结构,纳入AMP PD参与者标识符和蛋白质组学样本ID。所有蛋白质组学数据都经过统一,以与现有的AMP PD基础设施和命名约定保持一致。
数据可用性
蛋白质组学数据处理和质量控制由Olink、AbbVie和Cedars-Sinai医疗中心的Jennifer Van Eyk实验室执行,他们也负责数据管理和重新格式化为AMP PD兼容格式。所有处理后的数据,包括靶向蛋白质组学的归一化蛋白质表达(NPX)文件,以及非靶向蛋白质组学的原始文件(.raw, .wiff)、mzML文件(.mzML)以及片段、肽和蛋白质水平文件都托管在Google Cloud Platform上。
资源可用性
所有AMP PD蛋白质组学资源都在Terra平台上可用,需要Tier 2 AMP PD数据访问权限。经批准的用户可以查看、访问和克隆可用的工作空间和分析笔记本供自己使用。
其他方法
靶向和非靶向蛋白质组学的详细方案可在AMP PD网站上找到。
分析概述
为了支持数据重用,已提供使用靶向和非靶向蛋白质组学数据集的示例分析。这些分析说明了AMP PD蛋白质组学数据的实际应用。
蛋白质组学参与者人口统计学
表1提供了AMP PD蛋白质组学参与者和样本的概述,总结了人口统计学特征,如基线平均年龄、性别、种族和临床状况。蛋白质组学数据分为两类:蛋白质组学数据非依赖采集(PDIA)和蛋白质组学邻位延伸分析(PPEA)。PDIA指通过数据非依赖采集获得的基于质谱的数据,包括CSF和血浆样本。PPEA指使用邻位延伸分析技术生成的Olink数据,可用于CSF和血浆;当前数据集指定为‘D03’,表示AMP PD发布的第三个PPEA数据集。由于纵向采样,样本总数超过了唯一参与者的数量。
AMP PD蛋白质组学分析用例1(靶向)
使用靶向Olink平台分析了总共2872个样本,包括来自CSF的1320个样本和来自血浆的1552个样本,分布在16次访视中。对CSF和血浆样本分别进行了病例-对照差异表达分析。
对每种蛋白质进行了Welch双样本t检验,比较标记为病例和对照的样本之间的表达水平。该分析在名义P值阈值≤0.05下,识别出CSF中71个显著差异表达的蛋白质和血浆中319个蛋白质。其中,有19个蛋白质在血浆和CSF中均显著差异表达。
下一组分析检查了靶向蛋白质组学数据集中代表的两个队列(PPMI和PDBP)之间的差异,以评估这些队列之间差异表达蛋白质的一致性。
在1320个CSF样本中,521个来自PDBP队列,799个来自PPMI。使用Welch双样本t检验进行病例-对照差异表达分析,在PDBP队列中识别出24个显著差异表达的蛋白质,在PPMI队列中识别出25个蛋白质(P ≤ 0.05)。有7个蛋白质在两个队列的CSF中均显著差异表达。
这些结果表明,队列特异性分析产生的重叠差异表达蛋白质少于在组合数据集上执行的分析。
血浆中的1552个样本包括来自PDBP队列的521个样本和来自PPMI队列的1031个样本。对每个队列分别进行了病例-对照差异表达分析,使用Welch双样本t检验应用于每种蛋白质(按OlinkID)。该分析在PDBP队列中识别出161个显著差异表达的蛋白质,在PPMI队列中识别出219个(P ≤ 0.05)。值得注意的是,有32个蛋白质在两个队列中均显著差异表达。
这些分析表明,无论是在总体病例-对照比较中还是在队列特异性分析中,血浆都表现出比CSF更多的差异表达蛋白质,表明基于血浆的蛋白质组学具有更高的灵敏度或更广泛的信号检测能力。
AMP PD蛋白质组学分析用例2(非靶向)
分析了来自血浆和CSF的非靶向蛋白质组学数据,以识别临床和遗传亚组之间的差异表达蛋白质(DEP)。
第一次比较侧重于被诊断为其他神经系统疾病与仅帕金森病(PD)的患者,使用mapDIA对蛋白质水平上经过过滤、批次校正和插补的数据集进行分析。总共有13个DEP满足预定义的阈值|log?倍数变化|≥0.25且P值≤0.05。其中,4个蛋白质下调,9个蛋白质在与其他条件相比PD only条件下上调。值得注意的是,下调的蛋白质包括肌肉特异性蛋白质(例如VCL),而上调的蛋白质主要来源于B细胞(例如免疫球蛋白)和成纤维细胞(例如FGA, FGG)。
第二次分析比较了有和没有PD相关遗传变异(GBA1、LRRK2、SNCA或APOE ε4)的患者。该比较在三个时间点(第0、24和48个月)进行,选择基于样本可用性和访视之间的一致间隔。对这些组的主成分分析(PCA)显示,在所有时间点上,PC1和PC2的分布重叠,表明突变携带者和非携带者之间的全局蛋白质组学谱大致相似。
在蛋白质水平上,差异表达分析在第0个月识别出2个DEP,第24个月没有,第48个月识别出4个DEP,使用相同的显著性和倍数变化标准。观察到一个一致的趋势:在第0个月,促凋亡蛋白MST1在突变携带者中下调,而在第48个月,凋亡抑制剂CD5L在同一组中上调,表明潜在的凋亡信号改变。尽管存在这些差异,每个时间点的PCA显示突变阳性和突变阴性参与者之间没有明显的聚类。
在CSF中,对其他神经系统疾病与仅PD的平行比较也揭示了不同的蛋白质表达模式。CSF中的DEP富含载脂蛋白和免疫反应相关蛋白质,在其他组中表达更高。然而,在CSF和血浆中识别的DEP之间没有观察到重叠,表明在这种比较中存在组织特异性的蛋白质组学特征。
AMP PD蛋白质组学分析用例3(PD突变携带者与非携带者的基线靶向蛋白质组学谱)
使用靶向蛋白质组学数据比较了PD突变携带者(APOE ε4、GBA1和LRRK2)和非携带者在基线(第0个月)的蛋白质表达。分析显示两组之间没有统计学上显著的蛋白质表达差异。如火山图所示,没有蛋白质满足log?倍数变化和P值的预定义阈值,表明在该靶向数据集的基线时没有检测到差异表达。
AMP? PD Terra资源:分析
为补充本文中的分析,已为Tier 2 AMP PD用户提供了一个分析工作空间,提供对AMP PD数据和基于R的Terra笔记本的访问,允许用户复制本出版物中的图表和结果。可通过AMP PD网站访问分析工作空间。
AMP? PD Terra资源
为了支持用户使用可用的蛋白质组学数据,AMP PD开发了两个专用的Terra工作空间,可供具有Tier 2访问权限的用户使用。
‘Getting Started Tier 2 – Proteomics’工作空间包括针对最新AMP PD数据发布的互补R和Python笔记本。这些笔记本旨在帮助用户通过Google云存储(GCS)或BigQuery定位和访问蛋白质组学数据,并演示如何将蛋白质组学数据与相关的人口统计学和临床变量整合。
蛋白质组学质量控制和
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号