《eBioMedicine》:Identification of circulatory neuro-related proteins in Parkinson's disease: an integrated genetic–proteomic–clinical study
编辑推荐:
本研究旨在探索神经相关蛋白作为帕金森病(PD)生物标志物和治疗靶点的作用。研究人员整合了孟德尔随机化(MR)、蛋白质定量性状位点(pQTL)与全基因组关联研究(GWAS)数据,系统评估了184种循环神经相关蛋白与PD风险、发病年龄(AAO)和进展的关联,并开展了临床病例对照验证。结果发现59种蛋白与PD表型显著相关,识别出CLEC1B、IL5RA、SNCG和CDH17等风险相关蛋白及BMP-4、DDR1、GDNF等临床差异表达蛋白。这些发现为PD的机制理解、生物标志物开发和精准治疗提供了新的见解与靶点。
在我们的大脑深处,一场无声无息的战争持续进行着——神经元的缓慢死亡导致了帕金森病(Parkinson's disease, PD),这是仅次于阿尔茨海默病的第二大神经退行性疾病。全球有数百万患者饱受震颤、僵硬、行动迟缓等运动症状,以及抑郁、便秘、认知衰退等非运动症状的困扰。目前,药物治疗主要聚焦于缓解症状,例如补充多巴胺,但无法真正阻止或逆转疾病的进程。科学家们亟需找到能够“治本”的疾病修饰疗法(disease-modifying treatments, DMTs)。那么,从哪里找到突破口呢?
蛋白质,作为生命活动的主要执行者,自然成为了关注的焦点。特别是那些与神经功能密切相关的“神经相关蛋白”,被认为是潜在的生物标志物和治疗靶点。例如,此前的研究已经提示神经炎症标志物可能与PD有关。然而,这些蛋白质在PD中究竟扮演着怎样的角色?哪些是导致疾病的“因”,哪些是疾病导致的“果”?哪些可以作为早期诊断的信号,哪些又能成为精准治疗的靶标?这些问题依然迷雾重重。
为了拨开迷雾,由周航、王子豪、谭子欣等来自中国南方医科大学珠江医院等机构的研究人员组成了跨学科团队,他们决定采用一种强大的工具——孟德尔随机化(Mendelian Randomisation, MR)来探寻答案。MR利用遗传变异作为工具变量,能够推断暴露因素(如蛋白质水平)与结局(如疾病)之间的因果关系,从而有效规避传统观察性研究中的混杂因素。这项开创性的研究成果最终发表在了国际知名期刊《eBioMedicine》上。
研究人员为回答上述问题,运用了几个关键技术方法:首先,他们整合了大规模血浆神经相关蛋白的蛋白质定量性状位点(protein quantitative trait loci, pQTL)数据与目前最大的PD全基因组关联研究(genome-wide association study, GWAS)数据(涉及风险、发病年龄和进展等多种表型)进行孟德尔随机化分析,以鉴定因果关联的蛋白。其次,他们对MR筛选出的阳性关联进行了遗传共定位分析,以判断蛋白质与疾病表型是否共享遗传变异。接着,他们利用STRING和GeneMANIA数据库构建了蛋白-蛋白相互作用网络,并进行了基因本体和通路富集分析。此外,他们利用人类蛋白质图谱数据和帕金森病患者死后黑质单细胞转录组数据,进行了组织和细胞类型特异性表达分析。同时,他们还通过映射到已知药物靶点数据库,评估了所发现蛋白的成药性。最后,他们开展了一项独立的临床病例对照研究(30名PD患者,14名健康对照),使用Olink蛋白质组学平台测量了92种血浆神经相关蛋白,以验证部分发现并探索其临床相关性。
结果
1. 血浆神经相关蛋白的工具变量集
在184种神经相关蛋白中,153种保留了有效的工具变量。根据pQTL类型构建了三个数据集:数据集1(123种蛋白的cis-pQTLs)、数据集2(107种蛋白的cis-和trans-pQTLs组合)和数据集3(30种蛋白的trans-pQTLs)。经过筛选,分别有117、106和29种蛋白可用于下游分析。
2. 血浆神经相关蛋白对PD影响的MR评估
利用三个蛋白工具变量数据集和PD GWAS数据,研究人员进行了MR分析。在主要分析的数据集1(cis-pQTLs)中,共发现了231个显著关联,涉及59种蛋白和35种PD表型。
- •
对于PD风险:CLEC1B、IL5RA和SNCG的基因预测高水平与风险增加正相关;CDH17与风险降低负相关。
- •
对于PD发病年龄:ADAM22、FLRT2和WFIKKN1与发病年龄负相关;CPM、NTRK3、PDGFRA和RGMB与发病年龄正相关。
- •
对于PD进展表型:共58种蛋白与各种运动和非运动症状的进展相关。例如,PDGFRα和SNCG与运动症状评分UPDRS III正相关;FCRL2、CRTAM和IL5RA与UPDRS III负相关。
数据集2和3的扩展分析也揭示了一些额外的关联。值得注意的是,所有4种风险相关蛋白和7种发病年龄相关蛋白中的6种,也与疾病进展表型相关,表明它们在PD病理过程中的广泛作用。
3. 遗传共定位
对于MR分析发现的关联,研究人员进行了COLOC遗传共定位分析,以检验蛋白质与PD性状是否共享相同的因果遗传变异。分析为三对关联提供了“可能”的共定位证据:TDGF1与PD患者便秘症状的进展;PVR与PD患者抑郁症状的进展;以及IL5RA与PD患者的基线抑郁状态。
4. 蛋白-蛋白相互作用网络和功能富集分析
由MR优先考虑的59种蛋白在STRING数据库中形成了一个显著的相互作用网络。基因本体分析显示,这些蛋白在趋化、运输、轴突导向等生物过程中富集。京都基因与基因组百科全书通路分析突出了“细胞因子-细胞因子受体相互作用”通路的重要性。
5. 组织和细胞类型特异性分析
利用人类蛋白质图谱数据进行的组织富集分析显示,这些基因在肝脏、大脑、肠道等多种组织中特异性表达。单细胞分析揭示了它们在特定细胞类型(如神经元、免疫细胞)中的表达模式。例如,四个风险相关蛋白显示出不同的富集模式:CLEC1B在肝脏富集;IL5RA在脉络丛和输卵管富集;SNCG在肾上腺和大脑高表达;CDH17在肠道组织富集。
6. MR优先蛋白的药物靶点评估
对59种MR优先蛋白的成药性评估显示,其中44种与已知的成药基因列表重叠,包括12个一级(Tier 1)靶点(如已批准药物的靶点)。其中,IL5RA是已获批药物benralizumab(用于哮喘和慢性阻塞性肺病)的靶点,其抑制方向与MR分析提示的PD风险增加效应一致,暗示抑制IL5RA可能具有保护作用。此外,还有多个蛋白处于临床开发或文献报道阶段。
7. 病例对照研究中血浆神经相关蛋白与PD的关联
在一项独立的临床病例对照研究中,Olink蛋白质组学分析揭示了5种在PD患者血浆中差异表达的蛋白:BMP-4、DDR1和GDNF表达升高,而LAT和MANF表达降低。逻辑回归分析显示,高表达的BMP-4和GDNF与PD风险增加显著相关,而高表达的LAT和MANF则具有保护效应。由这五种蛋白构建的诊断模型在区分PD患者与健康人方面表现出良好的性能。此外,BMP-4水平与认知评分MoCA呈正相关,GDNF水平与UPDRS II评分(日常生活能力)呈正相关。
结论与讨论
本研究通过整合遗传学、蛋白质组学和临床数据,系统性地揭示了循环神经相关蛋白在帕金森病中的重要作用。主要的结论和意义体现在以下几个方面:
首先,研究鉴定出了59种与PD表型(风险、发病年龄、进展)存在潜在因果关联的神经相关蛋白。其中,CLEC1B、IL5RA、SNCG和CDH17被确认为与疾病风险相关的核心蛋白,为从源头上预防或干预PD提供了全新的候选靶点。尤其值得关注的是IL5RA,它本身已是成熟药物靶点,这为快速启动其用于PD的转化研究提供了独特的便利。
其次,研究发现不同的蛋白倾向于与PD的不同临床表现(如运动症状vs.抑郁、便秘等非运动症状)相关联,这从分子层面支持了PD临床异质性源于不同病理机制的观点。遗传共定位分析进一步为TDGF1、PVR和IL5RA与特定症状(便秘、抑郁)的关联提供了遗传学证据,提示未来可能针对特定症状群开发个性化疗法。
再者,功能富集分析将焦点指向了“细胞因子-细胞因子受体相互作用”、神经免疫调节和轴突导向等关键通路,深化了我们对PD发病机制的理解,特别是神经炎症和免疫系统在其中的核心地位。
在临床转化层面,病例对照研究不仅独立验证了部分MR结果(如BMP-4、DDR1、GDNF也与疾病进展相关),更重要的是,它发现了BMP-4、DDR1、GDNF、LAT和MANF这五种在患者血浆中发生显著变化的蛋白。它们不仅显示出良好的诊断潜力(联合模型AUC达0.8976),而且其表达水平与临床症状严重程度相关,有望成为用于疾病分期、疗效监测和预后判断的生物标志物。
当然,研究也存在一些局限,例如MR反映的是终生遗传效应,病例对照样本量较小且缺乏独立验证队列等。未来的研究需要在更大规模、多中心的纵向队列中进行验证,并借助细胞和动物模型深入探索这些候选蛋白的功能机制。
总而言之,这项研究构建了一个从遗传推断到临床验证的完整框架,不仅为理解帕金森病的复杂性和异质性提供了宝贵的分子图谱,更为后续开发基于血液的生物标志物面板和筛选具有高潜力的治疗靶点奠定了坚实的基础,向着实现帕金森病的精准医疗迈出了重要的一步。