《Nature Aging》:Structural signature of plasma proteins classifies the status of Alzheimer’s disease
编辑推荐:
本研究针对阿尔茨海默病(AD)早期诊断困难、缺乏反映疾病进展的有效血液生物标志物等问题,开展了血浆蛋白质结构组学分析。研究人员利用质谱与机器学习,系统描绘了与APOE基因型及神经精神症状相关的蛋白构象变化,并开发了基于C1QA、CLUS和ApoB蛋白结构改变的诊断模型。该三标记物组合实现了健康、轻度认知障碍(MCI)与AD的三分类(准确率83.44%),并在纵向样本中得到验证,为AD的无创早期检测、疾病监测和临床试验分层提供了新思路。
在人类对抗神经退行性疾病的漫长征程中,阿尔茨海默病(Alzheimer's disease, AD)始终是横亘在前的巨大挑战。这种疾病不仅蚕食着患者的记忆与认知功能,其复杂的病理机制也让早期诊断和治疗干预困难重重。目前,确诊AD通常依赖于昂贵的正电子发射断层扫描(PET)或具有侵入性的脑脊液(Cerebrospinal Fluid, CSF)检查,这些方法难以广泛应用于大规模人群筛查。尽管大脑中淀粉样蛋白-β(Aβ)斑块在临床症状出现前约15年就开始积聚,但如何在疾病早期、通过简便易行的血液检测捕捉到这些病理变化的“信号”,一直是科学界和临床医学迫切希望解决的难题。传统的血液生物标志物研究多聚焦于蛋白质的“量变”,即表达水平的高低,然而AD的核心病理之一——蛋白质稳态(Proteostasis)失调——所导致的蛋白错误折叠,本质上是蛋白质的“质变”,即其三维结构的改变。这些微观的结构扰动,能否在血液中留下可供识别的“指纹”,并成为区分疾病不同阶段的可靠依据?Son等人的研究为此带来了希望的曙光。
为了探索血浆蛋白结构变化作为AD诊断标志物的潜力,研究人员开展了一项系统性的研究,相关成果发表在《Nature Aging》期刊。该研究整合了来自两个独立回顾性队列(KU ADRC和UCSD)共520名参与者(包括健康对照、轻度认知障碍(Mild Cognitive Impairment, MCI)患者和AD患者)的血浆样本。核心实验技术是共价蛋白质谱分析(Covalent Protein Profiling, CPP),这是一种化学蛋白质组学方法,通过定量分析蛋白质表面赖氨酸残基的二甲基化标记程度,来测量其溶剂可及性(即结构暴露程度),从而在蛋白质组尺度上刻画构象变化。研究人员利用液相色谱-串联质谱(LC-MS/MS)对样本进行分析,并结合多种机器学习算法对海量的结构数据进行挖掘,旨在寻找AD特异性的血浆蛋白结构特征。
研究结果
参与者的人口统计学特征和蛋白质结构谱
研究共分析了520份血浆样本的蛋白质结构。两个队列的参与者在年龄上无显著差异。研究人员通过CPP方法定量了来自373个蛋白质的3,655个标记肽段,并最终聚焦于在超过25%参与者中稳定检测到的109个蛋白质的879个肽段。分析显示,从健康对照到MCI再到AD,标记赖氨酸的平均可及性(Accessibility)呈逐步显著下降趋势,且个体间的变异系数(Coefficient of Variation, CV)逐渐增加,这提示随着疾病进展,蛋白质稳态功能下降,错误折叠蛋白增多。相比之下,反映蛋白质丰度的非赖氨酸肽段强度变异较小,且在不同组间无差异。这些发现表明,蛋白质结构变化比表达水平变化更能反映疾病状态,具有作为疾病分类特征的潜力。
评估蛋白质结构作为分类器的潜力
全局分析发现,蛋白质结构(即可及性)的组间差异比蛋白质表达(即强度)的差异更为显著。例如,在健康对照 vs. MCI的比较中,42.3%的标记肽段显示出显著的可及性差异,而仅有31.8%的非标记肽段显示出强度差异。此外,疾病早期(健康到MCI)发生的结构改变与整个疾病进程(健康到AD)的结构改变高度相关,提示部分蛋白的结构扰动在疾病早期就已发生。
APOE基因型对蛋白质组结构的影响
载脂蛋白E(ApoE)基因是AD最重要的遗传风险因子。研究人员探究了不同APOE等位基因(ε2, ε3, ε4)如何影响与之相互作用的蛋白质的结构。通过多元线性回归分析,他们发现了91个肽段(对应43个蛋白质)的可及性与APOE基因型显著相关,其中25个蛋白质已知与ApoE存在相互作用。特别值得注意的是,补体成分C1q的A链(C1QA)的一个肽段(GFCDTTNLKGLF)的可及性在APOE ε4/ε4纯合子携带者中最低,显著低于其他基因型携带者。此外,α-1-抗胰蛋白酶(SERPINA3)的一个肽段(DVFEEGTEASAATAVKITLL)的可及性呈现双峰分布,且低可及性个体在APOE ε4携带者中比例更高。计算结构分析为ApoE基因型依赖的SERPINA3结构变化提供了可能的机制解释。
蛋白质结构变化受神经精神症状的性别差异性影响
几乎所有AD患者都会出现神经精神症状(Neuropsychiatric Symptoms, NPS)。研究发现,在AD患者中,女性患者的NPS总分高于男性。线性回归分析揭示了蛋白质结构可及性与NPS严重程度之间存在显著的负相关关系,即症状越严重,可及性越低。重要的是,这种关联存在性别差异:有45个肽段的可及性与NPS的关系具有性别特异性,其中17个仅在男性中显著,28个仅在女性中显著。例如,丛生蛋白(Clusterin, CLUS)的一个肽段(SVDCSTNNPSQAKL)的可及性在男女患者中均与NPS严重程度呈负相关,且其单独使用就能较好地区分疾病早期和晚期阶段。
基于蛋白质结构状态的多标记物组合
为了开发一个稳健的诊断模型,研究人员将470份样本(来自两个队列)按2:1的比例分为训练集和独立测试集,并系统地评估了18种机器学习算法。基于深度学习的模型在测试集上取得了最佳的三分类(健康 vs. MCI vs. AD)准确率,达到83.44%。该模型最终筛选出三个肽段构成多标记物组合:来自C1QA的GFCDTTNLKGLF、来自CLUS的SVDCSTNNPSQAKL和来自载脂蛋白B(Apolipoprotein B, ApoB)的AVLCEFISQSIKSF。值得注意的是,C1QA和CLUS的肽段在多个高性能算法模型中被一致选中。当用于二分类时,该组合表现出色:区分健康与MCI的曲线下面积(Area Under the ROC Curve, AUROC)为0.9343,区分MCI与AD的AUROC为0.9325。与仅基于蛋白质表达数据构建的模型相比,这个基于结构变化的多标记物组合诊断性能显著更优。
多标记物组合与现有筛查工具及脑病理变化的相关性
该多标记物组合生成的“AD置信度”评分与临床上常用的简易精神状态检查(Mini-Mental State Examination, MMSE)和临床痴呆评定量表总分(Clinical Dementia Rating Sum of Boxes, CDRSUM)评分高度相关。更重要的是,该评分与反映脑组织萎缩的脑室(特别是第三脑室)体积呈正相关,并与CSF中AD核心生物标志物(Aβ42、Aβ42/40比值、总tau蛋白和磷酸化tau181蛋白)的水平存在中等程度的相关性,这证实了该血液标志物组合能够反映大脑中的病理变化。
多标记物组合在纵向随访样本中的可重复性能
研究人员利用50份纵向随访样本(最长达255天)验证了模型的性能。该多标记物组合对纵向样本的分类准确率达到86%。分析显示,当参与者的诊断状态发生变化时(如从健康转为MCI或AD),其“AD置信度”评分会发生显著改变;而当诊断保持不变时,评分则无显著变化。这提示该组合不仅能诊断当前状态,还可能具有追踪疾病进展的潜力。
研究结论与讨论
该研究成功地绘制了AD患者血浆蛋白质组的“结构图谱”,揭示了疾病进展、APOE基因型和神经精神症状的性别差异如何共同塑造了特定的蛋白质构象特征。通过整合质谱技术与深度学习,研究团队开发出了一个基于C1QA、CLUS和ApoB蛋白结构改变的三标记物诊断组合。这个组合在区分健康、MCI和AD方面表现出高准确度,并与认知评分、脑影像学和CSF生物标志物相关联,在纵向样本中也显示了追踪疾病变化的潜力。
这项研究的意义重大。首先,它首次在大型队列中系统证明了血浆蛋白构象变化可以作为AD有效的诊断生物标志物,为理解AD的分子病理机制提供了新视角。其次,所开发的多标记物组合仅需血液样本,具有无创、便于重复采集的优势,为AD的大规模早期筛查和风险分层提供了极具前景的工具。最后,该研究揭示了蛋白质结构变化与遗传风险(APOE)、临床表现(NPS)之间的内在联系,有助于未来开发更具针对性的个性化诊疗策略。尽管研究存在一些局限,如免疫亲和去除高丰度蛋白可能导致部分生物标志物共丢失、纵向随访时间相对较短等,但其开创性的方法学和稳健的结果无疑为AD的血液生物标志物研究开辟了一条崭新的“结构之路”,有望加速早期诊断技术的临床转化,并最终改善患者的治疗结局。