《Alzheimers & Dementia》:Proteomics reveals three molecular subtypes of Alzheimer's disease with distinct progression patterns
编辑推荐:
本研究通过大规模脑脊液(CSF)蛋白质组学(6361种蛋白质)结合机器学习,在ADNI队列(n=550)中鉴定出阿尔茨海默病(AD)三种稳健的生物学亚型,并在三个独立队列中得到验证。亚型1(RNA代谢紊乱型)病程最温和;亚型2(轴突生长相关型)tau病理最显著但进展中等;亚型3(细胞分解代谢型)萎缩最严重、进展最快。该发现为AD精准诊断和靶向治疗提供了重要依据。
1 背景
阿尔茨海默病(Alzheimer's disease, AD)是一种复杂的进行性神经退行性疾病,是老年人痴呆的主要原因,其发病机制远超出β淀粉样蛋白(Aβ)和tau蛋白缠结的范畴。研究表明,AD在Aβ组成、tau分布、神经影像学表现和临床症状等方面存在明显的异质性。然而,导致AD异质性的潜在分子机制尚不清楚。厘清这种异质性有助于揭示涉及的不同病理生理通路,从而推动靶向干预和精准医疗策略的发展。
以往基于认知特征、发病年龄和神经影像学特征的AD临床亚型研究,因缺乏分子层面的微观信息,其生物学机制仍不明确。脑脊液(cerebrospinal fluid, CSF)蛋白质的变化直接反映个体大脑生理状态,为揭示疾病进展的分子机制提供了见解。CSF蛋白质组学能够涵盖参与多种生物通路的蛋白质,为识别具有不同分子机制的AD生物学亚型提供了可能。然而,既往基于CSF蛋白质组学的AD亚型研究由于使用的蛋白质数量有限,仅显示出临床表型、认知下降和神经影像学特征的微小差异,限制了其临床实用性。
本研究利用来自阿尔茨海默病神经影像学计划(Alzheimer's Disease Neuroimaging Initiative, ADNI)的广泛CSF蛋白质组学数据集(6361种蛋白质),采用数据驱动的方法识别AD分子亚型。通过富集分析阐释不同亚型的CSF蛋白质谱所涉及的生物学过程,并比较各亚型在认知功能与下降、神经影像标志物、核心CSF生物标志物谱和多基因风险评分(Polygenic Hazard Score, PHS)等方面的差异,以明确其 distinct 特征。此外,还比较了亚型间长达16.5年随访期的临床进展轨迹。最后,在三个独立队列中验证了结果的稳健性和可靠性。
2 方法
2.1 研究人群
本研究数据来自ADNI数据库。主要分析纳入了550名ADNI参与者(150名认知正常者CN,271名轻度认知障碍MCI患者,129名痴呆患者),这些参与者具有基线CSF蛋白质组学测定、CSF Aβ42和CSF tau蛋白在苏氨酸181位点磷酸化(p-tau181)数据。AD定义为存在异常淀粉样蛋白标志物(CSF Aβ42< 1098 pg/mL,n=465),对照组定义为具有正常淀粉样蛋白和tau标志物的CN个体(CSF Aβ42≥ 1098 pg/mL 且 CSF p-tau181 ≤ 26.64 pg/mL,n=85)。
2.2 CSF蛋白质组学测量
CSF蛋白质组学数据通过SOMAmer捕获阵列法(SomaScan 7K平台)测量。经过质量控制后,提取出7008个分析物,对应6361种独特蛋白质。最终保留6280种独特蛋白质进行分析。蛋白质值进行log2转换,并根据对照组的均值和标准差缩放生成z分数。
2.3 磁共振成像
从ADNI数据库获取预处理后的纵向结构MRI数据。使用FreeSurfer进行预处理,基于Desikan-Killiany图谱提取68个皮质脑区的灰质体积,基于ASEG图谱提取14个皮下脑区的体积。
2.4 认知评估
从ADNI数据库提取纵向认知评估数据。使用简易精神状态检查(Mini-Mental State Examination, MMSE)和临床痴呆评定量表-sum of boxes(Clinical Dementia Rating Scale Sum of Boxes, CDR-SB)评估整体认知功能和疾病严重程度。使用ADSP-PHC复合认知评分评估特定认知领域(记忆、执行、语言、视觉空间功能)。
2.5 多基因风险评分
基于结合AD相关SNP的Cox比例风险回归模型计算Desikan AD PHS。为评估独立于APOE基因座的多基因风险,在排除APOE基因区域的所有变异后重新计算了PHS。
2.6 AD亚型发现
首先选择在AD组与对照组间存在显著差异的蛋白质(p < 0.01,Kruskal-Wallis检验),最终保留590种蛋白质用于后续亚型分析。应用非负矩阵分解(Non-negative Matrix Factorization, NMF)对AD患者进行分类。基于cophenetic correlation、残差平方和(RSS)和silhouette consensus确定最佳聚类数量为3。
2.7 在验证队列中预测AD亚型
使用在发现队列中训练的随机森林分类器,对三个独立验证队列(PPMI队列,n=232;Emory Goizueta ADRC队列,n=166;Emory队列,n=274)的参与者进行亚型预测。预测时仅使用发现队列与各验证队列共有的蛋白质,且不进行模型再训练或调整。
2.8 统计分析
使用Cox比例风险模型检验亚型间向AD痴呆转化的差异。使用线性模型和线性混合模型分别检验基线认知功能差异和纵向认知下降率差异。使用线性模型比较亚型间CSF生物标志物(Aβ42, p-tau181, t-tau)的差异。使用线性模型和线性混合模型分别检验亚型间基线脑区体积差异和纵向脑萎缩率差异。使用错误发现率(False Discovery Rate, FDR)校正p值。
3 结果
3.1 参与者特征
研究共纳入550名个体(85名对照,465名AD患者)。AD患者更可能携带APOE ε4等位基因,MMSE评分更低,CSF p-tau和t-tau水平异常更常见。年龄、性别和教育水平在组间相似。
3.2 CSF蛋白质组谱鉴定的三种生物学亚型
NMF分析将AD患者分为三个生物学亚型。亚型1包含97名参与者,平均年龄73.30岁;亚型2包含200名参与者,平均年龄73.74岁;亚型3包含168名参与者,平均年龄74.32岁。亚型间年龄、性别、教育水平无显著差异。
富集分析显示各亚型具有 distinct 的生物学过程:
- •
亚型1中增加的蛋白质富集在核蛋白复合物、RNA加工、mRNA加工等过程,表明该亚型以RNA代谢和处理功能障碍为特征。
- •
亚型2中增加的蛋白质富集在轴突发育、轴突发生、神经元投射形态发生等过程,强调了轴突完整性的破坏。
- •
亚型3中增加的蛋白质富集在细胞大分子分解代谢过程、泛素依赖性蛋白质分解代谢过程、长时程增强、修饰依赖性蛋白质分解代谢过程等。
3.3 不同AD亚型的认知功能与进展轨迹
- •
基线时,亚型3的CDR-SB评分最高,痴呆最严重;亚型1的MMSE评分最高,认知功能最好;亚型2居中。记忆、执行功能评分呈现类似趋势。
- •
纵向随访显示,亚型3进展为痴呆的速度最快,亚型1最慢,亚型2居中。MMSE下降率和CDR-SB增加率在亚型3中最快,亚型1中最慢。各认知领域的下降轨迹也呈现类似模式。
3.4 AD亚型的不同遗传风险特征
- •
亚型1的APOE ε4携带率最低(19.59%),亚型2为57%,亚型3最高(98.21%)。
- •
亚型1的PHS最低,亚型3最高,亚型2居中。即使在排除APOE区域变异后,亚型3的PHS仍显著高于亚型1和亚型2,表明亚型间遗传风险差异不仅源于APOE ε4。
3.5 亚型间AD病理模式比较
- •
亚型3的CSF Aβ42水平低于亚型1和亚型2。
- •
亚型2的CSF t-tau和p-tau水平最高,显著高于亚型1和亚型3。亚型3的tau水平介于亚型1和亚型2之间。
3.6 三种AD亚型的脑萎缩模式比较
- •
与对照组相比,三个亚型在基线时均显示出显著脑萎缩(如右杏仁核、双侧海马体、双侧内嗅皮层、双侧颞下叶)。
- •
亚型3在基线时表现出最严重的脑萎缩(特别是在海马体、内嗅皮层、梭状回、颞中叶)。
- •
纵向随访期间,亚型1有12个脑区萎缩速率快于对照;亚型2有39个脑区;亚型3有61个脑区,萎缩最严重。亚型3的脑萎缩进展速度也最快。
3.7 AD亚型的敏感性分析
- •
APOE ε4分层分析显示,在APOE ε4携带者和非携带者中,各亚型的通路富集模式和CSF生物标志物谱与全队列分析结果基本一致。
- •
调整基线CSF Aβ42浓度(作为疾病进展的间接指标)后,各亚型在认知、影像、遗传风险和CSF tau水平方面的差异模式保持不变。
- •
仅在基线时为MCI的参与者中进行聚类分析,得到的亚型仍显示出与全样本分析一致的分子特征和CSF tau生物标志物差异模式。这些结果表明所识别的亚型代表不同的生物学实体,而非疾病严重程度的不同阶段。
3.8 在独立队列中验证AD亚型
- •
在三个独立验证队列中,使用发现队列训练的随机森林分类器成功预测出三种AD亚型。
- •
各验证队列中,亚型间的人口统计学因素和临床状态比较显示,年龄、性别分布在大多数队列中无显著差异,APOE ε4负担差异趋势与发现样本一致。
- •
验证队列中CSF t-tau和p-tau水平的亚型间比较模式与主要分析基本一致:亚型2的tau水平通常高于亚型1和亚型3。
4 讨论
本研究基于大规模蛋白质组学分析识别出三种不同的AD生物学亚型,并在三个大型独立队列中得到一致验证。这些亚型在临床进展、认知特征、脑萎缩模式、核心CSF生物标志物谱和遗传风险方面均存在显著差异。富集分析进一步揭示每种亚型与特定的生物学通路相关。独特的遗传风险特征支持了基于CSF的亚型反映了驱动AD发病的不同分子机制。
亚型1(RNA代谢紊乱型)与RNA代谢和处理通路失调相关,临床表现最温和,进展最慢。亚型2(轴突发生相关型)以轴突生长和形态发生通路为特征,表现出最显著的tau病理,但认知障碍和萎缩程度居中,提示其高tau水平可能反映了轴突完整性破坏而非直接的神经变性。亚型3(细胞分解代谢型)与细胞分解代谢过程相关,表现出最严重的认知缺陷、脑萎缩和最快的疾病进展,可能与自噬/溶酶体通路功能障碍导致的加速神经变性有关。
敏感性分析证实这些亚型并非单一疾病连续体的不同阶段,而是代表不同的生物学实体。亚型2表现出高tau病理但相对温和的临床进程,这一发现挑战了tau病理与认知损害紧密相关的传统观点,强调了轴突功能障碍等其他生物学机制在AD发展中的作用。
各亚型在遗传风险(PHS和APOE ε4携带率)上存在显著差异,提示每种AD亚型可能受益于量身定制的治疗方法。在独立队列中的成功验证强化了亚型分类的稳健性,并强调了这些病理过程在AD异质性中的作用。
研究局限性包括:CSF蛋白质组学未能捕获全部人类蛋白质组;验证队列缺乏纵向数据限制了评估亚型疾病进展轨迹的能力。未来结合纵向数据的研究对于加深理解这些亚型在AD进展中的作用至关重要。
总之,本研究通过广泛的CSF蛋白质组学分析揭示了AD的三种生物学亚型,不仅具有不同的分子特征,而且在临床特征和疾病进展方面也存在对应差异。理解驱动每种亚型的特定生物学机制对于开发靶向治疗干预措施、推进AD精准医疗至关重要。