阿尔茨海默病及相关痴呆症全基因组关联研究的共识性荟萃分析(Consensus Meta-analysis of Genome-Wide Association Studies for Alzheimer's Disease and Related Dementias, AD and ADRD)
《Nature Genetics》:Consensus meta-analysis of genome-wide association studies for Alzheimer’s disease and related dementias
编辑推荐:
为更好地阐明阿尔茨海默病(Alzheimer's disease, AD)及相关痴呆症(related dementias, ADRD)的遗传架构,研究人员对欧洲裔人群的全基因组关联研究(genome-wide association study, GWAS)
为更好地阐明阿尔茨海默病(Alzheimer's disease, AD)及相关痴呆症(related dementias, ADRD)的遗传架构,研究人员对欧洲裔人群的全基因组关联研究(genome-wide association study, GWAS)进行了荟萃分析,纳入128,681例ADRD确诊或代理病例及849,833例(代理)对照。研究人员鉴定出91个与ADRD风险相关的遗传位点(locus),其中16个为新发现位点,56个在经临床诊断为AD的病例中特异性检出;另提供18个(15个为新)需进一步外部验证的位点列表。剔除APOE后,结合ADRD位点效应构建的多基因风险评分(polygenic score, PGS)主要与AD而非非AD病理相关。与PGS处于中位数的人群相比,PGS位于最高十分位(decile)的个体,死亡时脑内Braak神经原纤维缠结(neurofibrillary tangle)分期>IV且伴有中重度神经炎型淀粉样斑块(neuritic amyloid plaque)病理的比例增加2倍。综上,本研究验证了大量与临床诊断AD风险相关的位点,各位点对AD临床诊断及AD病理的影响尚需进一步研究确认。
论文解读:《Nature Genetics》——Consensus meta-analysis of genome-wide association studies for Alzheimer's disease and related dementias
一、研究背景与概述
目前已发现90余个与阿尔茨海默病(Alzheimer's disease, AD)及相关痴呆症(Alzheimer's disease and related dementia, ADRD)相关的遗传位点(locus),主要由国际阿尔茨海默病基因组学项目(International Genomics of Alzheimer's Project, IGAP)、欧洲阿尔茨海默与痴呆生物样本库(European Alzheimer and Dementia Biobank, EADB)及精神病基因组学联盟(psychiatric genomics consortium, PGC)-AD工作组通过大样本全基因组关联研究(genome-wide association study, GWAS)鉴定。既往GWAS虽部分重叠,但采用不同填充(imputation)面板或分析方法,部分结果存在分歧;且部分研究大量纳入基于国际疾病分类(International Classification of Diseases, ICD)编码诊断的病例或代理病例(即自述父母或兄弟姐妹患痴呆者),虽提高检出效力,却因表型定义不够特异而模糊了AD与非AD痴呆的信号界限。为更精确刻画AD与ADRD的遗传架构及病理生理机制,IGAP、EADB与PGC-ALZ三大联盟联合开展针对欧洲裔样本的ADRD GWAS共识性荟萃分析(consensus meta-analysis);并通过排除代理病例或大型生物样本库病例进行敏感性分析,以区分已知基因组位点对AD与ADRD的影响。
二、主要关键技术方法简述
研究人员汇总来自52项研究的欧洲裔数据,包括72,721例AD确诊病例、55,960例ADRD代理病例、614,267例对照及235,566例代理对照。大部分样本使用Trans-Omics for Precision Medicine(TOPMed)参考面板进行基因型填充(imputation)。各研究在加性遗传模型下采用Logistic回归或混合模型检验常染色体变异与ADRD风险的关联,校正主成分(principal component, PC)及批次效应;采用METAL软件进行逆方差加权固定效应荟萃分析(fixed-effect meta-analysis with an inverse-variance-weighted approach)。研究人员通过逐步条件分析(GCTA COJO)识别独立次级信号,依据连锁不平衡(linkage disequilibrium, LD r2)和物理距离划定位点边界。利用MAGMA进行通路富集分析(pathway enrichment analysis),利用FUMA进行单细胞表达富集及表型组关联研究(phenome-wide association study, PheWAS),利用LD分数回归(LD score regression, LDSC)计算遗传相关性(genetic correlation)。基于Tier 1位点(不含APOE区域)构建多基因风险评分(polygenic risk score, PGS),在Adult Changes in Thought(ACT)队列和Alzheimer's Disease Centers/National Alzheimer's Coordinating Center(ADC/NACC)神经病理内表型(neuropathology endophenotype, NPE)数据集中检验关联。
三、研究结果
Main(主要内容——位点鉴定与敏感性分析)
研究人员在主荟萃分析中鉴定出91个全基因组显著(genome-wide significant, GWS; P ≤ 5×10?8,定义为"Tier 1")的ADRD风险相关位点(locus),其中16个(EIF4G3、PTPRC、MGAT5、PPP2R3A、ADGRL3、FAM193B、TMEM184A、DOCK4、IPMK、UBFD1、VMAC、VAV1、LRRC25、CEP89、LILRB1/LILRB4及SRC)为欧洲裔样本中的新位点;经逐步条件分析发现25个独立次级信号分布于16个位点内。91个Tier 1位点中75个(82.4%)在无代理病例(no-proxy)荟萃分析中仍达GWS,56个(61.5%)在无生物样本库(no-biobank,聚焦临床确诊AD病例)荟萃分析中达GWS;在无代理病例仍检出的位点中有10个为新位点。另有5个位点经条件分析后显著性下降(P > 1×10?7),归为需外部验证的"Tier 2"位点(3个已知、2个新位点TRIB1和AXIN1);另有13个仅于敏感性分析中检出的新位点也归为Tier 2。先前两篇最大规模GWAS中报道的HAVCR2、SLC2A4RG/LIME1、FOXF1及NTN5未在本主荟萃分析中达GWS。
Single-cell enrichment analysis与Pathway analyses(细胞富集与通路分析)
主荟萃分析、无代理及无生物样本库分析结果均显示,ADRD或AD关联信号富集于多个脑区数据集的小胶质细胞(microglia)高表达基因;且显著富集于tau蛋白、β-淀粉样蛋白(amyloid-β, Aβ)、脂质代谢、免疫及内体/溶酶体相关生物学通路。部分新Tier 1和Tier 2位点通过PheWAS关联到tau、脂质或免疫通路表型(如C16orf95关联脑脊液磷酸化tau水平及脑室容积)。
Genetic correlation analyses(遗传相关性分析)
剔除APOE后,无代理ADRD表型与路易体痴呆(Lewy body dementia, r=0.64)、肌萎缩侧索硬化症(amyotrophic lateral sclerosis, r=0.29)、帕金森病(Parkinson's disease, r=0.16)及教育程度(educational attainment, r=?0.12)存在显著遗传相关性;主荟萃分析与无生物样本库结果相似(主分析含代理病例时教育程度相关性不显著,r=?0.02),印证了既往关于代理病例GWAS存在偏倚的报告。
PGS analyses(多基因风险评分分析)
基于Tier 1主信号(不含APOE)构建的三个PGS(主分析、无代理、无生物样本库版)在ADC/NACC数据集中与三项AD相关NPE(Braak神经原纤维缠结分期、Aβ斑块、CERAD neuritic plaque评分)及LATE-NC(limbic-predominant age-related TDP-43 encephalopathy neuropathological change)显著关联,与脑血管性NPE、海马硬化及路易小体无显著关联。最高十分位PGS个体较中位数个体死亡时Braak分期>IV的风险增加2.05倍(95% CI=1.47–2.85),中重度CERAD neuritic plaque病理风险增加1.96倍(95% CI=1.39–2.78);最低十分位风险分别降低至0.47倍和0.43倍。PGS加入仅含年龄、性别及APOE ε4/ε2等位基因的模型后,Braak分期与CERAD评分的受试者工作特征曲线下面积(area under the receiver operating characteristic curve, AUC)显著提升(P ≤ 2.27×10?3),Nagelkerke伪R2分别为3.98%和4.37%, liability scale上解释方差为2.43%–4.93%。PGS与APOE ε4/ε2等位基因数目对Braak分期和CERAD评分无显著交互作用(P > 2.27×10?3)。
四、讨论与结论(翻译研究结论部分)
总之,本共识性荟萃分析鉴定出91个与ADRD风险相关的遗传位点(locus),包括16个欧洲裔样本中新发现的位点,其中56个与临床诊断AD风险相关。研究人员进一步通过在大样本中验证(或未验证)已知位点与ADRD及AD风险的关联,并在部分位点识别出新的次级信号,从而表征了已知位点的影响。除与教育程度的遗传相关性存在差异外,主分析、无代理及无生物样本库荟萃分析和三个剔除APOE的多基因风险评分均结果一致,且PGS主要关联AD病理而非非AD病理。随着GWAS中代理及生物样本库病例比例增加,评估GWAS及其基于全基因组统计量的次级分析在临床诊断病例中的稳健性将愈发重要,本研究公开的无代理及无生物样本库汇总统计量可为此提供支持。此外,部分ADRD位点与非AD NPE显著关联而与AD NPE不显著,受限于NPE GWAS检出微小效应的统计效能尚难解释。未来需基于更大规模、经良好表征的AD患者及神经病理数据,更精确界定各位点对AD病理与其他神经病理的影响;对稀有有害变异及结构变异的后续测序与功能研究将为这些位点对ADRD及AD的生物学影响提供进一步见解。