《Nature Mental Health》:Adolescent multi-omics and Mendelian randomization reveal transdiagnostic molecular mechanisms in psychiatric disorders
编辑推荐:
主要神经精神疾病(neuropsychiatric disorders)的生物学机制在很大程度上仍不明确。鉴于免疫失调常与这些疾病相关联,研究人员利用IMAGEN队列中1,274名健康青少年的血液来源多组学数据,鉴定可为诊断与治疗提供信息的跨诊断生物标志物及机
主要神经精神疾病(neuropsychiatric disorders)的生物学机制在很大程度上仍不明确。鉴于免疫失调常与这些疾病相关联,研究人员利用IMAGEN队列中1,274名健康青少年的血液来源多组学数据,鉴定可为诊断与治疗提供信息的跨诊断生物标志物及机制。研究首先开展了全基因组分析,以鉴定与DNA甲基化和基因表达相关的单核苷酸多态性(single nucleotide polymorphisms, SNPs),并在外部数据集中对结果进行了重复验证。随后,研究通过对6种神经精神疾病——注意缺陷多动障碍、孤独症谱系障碍、双相障碍、重性抑郁障碍、精神分裂症和失眠——开展孟德尔随机化(Mendelian randomization, MR)分析,进一步探索这些数量性状位点(quantitative trait loci, QTLs),由此鉴定出73个推定因果CpG位点和62个基因;这些位点和基因或为单一疾病特异,或如MRPL2一样为多种疾病共享。值得注意的是,所鉴定基因显著富集于同时与精神疾病和自身免疫性疾病相关的通路,提示自身免疫性疾病与神经精神疾病之间可能存在共享的基因组结构。两步孟德尔随机化与共定位(colocalization)分析进一步揭示了潜在的跨诊断调控通路,其中3个基因——MAD1L1、MRPL2和HLA-DRB1——的表达介导了CpG甲基化对精神分裂症和失眠的影响。具体而言,cg06770790位点的DNA甲基化抑制MRPL2,而MRPL2被推定为失眠(β?=??0.38, P?=?1.29?×?10?4)和精神分裂症(β?=??0.38, P?=?1?×?10?4)的因果分子。相反,由多个CpG位点甲基化驱动的MAD1L1和HLA-DRB1表达升高,可能对精神分裂症具有因果作用。上述发现突出了参与神经精神疾病的关键分子机制与基因,并为治疗干预提供了有前景的新靶点。
该研究发表于《Nature Mental Health》,聚焦精神分裂症(schizophrenia, SCZ)、重性抑郁障碍(major depressive disorder, MDD)、双相障碍(bipolar disorder, BIP)、孤独症谱系障碍(autism spectrum disorder, ASD)、注意缺陷多动障碍(attention deficit hyperactivity disorder, ADHD)和失眠(insomnia, INS)等主要精神疾病的分子基础。现有研究虽已通过双生子研究和全基因组关联研究(genome-wide association studies, GWAS)证明精神疾病具有显著遗传贡献,但多数风险变异位于非编码区,难以直接解释其功能后果及调控链条。与此同时,越来越多证据表明精神疾病并非仅限于中枢神经系统异常,其发生发展还与外周免疫失衡和系统性炎症密切相关。尤其在儿童期和青春期这一多种精神疾病初发的关键发育窗口,早期分子调控异常如何塑造跨疾病共享风险与疾病特异性风险,仍缺乏系统阐明。因此,开展基于青少年样本、整合遗传组、表观基因组和转录组的因果推断研究,具有重要科学意义与潜在临床转化价值。
研究人员围绕这一问题,构建并分析了一个青少年多组学数量性状位点(quantitative trait loci, QTL)资源,以揭示精神疾病的潜在因果调控机制。研究以IMAGEN多中心纵向青少年队列为核心,在14岁基线样本中获得基因分型、血液DNA甲基化和RNA表达数据,并结合KORA、ARIES及GTEx v8外部数据进行重复验证。通过全基因组范围内鉴定顺式甲基化数量性状位点(cis-methylation quantitative trait loci, cis-meQTLs)和顺式表达数量性状位点(cis-expression quantitative trait loci, cis-eQTLs),再将其与6种精神疾病GWAS汇总统计数据整合,研究人员进一步应用两样本孟德尔随机化(two-sample MR)和共定位分析,对CpG位点、基因表达与疾病风险之间的因果关系进行筛选,并通过两步MR探索“DNA甲基化→基因表达→疾病”的中介调控路径。最终研究表明,青少年外周血中可检测到与多种精神疾病相关的跨诊断分子信号,其中MRPL2、MAD1L1和HLA-DRB1代表了最突出的潜在关键节点,提示线粒体功能、神经发育与免疫调控可能共同参与精神疾病的分子病理过程。
方法概括而言,研究基于IMAGEN队列14岁青少年样本,纳入1,324例基因分型、1,274例血液DNA甲基化和545例血液RNA表达数据;DNA甲基化采用Illumina HumanMethylation450芯片,基因表达采用Illumina HumanHT-12 v4平台,基因分型采用Illumina Human610/660-Quad芯片。研究开展全基因组cis-meQTL与cis-eQTL定位,并分别在KORA、ARIES和GTEx v8中验证;随后利用6种精神疾病GWAS进行两样本MR分析,结合MR-Egger、IVW、加权中位数(weighted median, WM)、两步MR和Bayesian共定位分析,鉴定因果CpG、因果基因及其介导链路,并辅以血液-脑甲基化相关性分析、通路富集和ChromHMM染色质状态富集分析。
以下为论文结果部分的分项解读。
Description of the IMAGEN cohort
IMAGEN是一个多中心纵向青少年队列,旨在解析个体神经认知与神经发育差异背后的遗传、行为和神经生物学基础。基线时约招募2,000名14岁健康青少年,来自欧洲8个研究中心,并在16、19和23岁进行随访。本研究聚焦基线多组学数据,为后续构建青少年特异的QTL图谱和精神疾病分子因果分析提供了样本基础。
Genome-wide identification and validation of cis-meQTLs
研究人员在1,274名IMAGEN参与者中,对约590万个SNP与372,582个CpG位点进行了全基因组配对关联分析,在2 Mb窗口内鉴定顺式meQTL。经Bonferroni校正后,共识别出9,105,155对显著cis-meQTL–CpG关联,涉及2,196,765个cis-meQTL和58,525个CpG位点。随后在KORA和ARIES中进行重复验证,结果显示不同人群和队列中效应方向高度一致,t值相关性很高,证明该青少年甲基化QTL资源具有较强稳健性和可重复性。
Genome-wide identification and validation of cis-eQTLs
在545名IMAGEN青少年中,研究人员分析了约590万个SNP与19,840个mRNA表达谱之间的关联,在2 Mb窗口内鉴定cis-eQTL。最终识别出358,616对cis-eQTL–mRNA关联,涉及280,161个cis-eQTL和4,524个mRNA。在GTEx v8全血数据中,近半数关联得到验证,且绝大多数效应方向一致,说明青少年外周血中的转录调控信号具有较好的外部一致性。
Identification of putatively causal CpGs for neuropsychiatric disorders
研究进一步利用两样本MR,在6种精神疾病中筛选由遗传工具变量支持的推定因果CpG位点。通过对cis-meQTL进行连锁不平衡(linkage disequilibrium, LD)剪枝,共获得10,986个独立cis-meQTL作为工具变量。最终共鉴定出73个独特的推定因果CpG位点,其中ADHD 3个、ASD 1个、BIP 9个、SCZ 58个、MDD 12个、INS 2个。9个CpG位点同时作用于多个疾病,体现出跨诊断共享特征。最突出的是位于MAD1L1内的cg19624444,同时与ADHD、BIP、SCZ和MDD相关,但在不同疾病中的效应方向相反:高甲基化与ADHD和MDD风险升高相关,而低甲基化与BIP和SCZ风险升高相关。多数结果在KORA meQTL数据中得到重复验证,且部分CpG在血液与脑组织间甲基化水平呈显著相关,支持其潜在生物学相关性。
Identification of putatively causal genes for neuropsychiatric disorders
在基因表达层面,研究人员使用cis-eQTL作为工具变量开展MR分析。经LD剪枝后共获得9,579个独立cis-eQTL,关联6,864个基因。MR分析最终识别出62个至少对一种精神疾病具有推定因果作用的基因,其中ADHD 2个、ASD 1个、BIP 16个、MDD 7个、INS 1个、SCZ 43个。8个基因为多疾病共享,包括MDD和SCZ共享的BTN2A2,以及INS和SCZ共享的MRPL2。GTEx全血eQTL重复分析支持了大部分结果,且进一步显示其中28个基因在脑组织表达层面也与精神疾病存在因果关联。该结果提示,外周血中可检测到与脑相关精神疾病风险相连的遗传调控信号。
Characterization of identified QTLs, CpGs and genes
为阐明这些因果位点和基因的功能背景,研究开展了位置富集、组织特异性与通路富集分析。结果显示,映射至因果CpG和因果基因的cis-meQTL与cis-eQTL均显著富集于基因间区而在内含子区域耗竭,符合非编码调控元件常位于基因间区的认识。染色质状态分析表明,因果CpG显著富集于外周血原代T细胞的双价启动子(bivalent promoter)区域,在脑组织中则富集于静息染色质区域并减少于活跃转录区域,提示其更可能位于发育调控或免疫反应相关的表观遗传环境。相比之下,因果基因在脑和血液组织中均富集于增强子和活跃转录区域,而在抑制性染色质状态中减少,支持其参与动态转录调控。染色体分布上,因果CpG显著富集于6号染色体6p21–6p22区域,因果基因显著富集于3p21区域。进一步的通路与GWAS目录富集分析显示,这些因果基因不仅富集于ASD、SCZ和BIP相关基因集合,也富集于1型糖尿病、溃疡性结肠炎和哮喘等自身免疫疾病相关集合,提示免疫性疾病与精神疾病之间可能存在共享遗传架构。
Multi-omics integrative regulatory pathways for neuropsychiatric disorders
为进一步揭示分子调控链,研究开展了两步MR和共定位分析。两步MR识别出30对因果CpG–基因组合,涉及6个关键介导基因:PGBD1、ATXN1、HLA-DRB1、MRPL2、NT5DC1和MAD1L1。结果显示,某些CpG位点可通过多个基因影响疾病;例如cg06770790甲基化通过降低MRPL2表达介导对INS和SCZ的影响,并通过降低NT5DC1表达介导对BIP的影响。另有多个与SCZ相关的CpG同时上调HLA-DRB1并下调PGBD1。随后共定位分析在6对与INS或SCZ相关的CpG–基因组合中发现强证据,表明DNA甲基化和基因表达共享共同因果变异。具体而言,cg18302629相关meQTL与提高MAD1L1表达的eQTL在SCZ中共定位;4个与HLA-DRB1表达相关的CpG也表现出共定位;而rs73736735既关联cg06770790低甲基化,也关联MRPL2高表达,这一调控轴同时作用于INS和SCZ。该部分结果构成全文最核心的跨诊断机制证据。
Discussion
讨论部分指出,本研究建立了一个系统的青少年meQTL/eQTL资源,为理解青春期精神疾病的早期分子调控提供了重要平台。与既往以成人、单病种或相关性分析为主的研究相比,本研究通过MR和共定位将遗传变异、DNA甲基化、基因表达与疾病结局串联起来,更接近因果解释。研究特别强调了MRPL2、MAD1L1和HLA-DRB1这三个基因的重要性:MRPL2提示线粒体核糖体与线粒体功能异常可能参与INS和SCZ;MAD1L1关联有丝分裂纺锤体组装检查点、神经元迁移和神经突生长,与SCZ遗传学和甲基化研究相一致;HLA-DRB1位于人类白细胞抗原(human leukocyte antigen, HLA)复合体内,反映免疫调控在SCZ中的作用。研究还指出,因果CpG和因果基因在免疫相关区域和自身免疫疾病通路中的富集,支持免疫—神经精神共享遗传结构的观点。
同时,论文也明确了局限性:部分疾病GWAS样本量较小、遗传异质性较强,可能降低检出跨诊断中介效应的能力;基因表达样本量有限,导致部分MR工具变量较弱;MR仍受水平多效性(horizontal pleiotropy)影响,尽管研究采用MR-Egger和异质性检验进行控制,但不能完全排除偏倚;此外,研究依赖外周血数据,且青少年QTL与成人GWAS之间存在年龄不匹配问题,可能影响对脑特异和早发病表型的灵敏度。尽管如此,研究仍在青春期这一关键发育窗口内,揭示了精神疾病新的表观遗传与转录调控机制。
研究结论可译为:本研究揭示了精神疾病中的关键分子机制与相关基因,并提出了有前景的治疗干预新靶点。整体而言,研究表明,基于青少年外周血多组学与孟德尔随机化整合分析,可以识别精神疾病共享与特异的因果分子特征,尤其凸显了SCZ与INS中由DNA甲基化驱动、经MAD1L1、MRPL2和HLA-DRB1表达介导的跨诊断调控网络。这些结果为理解精神疾病早期发生机制及开发跨诊断干预策略提供了重要依据。