61.9万个体循环代谢性状的遗传学分析

《Nature》:Genetic analysis of circulating metabolic traits in 619,372 individuals

【字体: 时间:2026年05月22日 来源:Nature 48.5

编辑推荐:

  解读遗传变异与复杂性状的关联,可通过深入理解这些变异的分子效应得到提升。尽管针对复杂疾病的全基因组关联研究(GWAS)常规可纳入超百万个体,但分子性状的研究进展相对滞后。研究人员在爱沙尼亚生物银行(Estonian Biobank, EstBB)和英国生物银行

  
解读遗传变异与复杂性状的关联,可通过深入理解这些变异的分子效应得到提升。尽管针对复杂疾病的全基因组关联研究(GWAS)常规可纳入超百万个体,但分子性状的研究进展相对滞后。研究人员在爱沙尼亚生物银行(Estonian Biobank, EstBB)和英国生物银行(UK Biobank, UKBB)中,对最多619,372名个体的249种循环代谢性状开展了GWAS荟萃分析。研究人员鉴定出来自8,398个基因座的88,127个常见和低频基因座-性状关联,这些关联集中于共享基因和通路。通过统计精细定位、系统性表型组范围共定位和顺式孟德尔随机化(cis-Mendelian randomization, cis-MR),研究人员探索了代谢性状与疾病结局之间的潜在因果关系。研究人员预测,尽管观察性研究显示血浆支链氨基酸(branched-chain amino acids, BCAAs)与2型糖尿病(type 2 diabetes, T2D)相关,但通过靶向BCAA分解代谢通路降低BCAA水平不太可能降低T2D风险。借助大样本量和高质量基因型插补,研究人员发现19.4%的置信精细定位变异的次要等位基因频率(minor allele frequency, MAF)介于0.1%和1%之间,且这些变异发生错义变异和剪接改变变异的可能性是其两倍。研究结果凸显了将低频变异整合到遗传关联研究中的价值。
该研究于2026年发表在《Nature》。当前针对代谢性状的大规模全基因组关联研究虽持续有新发现,但仍有超过半数的核磁共振(nuclear magnetic resonance, NMR)检测代谢性状的遗传力未被已发现的显著位点解释,且现有研究多局限于常见变异,低频变异的全基因组谱尚未被探索。同时,大样本量带来的多效性效应使得遗传关联的因果解读面临挑战,传统孟德尔随机化(Mendelian randomization, MR)的误用可能导致误导性结论。为此,研究人员开展了迄今为止最大规模的循环代谢性状遗传学分析,旨在系统解析代谢性状的遗传架构,阐明其与复杂疾病的因果关联,为药物靶点评估提供依据。
研究人员主要采用的关键技术方法包括:基于EstBB(n=185,352)和UKBB六个遗传祖先群(n=434,020)的样本队列,使用regenie软件进行GWAS分析,结合群体特异性基因型插补面板实现最多9600万个变异的检测;采用SuSiE算法对UKBB欧洲祖先亚群进行统计精细定位,识别条件独立信号;利用gpu-coloc工具开展大规模跨分子层的共定位分析,整合三大生物银行和分子数量性状位点数据;实施全基因组MR和顺式MR分析,其中顺式MR以代谢性状为基因功能扰动的代理暴露,评估其对冠心病(coronary artery disease, CAD)和T2D的因果效应。
关联检验与荟萃分析
研究人员在EstBB和UKBB六个遗传祖先群中分别对249个代谢性状开展GWAS,依托群体特异性插补面板实现了对常见、低频及罕见变异的广泛检测。在欧洲祖先群的荟萃分析(meta_EUR,n=599,249)中,共鉴定出86,886个基因座-性状对,对应8,260个独立领先变异,较既往同类研究关联数量提升约10倍,并新增7,790个未报道的独立领先变异。统计精细定位在UKBB欧洲亚群中识别出31,392个置信可信集,包含3,000个后验包含概率(posterior inclusion probability, PIP)>0.8的推定因果变异,其中23.1%的低频精细定位变异被预测为错义或剪接改变变异,显著高于常见变异的11.5%。
跨分子层的共定位
研究人员利用gpu-coloc将meta_EUR的86,886个信号与三大生物银行(FinnGen、Pan-UKBB、百万退伍军人计划MVP)及分子数量性状位点(表达数量性状位点eQTL、剪接数量性状位点sQTL、蛋白质数量性状位点pQTL)的汇总统计数据开展共定位分析。在严格阈值(PP.H4>0.9)下,共检测到932,864个共定位事件,涉及所有249个代谢性状,其中53.4%的代谢性状信号至少与一个共定位事件相关,CAD和T2D位点分别有20.2%和16.3%与代谢性状共定位。
血浆乳酸与血小板活化
研究人员聚焦于同时共定位到疾病终点且涉及≤5个代谢性状的共定位簇,在GP6、GRK5和ZFPM2基因座发现了血浆乳酸与肺栓塞的高置信度共定位。进一步分析显示,这三个基因座的变异均与血小板活化相关,且激活的血小板通过将葡萄糖转化为乳酸产生能量,表明血浆乳酸可能是血小板活化的生物标志物,而非肺栓塞的直接致病因素。
低频与罕见变异
研究发现,既往NMR GWAS主要关注MAF>1%的常见变异,而本研究纳入了次要等位计数>20的所有变异。精细定位结果显示,8.6%的可信集包含MAF 0.1%-1%的低频变异,对应786个独立信号簇和583个置信因果变异,其中23.1%为错义或剪接变异。此外,研究还鉴定出156个MAF<0.1%的罕见领先变异,其中15%被预测为功能性变异。
常见与罕见变异的汇聚
研究观察到常见和低频变异在支链氨基酸分解代谢通路的汇聚效应。除既往报道的BCAT2、DBT和PPM1K的常见变异外,新发现BCKDHA基因的罕见错义变异(MAF=0.012%)和BCKDK基因的低频剪接受体缺失变异(MAF=0.047%),其效应方向与通路功能一致,且所有六个关键酶的基因座均被检测到GWAS信号,证明大样本量是饱和发现生物学过程关键调控因子的必要条件。
代谢性状的水平多效性程度
遗传相关性分析显示,249个代谢性状的中位遗传相关性为0.16,但脂蛋白性状间相关性较高(中位rg=0.52)。领先变异普遍存在多效性,平均每个领先变异与10个代谢性状显著关联,最显著的GCKR基因错义变异(rs1260326)与229个代谢性状相关。全基因组MR分析显示,85%的代谢性状与CAD存在显著因果关联,63%与T2D存在显著关联,但广泛的遗传相关性和水平多效性使得这些结果难以直接解读为代谢性状对疾病的直接效应。
药物靶点评估
为减少水平多效性的干扰,研究人员采用顺式MR评估药物靶点。针对LDL胆固醇调控基因LDLR、HMGCR和PCSK9的分析重现了已知的CAD风险关联及他汀类药物的T2D副作用差异。针对BCAA分解代谢通路,对BCAT2、DBT和PPM1K基因座的顺式MR分析未发现抑制BCKDK激酶可降低T2D风险的证据,表明通过靶向该通路降低BCAA水平可能无法有效预防T2D。
局限性与结论
研究局限性在于97%的样本为欧洲遗传祖先,限制了在其他群体的普适性;精细定位仅在UKBB欧洲亚群中进行,可能遗漏较弱的次级信号;且仅覆盖NMR平台检测的249个代谢性状。结论部分指出,该研究构建了包含常见和低频变异的综合代谢性状遗传资源,通过公开释放汇总统计数据及在线浏览器,为GWAS解读提供了工具。研究证实,低频变异占置信精细定位变异的19.4%,且其功能注释的可解释性显著高于常见变异,凸显了在遗传关联研究中纳入低频变异的价值。随着跨生物银行荟萃分析统计效力的提升,整合低频变异的共定位和顺式MR将成为揭示疾病机制和优先药物靶点的关键手段。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号