《PLOS Genetics》:An evaluation of age-varying genetic effects underlying body-mass index and blood pressure in the UK Biobank
编辑推荐:
为了解决标准全基因组关联研究(GWAS)通常假定遗传关联在整个年龄范围内恒定,而某些性状可能存在年龄变化的基因效应这一关键问题,研究人员在UK Biobank中针对40-69岁人群,对体质指数(BMI)和血压性状(收缩压、舒张压、脉压)进行了系列年龄分层GWAS和元回归分析。研究发现年龄交互效应的富集存在性状依赖性,例如脉压(PP)的发现SNPs中44.7%存在年龄交互证据。在孟德尔随机化(MR)框架下的分析进一步揭示了脉压的遗传预测值与年龄相关的增长率变化,与不良心血管结局(如外周动脉疾病)风险升高显著相关。这项工作为理解复杂性状的遗传结构随年龄变化的机制提供了宝贵资源,并对改进基于遗传工具的因果推断(如MR)的解读具有重要意义。
在探索人类复杂性状,如肥胖和高血压的遗传基础时,科学家们通常依赖一种强大的工具:全基因组关联研究(GWAS)。这种研究通过在大规模人群中扫描数以百万计的单核苷酸多态性(SNP),来寻找与特定性状相关的遗传变异。然而,传统GWAS有一个潜在的、被广泛接受的假设:即这些遗传变异对性状的影响,在一个人的一生中,或者说在研究样本所涵盖的整个年龄跨度内,是恒定不变的。这就像假设一盏基因的“灯”,无论在生命的哪个阶段打开,其亮度都是一样的。但现实可能并非如此。试想,影响青春期体重的基因,与影响中老年时期血压的基因,其作用强度是否会随着身体机能的衰老、生活方式的改变而增强或减弱?越来越多的证据表明,对于某些性状,这种遗传效应可能是“年龄依赖”的。这种现象对遗传流行病学的一个核心应用——孟德尔随机化(MR)分析——提出了重要挑战。MR利用遗传变异作为工具变量,来推断一个暴露因素(如高BMI)与某种疾病(如2型糖尿病)之间是否存在因果关系。如果作为工具的遗传效应本身会随年龄变化,那么基于其得出的“终生效应”解读就可能产生偏差,影响我们对疾病因果机制的准确理解。
为了深入探究这一关键问题,一个研究团队在《PLOS Genetics》上发表了一项研究。他们利用英国生物样本库(UK Biobank)这一大型资源,对年龄在40至69岁之间的成年人群,开展了一项系统性的评估。研究聚焦于体质指数(BMI)和三个关键的血压指标:收缩压(SBP)、舒张压(DBP)以及两者的差值——脉压(PP)。PP是反映血管僵硬度和心血管系统老化的重要标志。研究人员没有采用常规的一次性分析,而是创造性地将整个队列按每两岁一个区间,精细地划分为15个年龄层,并在每个层内独立进行GWAS。这种“年龄分层”的策略,如同用高分辨率的镜头观察遗传效应随时间变化的轨迹。随后,他们利用元回归(Meta-regression)这一统计方法,系统地筛查那些与年龄存在交互作用的SNP,即其遗传效应会随年龄增长而显著增强或减弱的位点。更进一步,他们将这些发现置于MR框架下,检验了这些年龄变化的遗传效应如何影响对心血管和代谢疾病(如2型糖尿病、中风、外周动脉疾病、心力衰竭、冠心病和房颤)风险的遗传预测。这项研究不仅旨在描绘BMI和血压性状遗传结构的年龄动态变化图谱,更致力于开发一个基于汇总水平数据的分析框架,为在无法获取个体层级数据的广泛研究场景中,探索环境或生命历程依赖的遗传效应提供了可行方案。
为开展此项研究,作者运用了几个关键技术方法:首先,基于UK Biobank大型队列(约45万欧洲裔参与者,年龄40-69岁),分别针对BMI、SBP、DBP和PP进行了全队列“发现”GWAS,并使用线性混合模型(BOLT-LMM)校正了年龄、性别和基因分型芯片的影响。其次,将队列按2岁间隔分层为15个亚组,在每个亚组内独立进行年龄分层GWAS。接着,利用元回归分析,以每个年龄层的平均年龄为自变量,该层内SNP的效应值为因变量,系统评估每个SNP的效应是否存在线性的年龄交互作用。然后,在孟德尔随机化分析中,利用“发现”SNP集以及通过元回归识别出的具有年龄交互作用的SNP集(设定不同P值阈值)作为工具变量,通过逆方差加权法等,评估了遗传预测的BMI和PP与六种心血管代谢疾病结局的关联。最后,还进行了模拟研究和基于UKB重复临床访问数据的实证分析,以评估选择偏倚对年龄分层框架下结果的可能影响。
研究结果
“发现”GWAS信号的识别
在40-69岁全样本中进行的GWAS,分别鉴定出1150个(BMI)、795个(PP)、888个(SBP)和880个(DBP)独立的、达到基因组显著性水平的SNP。这些构成了后续分析的基线“发现”集。
年龄分层GWAS结果
将样本分层为15个2岁年龄层后,由于样本量减少,每个层内GWAS检测到基因组显著性信号的能力预期会下降,这与实际情况一致。所有生成的年龄分层GWAS汇总统计数据均已公开共享。
通过元回归识别SNP年龄交互作用*
通过元回归系统评估年龄交互效应,研究人员设定了两种纳入标准:
- 1.
纳入集1:在“发现”集SNP中,元回归显示有年龄交互作用证据(P < 0.05)的位点。结果显示,存在年龄交互作用的SNP比例具有性状依赖性:BMI为10.3%(119/1150),PP高达44.7%(355/795),SBP为17.7%,DBP为13.9%。
- 2.
纳入集2:在全基因组范围内,元回归显示有年龄交互作用证据(P < 5x10-5)的额外独立位点。这分别识别出193个(BMI)、366个(PP)、244个(SBP)和286个(DBP)新的潜在年龄敏感SNP。
分析揭示了BMI和PP呈现相反的趋势:对于BMI,具有年龄交互作用的SNP(纳入集1和2),其遗传效应倾向于随年龄增长而减弱(向零值衰减);而对于PP,这些SNP的效应则随年龄增长而增强。例如,对于BMI,位于TMEM18和FTO基因的SNP显示效应随年龄衰减;对于PP,位于LINC02577;CCDC71L和FBN1基因的SNP显示效应随年龄增强。散点图进一步直观展示了这种性状特异的模式。
个体水平分析中的SNP年龄交互作用识别(敏感性分析)*
作为对比,在非分层的个体水平数据中进行的全基因组SNP*年龄交互作用分析,显示了与元回归分析相似的性状依赖性趋势,支持了主要分析结果的稳健性。
SNP年龄交互作用对遗传预测的暴露-结局关系的影响*
研究人员在MR框架下进行了两步分析:
- 1.
标准MR分析:使用“发现”、纳入集1和纳入集2的SNP作为工具变量,评估遗传预测的BMI/PP对六种心血管代谢疾病的影响。结果证实了已知的强烈关联,例如高遗传预测的BMI与所有疾病风险增加相关。特别地,使用PP的纳入集2 SNPs预测外周动脉疾病(PAD)的优势比(OR = 1.08)高于使用“发现”SNPs(OR = 1.04),提示考虑年龄因素可能识别出对特定疾病更强的遗传预测信号。
- 2.
改良逆方差加权分析:在此分析中,将标准MR中使用的SNP-暴露关联估计值,替换为相应的SNP*年龄交互作用效应估计值。其结果解释了“遗传预测的暴露值随年龄变化的速率”对疾病风险的影响。
- •
对于BMI,改良分析表明,遗传效应导致的BMI随年龄的增长率,与更有利的健康结局相关(即关联轨迹为负)。这暗示在40-69岁期间,BMI的变化更多由环境因素驱动,且遗传效应随年龄衰减。
- •
对于PP,则呈现相反趋势。改良分析显示,遗传预测的PP随年龄增长的速率,与更高的冠心病、中风和PAD风险显著正相关。例如,分析发现,遗传预测的PP在40-69岁期间随年龄的增长率增加,与更高的PAD易感性相关(交互作用比值比 = 2.71; P = 1.82x10-13)。
对年龄分层框架中选择偏倚的考察
通过模拟研究和基于UKB重复临床访问数据的实证分析,研究人员探讨了选择偏倚(如参与研究的可能性与年龄、性状相关)是否会导致虚假的年龄交互信号。模拟表明,只有当性状和年龄对选择的影响存在交互作用,并且SNP对性状本身有效应时,才可能诱发虚假的年龄变化效应。实证分析发现,在UKB中,BMI和年龄对重复访视参与概率存在微小但显著的交互影响。然而,考虑到只有一部分“发现”SNP(特别是对于BMI、SBP、DBP)显示了年龄交互作用,而非全部,因此研究中所识别的大部分年龄交互效应不太可能完全由选择偏倚所解释。
研究结论与讨论
本研究在UK Biobank队列中,对40-69岁年龄段BMI和血压性状的年龄变化遗传效应进行了全面评估。主要结论和重要意义在于:
首先,研究明确证实了遗传关联的年龄依赖性存在且具有性状特异性。PP相比SBP和DBP,有更高比例的遗传位点显示年龄交互作用,这与PP作为血管老化标志的生理学认知一致,验证了分析方法的有效性。相反,BMI的相关遗传效应则普遍呈现随年龄衰减的趋势。
其次,研究成功示范了基于汇总数据的年龄分层GWAS结合元回归的分析框架。该框架不预设遗传效应与年龄关系的具体形状,且对无法获取个体数据的合作研究具有重要应用潜力,为系统识别环境或生命历程依赖的遗传效应提供了实用工具。
第三,研究深入揭示了年龄变化遗传效应对孟德尔随机化解读的深刻含义。通过改良的MR分析,研究表明遗传预测的暴露(如PP)随年龄的变化速率本身即是疾病风险的重要预测因子。这挑战了MR将遗传工具变量简单解释为“暴露的终生效应”的传统观点,强调在利用遗传工具进行因果推断时,必须考虑测量暴露时的年龄背景。研究结果提示,对于BMI,生命早期的遗传因素可能更为重要,而环境因素在驱动中老年体重变化中的作用更大;对于PP,遗传因素则在生命后期表现出更强的影响力,并更紧密地与心血管风险相关。
最后,研究通过模拟和实证分析,审慎评估了选择偏倚的影响,增强了所发现年龄交互效应的可信度。同时,研究也指出了自身的局限性,如仅分析了线性年龄交互、样本局限于欧洲裔、存在健康参与者偏倚等,为未来在更广泛人群、更复杂模型下的研究指明了方向。
综上所述,这项工作不仅生成了可用于探索复杂性状遗传架构年龄动态变化的宝贵数据资源,更通过创新的分析框架深化了我们对遗传效应生命历程变化的理解,为提升基于遗传工具的因果推断的精确性和可解释性做出了重要贡献。