《Nature Genetics》:Exome-wide association study of blood lipids in 1,158,017 individuals from diverse populations
编辑推荐:
罕见编码等位基因在遗传疾病的分子诊断中具有关键作用。然而,由于其在一般人群中的稀缺性,系统识别这些等位基因一直具有挑战性。在此,研究人员在 1,158,017 名多祖先个体中发现并表征了导致遗传性血脂异常(冠状动脉疾病 (CAD) 的主要风险)的罕见编码等位基
罕见编码等位基因在遗传疾病的分子诊断中具有关键作用。然而,由于其在一般人群中的稀缺性,系统识别这些等位基因一直具有挑战性。在此,研究人员在 1,158,017 名多祖先个体中发现并表征了导致遗传性血脂异常(冠状动脉疾病 (CAD) 的主要风险)的罕见编码等位基因。通过测试 2,997,401 个罕见编码变异,研究人员识别出 800 个全外显子组显著关联(176 个预测功能丧失 (pLoF) 和 624 个错义变异)。关联等位基因在功能变异类别中 enriched,显示显著的加性和隐性关联,跨人群 exhibit 相似效应,并解析了意义未明变异的致病性。此外,研究人员确定了五个与 CAD 相关的脂质关联基因。其中,沉默 RORC 代表了一个降低低密度脂蛋白胆固醇 (LDLC) 的潜在治疗靶点。本研究为理解因果机制、量化罕见编码等位基因的表达度以及识别多样化人群中血脂异常的新药物靶点提供了资源和见解。
研究背景与目的:家族性高胆固醇血症 (FH) 的基于家庭研究虽提供了见解,但 FH 仍被严重低估和治疗不足。人群遗传分析显示,某些先前 implicated 致病变异的表达度和外显率可能不足。此外,临床策划变异 enriched 于遗传相似于欧洲参考人群个体,反映了数据偏差。非欧洲人群相关变异更可能被重新分类或因数据有限而被低估。为解决挑战,研究人员需系统目录化与 FH 相关致病变异以提高遗传诊断准确性,并评估等位基因特异性预后。
研究概况:研究人员在《Nature Genetics》发表论文,开展了迄今为止最大的血液脂质罕见变异关联研究。通过整合超过一百万个体的大规模临床遗传数据集,研究人员识别并表征了与血液脂质相关的罕见编码变异关联,验证了其跨人群一般性。研究提供了理解因果机制、量化罕见编码等位基因表达度及识别新药物靶点的资源。
技术方法:研究人员整合了百万退伍军人计划 (MVP)、英国生物银行 (UKB) 和 All of Us 研究计划 (AOU) 队列,共 1,158,017 名个体,包含超过 230,000 名遗传相似于非欧洲参考人群个体。通过基因型填充、全外显子组测序 (WES) 和全基因组测序 (WGS) 数据,结合固定效应 meta 分析,测试了罕见编码变异与血液脂质表型的线性关联。
研究结果:
研究人群与变异识别:研究人员生成了大规模临床遗传数据集,覆盖了 1.73% 的所有可能预测功能丧失 (pLoF) 单核苷酸变异 (SNV) 和 3.81% 的所有可能错义 SNV。
关联分析:在加性模型中识别出 800 个全外显子组显著 (EWS) 关联,涉及 184 个位点。隐性模型分析识别出 109 个 EWS 关联。罕见编码变异比同义/非编码变异显著 enriched。
变异功能预测表型表达度:高置信度 (HC) pLoF 和有害错义变异 exhibit 同样受限的低次要等位基因频率 (MAF) 且更可能是 EWS。
区分功能减退和功能获得变异:大多数错义变异与 pLoF 变异显示一致的效应方向(功能减退),但部分显示相反效应方向(功能获得)。
隐性剪接变异作为新功能丧失候选:使用 SpliceAI 算法检测到潜在隐性剪接变异,其效应大小与 pLoF 变异相当。
已确立脂质位点外的新罕见变异关联:识别出 11 个位于已确立脂质位点外的变异关联,如 GYS2 和 STS 基因。
已确立脂质位点内因果基因的新见解:罕见变异关联研究更直接 interrogate 基因产物扰动,如 PDZK1 和 SREBF1 被确认为因果基因。
人群 enriched 编码关联和共享效应大小:识别出 130 个仅在非欧洲人群中显著的脂质相关等位基因,但效应大小跨人群高度相似。
隐性建模见解:识别出 109 个变异 - 表型对在隐性模型中显著关联,部分显著偏离加性假设。
FH 变异的致病性重新评估:重新评估了 ClinVar 数据库中的 FH 相关变异,支持部分意义未明变异 (VUS) 的致病性重新分类。
脂质相关等位基因的临床结果:识别出五个与冠状动脉疾病 (CAD) 显著相关的基因,包括 RORC,沉默 RORC 可能是降低低密度脂蛋白胆固醇 (LDLC) 的潜在治疗靶点。
讨论与结论:本研究展示了基于人群的分析识别具有机制和临床意义的罕见编码等位基因的能力。通过包含非欧洲人群的大型队列,研究扩展了等位基因多样性。观察到的罕见编码等位基因效应大小跨人群具有一致性和可转移性。研究提供了对变异特征 underlying 显著关联的定性/定量评估,强调了精确分类变异功能的重要性。隐性建模识别出多个强关联,提示对缺失遗传力的贡献。利用人群规模关联分析驱动的估计效应大小和统计显著性,研究人员重新评估了被视为临床遗传诊断金标准的策划数据库,确认了大多数变异注释的准确性,并为其他变异的致病性重新分类提供了证据。研究局限性在于主要关注罕见编码变异,未充分解决罕见非编码变异的潜在功能影响。总之,涉及超过一百万个体的血液脂质罕见变异聚焦遗传研究 yielded 数百个与血液脂质相关的罕见等位基因,改进了对罕见变异关联的机制理解,表明人群规模罕见变异分析现已具备足够统计效力用于可遗传表型,允许分类罕见致病等位基因并提供关于变异表达度和外显率的新见解,以实现改进的诊断和更定量的预后。