卡塔尔地区ABCG5/ABCG8基因变异的群体特征及植物甾醇血症发病率的遗传学估计

《Journal of Clinical Lipidology》:Population Enrichment of ABCG5/ABCG8 Variants in Qatar and Genetic Estimates of Sitosterolemia Burden

【字体: 时间:2026年05月02日 来源:Journal of Clinical Lipidology 4.6

编辑推荐:

  吉坦贾利·德瓦多斯·甘地 | 贾米尔·阿伦巴维 | 哈姆迪·姆巴雷克 | 卡利德·A·法赫罗 | 乔治·内梅尔 卡塔尔多哈西德拉医学基因组医学实验室 **摘要** 背景 植物甾醇血症是一种罕见的常染色体隐性遗传病,由ABCG5或ABCG8基因的致病性变异引起,导

  吉坦贾利·德瓦多斯·甘地 | 贾米尔·阿伦巴维 | 哈姆迪·姆巴雷克 | 卡利德·A·法赫罗 | 乔治·内梅尔
卡塔尔多哈西德拉医学基因组医学实验室

**摘要**
背景
植物甾醇血症是一种罕见的常染色体隐性遗传病,由ABCG5或ABCG8基因的致病性变异引起,导致植物甾醇在体内积累并使低密度脂蛋白(LDL)胆固醇水平波动。其症状常与家族性高胆固醇血症相似,因此诊断较为困难,因为常规的血脂检测方法无法检测植物甾醇。

**方法**
我们分析了14,060名卡塔尔基因组计划(QGP)参与者的ABCG5/ABCG8基因变异情况,这些参与者的表型数据来自卡塔尔生物银行(QBB)。变异信息使用ClinVar和gnomADv4.1进行注释,并根据ACMG标准进行分类。在5,385名无亲属关系的卡塔尔人中估计了携带者频率,同时考虑了近亲繁殖对疾病发生率的影响。

**结果**
我们发现了9个致病性或可能致病的变异(ABCG5中3个,ABCG8中4个),并在ABCG8中鉴定出4个新的预测功能丧失变异。估计的携带者频率分别为ABCG5约1:215和ABCG8约1:192,总体疾病发生率为1:102,远高于gnomAD的估计值(ABCG5携带者频率约1:251,疾病发生率约1:383,744)。部分携带纯合子个体的血脂谱异常,并自报患有高胆固醇血症,这提示可能存在类似家族性高胆固醇血症的表型。

**结论**
与全球数据集相比,卡塔尔人群中ABCG5/ABCG8基因的变异更为常见,这与当地的人口结构和近亲繁殖现象相符。鉴于该病与家族性高胆固醇血症在表型上的重叠,但治疗方法不同(尤其是对依折麦布和饮食限制的反应更好),我们建议将ABCG5/ABCG8基因检测纳入血脂异常的诊断流程中,特别是在家族性高胆固醇血症诊所、儿科以及中东和北非地区的基于祖先信息的筛查项目中。这些数据强调了检测植物甾醇和ABCG5/ABCG8基因变异在减少误诊、指导治疗和开展连锁检测方面的潜在价值。

**引言**
植物甾醇血症(OMIM #210250)是一种罕见的常染色体隐性脂质代谢障碍,由ABCG5或ABCG8基因的双等位基因致病性变异引起。这些基因编码的转运蛋白可限制胆固醇和植物甾醇(如β-植物甾醇和菜油甾醇)的肠道吸收并促进其胆汁排泄。这些转运蛋白的缺陷会导致甾醇过度吸收和排泄减少,从而引发全身性甾醇积累。
临床表现为肌腱或结节性黄瘤以及早发性动脉粥样硬化性心血管疾病(ASCVD),这些症状与家族性高胆固醇血症相似。此外,还可能出现溶血性贫血、口细胞增多症和巨血小板减少症等血液系统异常。与家族性高胆固醇血症不同,植物甾醇血症患者的胆固醇水平波动较大,而植物甾醇浓度显著升高。由于常规血脂检测方法无法检测植物甾醇,因此该病常被误诊为家族性高胆固醇血症。这种区分具有临床意义,因为治疗方法也不同:家族性高胆固醇血症通常使用他汀类药物和PCSK9抑制剂治疗,而植物甾醇血症对依折麦布、胆汁酸螯合剂和饮食限制反应更佳。尽管该病具有重要的临床意义,但全球迄今仅报告了约100例确诊病例。

**历史背景**
过去认为植物甾醇血症极为罕见,估计患病率在1/200,000至1/360,000之间。然而,最新遗传学研究表明,尤其在近亲繁殖率高的群体中,其实际发病率可能更高。中东地区由于奠基者效应和近亲繁殖,常染色体隐性遗传病较为常见。卡塔尔的研究已证实,家族性高胆固醇血症及相关表型更为普遍。这些发现强调了在具有特定遗传背景的人群中研究植物甾醇血症的重要性。本研究利用卡塔尔基因组计划和卡塔尔生物银行提供的全基因组测序及全面表型数据,旨在:(i) 描述ABCG5/ABCG8基因的已知和新变异;(ii) 估计卡塔尔地区的携带者频率和疾病负担;(iii) 将当地患病率与全球数据对比;(iv) 突出诊断中的挑战。这些发现将为卡塔尔地区植物甾醇血症的遗传和临床特征提供重要见解,对精准医疗具有广泛意义。

**方法**
本研究纳入了卡塔尔生物银行(QBB)的14,060名成年参与者,这些参与者均为卡塔尔国民或长期居民(居住时间≥15年),年龄≥18岁。这些参与者的基因组测序作为卡塔尔基因组计划(QGP)的一部分完成。

**基因组数据生成与处理**
全基因组测序(WGS)使用Illumina HiSeq X平台进行(覆盖度≥30×)。数据处理遵循西德拉医学的自动化流程。FASTQ文件使用FastQC(v0.11.2)进行质量控制,读段比对参考GRCh38/hg38基因组,变异检测采用GATK最佳实践,仅保留“PASS”评分的变异。VCF文件使用dbSNP build 151、ClinVar(最新更新于2025年9月22日)和gnomAD v4.1进行注释。质量控制排除了测序错误率低于95%、性别不一致、过高的杂合度或PCA异常值的样本,最终得到14,060个有效样本(共14,669个样本)。通过KING算法评估亲缘关系,每对二级或更近的亲属中剔除一个,得到5,385个无亲属关系的个体用于分析。

**变异提取与ACMG分类**
从14,060名QGP参与者中提取ABCG5和ABCG8基因的变异,仅限于MANE转录本。致病性或可能致病的变异依据ClinVar数据库(最新更新于2025年9月22日)进行定义。新发现的变异被归类为功能丧失(pLOF,包括终止密码子突变、移码突变、剪接供体/受体突变),且未在ClinVar等临床数据库中报道。所有pLOF变异均按照ACMG 2015指南使用VarSome工具进行分类。

**携带者频率与疾病负担估计**
携带者频率和疾病负担基于5,385名无亲属关系个体的数据估算。根据近亲繁殖人群的统计方法,特定变异的携带者频率计算公式为:携带者频率 = 该变异在杂合状态中的出现次数 / (接受检测的样本总数 - 该变异在纯合状态中的出现次数)。疾病负担通过q × F(q为等位基因频率,F为近亲繁殖系数)估算,近似表示q2 + Fpq。对于罕见致病性变异(q << 1),q2相对于Fq可忽略不计,因此可近似为Fq。本研究采用卡塔尔的近亲繁殖系数(F = 0.02706)。携带者频率和疾病负担基于ClinVar报告的致病性或可能致病性变异(评分为至少2星,无冲突记录)进行计算。ABCG5和ABCG8基因的合并携带者频率通过累加各基因在QGP中的携带者频率得出。为避免高估,确认这些计算中包含的致病性变异不在同一单倍型上。

**gnomAD数据的使用**
携带者频率和疾病负担还使用GeniE(Genetic Prevalence Estimator)工具估算,该工具利用gnomAD数据库的等位基因频率根据Hardy-Weinberg原理估算常染色体隐性疾病的患病率。我们使用gnomAD v4数据中的已知致病性/可能致病性变异,在十个亚群体(不包括中东亚群体)中比较了中东地区的植物甾醇血症患病率与全球平均水平。

**结果**
对卡塔尔基因组计划(QGP)中的ABCG5和ABCG8基因进行比对后发现,7个变异被归类为致病性或可能致病性变异(ABCG5中3个,ABCG8中4个,见表1a)。所有变异的ClinVar评分为2星,表明分类可靠性高。其中,仅有一个ABCG8 c.1720G>A p.(Gly574Arg)的纯合子个体。所有变异的次要等位基因频率(MAF)均<0.1%,但ABCG5 c.1336C>T p.(Arg446Ter)和ABCG8 c.965-1G>C的MAF分别为0.2%。此外,在ABCG8中鉴定出4个新的预测功能丧失(pLOF)变异,其致病性通过VarSome工具的ACMG分类得到确认(见表1b)。

**表1a. 卡塔尔基因组计划(QGP)数据中的致病性ABCG5和ABCG8基因变异**
| 基因 | ClinVar评分 | ACMG分类 |
|------------|---------|--------------|
| ABCG5rs199689 | 3 | pLOF |
| ABCG5rs119479 | 4 | pLOF |
| ABCG5.c.634+1 | 0 | pLOF |
| ABCG8rs9571 | 4 | pLOF |
| ABCG8rs13785 | 4 | pLOF |
| ABCG8rs7482 | 2 | pLOF |

**表1b. 卡塔尔基因组计划(QGP)数据中的新预测功能丧失(pLOF)ABCG8基因变异**
| 基因 | ClinVar评分 | ACMG分类 |
|------------|---------|--------------|
| ABCG8c.166-1 | 1 | pLOF |

**携带者频率与疾病负担估计**
基于5,385名无亲属关系个体的数据,估计植物甾醇血症1(ABCG5)的携带者频率为1:215,植物甾醇血症2(ABCG8)为1:192,相应的疾病负担分别为1:15,920和1:14,214(图1)。合并携带者频率为1:102,总体疾病负担为1:7,509(表2)。gnomADv4.1数据显示,ABCG5中识别出36个致病性变异,ABCG8中识别出34个致病性变异(补充表2),携带者频率分别为1:1,131和1:322,疾病负担分别为1:5,114,318和1:414,874。合并携带者频率为1:251,疾病负担为1:383,744(表2)。

**讨论**
本研究通过分析卡塔尔基因组计划中的ABCG5和ABCG8基因变异,展示了祖先背景和近亲繁殖对罕见脂质代谢障碍的影响。结果表明,卡塔尔人群中这些基因的携带者频率和疾病负担高于全球平均水平,提示在这些地区开展相关检测的必要性。与其他近亲或创始人群体(如北美胡特尔派教徒(携带者频率约为8%)、密克罗尼西亚科斯雷岛居民(成人携带者频率约为13%)以及老派阿米什人(携带者频率最高约为4%)相比,卡塔尔人群的携带者频率相对较低,约为1%。尽管如此,我们的研究结果挑战了将sitosterolemia视为极罕见疾病的传统观点,揭示了这些基因中的双等位基因致病变异在卡塔尔显著富集(表1和图1),导致其患病率超过7,509人中的1人,比全球估计值高出50倍。这些结果强调了将基于祖先信息的基因组数据整合到脂质紊乱筛查和管理框架中的重要性。

**临床重叠与家族性高胆固醇血症及治疗意义**
sitosterolemia与家族性高胆固醇血症(FH)之间的表型重叠仍然是诊断上的主要挑战。这两种疾病都表现为肌腱和结节性黄瘤、低密度脂蛋白(LDL)胆固醇升高以及早发性动脉粥样硬化性心血管疾病(ASCVD),但其分子病因根本不同。值得注意的是,虽然一些sitosterolemia患者可能表现出类似FH的表型,但另一些患者可能具有正常的脂质谱,并缺乏黄瘤等典型特征。FH主要通过LDLR、APOB或PCSK9的突变遗传,而sitosterolemia则由ABCG5或ABCG8的隐性功能丧失变异引起。由于标准脂质检测仅测量胆固醇而不包括植物甾醇,因此在临床实践中sitosterolemia常被误诊为FH。在我们的数据集中,一些携带ABCG8 p.Gly574Arg或c.965-1G>C变异的纯合子被记录为高胆固醇血症患者,其中一些人曾接受过冠状动脉血运重建手术,这表明存在表型分类错误。这种诊断差异具有重要的治疗意义:FH的治疗主要依赖他汀类药物和PCSK9抑制剂,而sitosterolemia则对依折麦布和饮食中甾醇的限制反应最佳。

**MENA地区的群体富集与创始效应**
卡塔尔人群中ABCG5的携带者频率显著较高(约为1:215),ABCG8的携带者频率为1:179,这反映了中东人群中创始效应、近亲结婚和血缘关系的相互作用。模型预测的隐性携带者负担(约为1:7,236)远高于gnomAD的数据(1:383,744),强调了从以欧洲为中心的数据集中推断疾病患病率的局限性。变异谱也存在差异:ABCG8 c.965-1G>C和p.Gly574Arg变异在卡塔尔及更广泛的MENA人群中更为常见,而一些新的预测功能丧失等位基因似乎仅存在于卡塔尔。

**无义突变、创始效应和rs199689137(ABCG5 p.Arg446*)**
无义突变是甾醇基因致病性的常见机制。早终止密码子(PTCs)通常通过截断关键结构域或触发无义介导的mRNA降解(NMD)来破坏蛋白质功能,尤其是当PTC位于最后一个外显子-外显子连接之前时。ABCG5或ABCG8的缺失会阻止蛋白质正确形成并运输到顶端导管膜,从而导致甾醇输出功能丧失。ABCG5基因中的c.1336C>T(p.Arg446*)变异在第10个编码外显子处引入了一个早终止密码子,使精氨酸被终止密码子取代。这种截断变异预计会通过蛋白质过早截断或无义介导的mRNA降解导致功能丧失。在我们的队列中,ABCG5的无义变异rs199689137(p.Arg446*)较为常见,在无关卡塔尔人中的频率约为0.214%,而在gnomAD中为0.011%。尽管我们未确认纯合子,但这种富集现象与区域创始效应一致,表明该变异对隐性疾病的负担有显著贡献。

**跨人群视角:从LDLR“黎巴嫩等位基因”中获得的启示**
ABCG5/ABCG8中无义变异的区域性富集与其他脂质基因的创始效应相似,尤其是LDLR的“黎巴嫩等位基因”(c.2043C>A;p.Cys681*),这是一种导致黎巴嫩及相关人群中大量FH病例的无义创始变异。这一等位基因展示了单个反复出现的PTC如何影响国家筛查策略和连锁检测框架的设计。类似地,卡塔尔中ABCG5 p.Arg446*的富集以及ABCG8中的其他截断变异(如p.Arg412*和p.Leu482fs)支持基于祖先信息的检测面板设计,并有助于主动发现高致病性的PTC,从而进行预防和家族化管理。

**无义变异的临床意义**
临床上,识别由无义突变引起的sitosterolemia具有重要意义。应优先使用依折麦布,并严格限制植物甾醇的摄入;他汀类药物和PCSK9抑制剂仅起辅助作用。在携带者中发现无义变异时,鉴于近亲家族中双等位基因疾病的高概率,应进行连锁检测。甾醇代谢组学可以帮助解释杂合状态,并在确认基因分型前确定治疗方案。

**局限性与未来方向**
我们的研究依赖于基因组注释,但植物甾醇的测量仅针对QBB队列中的一小部分参与者(14,060人中的2,877人),从而限制了特定无义等位基因的基因型-生化关联分析。尽管如此,遗传富集现象(包括p.Arg446*)、多个截断等位基因的纯合子以及相对于全球数据集高出50倍的模型预测负担强烈支持临床应用。未来的研究应整合甾醇代谢组学、转录水平NMD检测和反复出现的PTC的功能表征,以更精确地估计疾病渗透率和治疗阈值。

**结论**
ABCG5/ABCG8中的无义突变和其他截断变异是卡塔尔及更广泛MENA地区sitosterolemia风险的主要因素。ABCG5 p.Arg446*(rs199689137)的富集,加上反复出现的ABCG8截断变异,为靶向基因筛查提供了潜在的靶点。将这些变异纳入脂质紊乱诊断,并结合反射性甾醇检测,将有助于识别高风险个体,并为不同祖先背景的人群制定精准预防策略。

**伦理声明**
所有参与者均根据QBB协议提供了知情同意;所有分析均符合机构和国家的伦理标准。

**作者贡献声明**
Georges Nemer:撰写、审阅与编辑、可视化、监督、资源管理、项目协调、资金获取、正式分析、概念构建。
Khalid A Fakhro:撰写、审阅与编辑、可视化、资源管理。
Hamdi Mbarek:撰写、审阅与编辑、软件使用、资源管理。
Jamil Alenbawi:撰写、审阅与编辑、初稿撰写、可视化、验证、方法学设计、数据分析。
Geethanjali Devadoss Gandhi:撰写、审阅与编辑、初稿撰写、可视化、验证、方法学设计、数据分析。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号