在普通人群中,常见影响儿童泌尿系统(CAKUT)疾病的基因中,预测的致病性遗传变异的群体频率

《Pediatric Nephrology》:The population frequency of predicted pathogenic genetic variants in commonly affected CAKUT genes in the general population

【字体: 时间:2026年05月18日 来源:Pediatric Nephrology 2.6

编辑推荐:

  摘要 背景 肾脏和泌尿系统的先天性异常(CAKUT)影响大约每200人中的1人,其中20%的病例由单基因引起。本研究确定了六个常见CAKUT基因中预测致病变异的群体频率。 方法 从gnomAD v.2.1.1版本下载了HNF1B、SALL1、EYA1、PBX1、

  摘要
背景
肾脏和泌尿系统的先天性异常(CAKUT)影响大约每200人中的1人,其中20%的病例由单基因引起。本研究确定了六个常见CAKUT基因中预测致病变异的群体频率。

方法
从gnomAD v.2.1.1版本下载了HNF1B、SALL1、EYA1、PBX1、GATA3和PAX2的变异(n=141,456),并根据整体队列中的结构变异、无义变异和预测的致病错义变异的总和,或与ClinVar、HGMD或LOVD共享的变异来计算预测致病变异的群体频率。同时,我们还使用我们的方法和ClinVar评估,在一个复制队列(gnomAD v.4.1,n=807,162)中确定了这些变异的群体频率。

结果
在gnomAD v.2.1.1数据库中,这六个基因中致病变异的群体频率介于1/249(我们的方法)到1/1263(ClinVar评估)之间。其中超过一半的变异是错义变异。预测致病变异在非裔美国人中最常见(1/149),而在阿什肯纳兹人中最少见(1/864)。根据gnomAD v.4.1的估计,群体频率介于1/372(我们的方法)到1/1,762(ClinVar)之间。

结论
这些计算表明,由这六个基因中的变异引起的CAKUT的单基因原因可能比之前估计的每1,000人中有1例更为常见。ClinVar的结果可能低估了实际情况,因为没有对结构变异、拷贝数变异和许多错义变异进行评估。然而,由于外显率不完全和表达性差异,这里识别出的一些致病变异可能不会导致临床疾病。

图形摘要
此图像的替代文本可能是使用AI生成的。更高分辨率的图形摘要可作为补充信息提供。

引言
肾脏和泌尿系统的先天性异常(CAKUT)包括一系列肾脏和泌尿系统的发育畸形。CAKUT是一种常见的出生缺陷,影响每1000名新生儿中的3到7人[1],是儿童肾衰竭的主要原因[2, 3]。
CAKUT包括肾盂输尿管连接部梗阻[4]、肾缺如、发育不良和肾发育不全、多囊性发育不良肾、膀胱输尿管反流、巨输尿管、异位输尿管、马蹄肾和双集合系统。孤立性CAKUT没有其他异常,而综合征性CAKUT则伴有额外的肾脏外特征[4]。受影响的婴儿通常在产前通过超声检查被诊断出来,但无症状的病例可能直到青春期或更晚才被发现[5]。有些患者终生未被诊断,但仍可能将致病变异和临床表现传给后代。CAKUT是由遗传、表观遗传或环境因素引起的肾脏发育异常所致。母亲肥胖和糖尿病,以及可能的药物和铁及叶酸缺乏会增加风险[6,7,8]。据报道,20%的CAKUT病例由单基因引起[9],因此影响每1000人中的1人,尽管这一比例可能因基于具有典型表型的队列而有所偏差。
目前已有超过150个基因与CAKUT相关,其中许多基因编码在胚胎肾脏发育中起重要作用的转录因子[10, 11]。六个最常见的基因是肝细胞核因子-1B(HNF1B)、spalt样转录因子1(SALL1)、眼睛缺失同源物1(EYA1)、前B细胞白血病(PBX1)、GATA结合蛋白3(GATA3)和配对框基因2(PAX2)[12],所有病例的遗传方式均为常染色体显性[https://www.omim.org/]。HNF1B和PAX2中的致病变异至少占CAKUT病例系列的15%[13,14,15,16]。这些基因中的大多数致病变异具有可变的表型和表达性,即使在同一家庭内也是如此[17]。尽管报告了更多与CAKUT相关的基因,但大多数仅在一个家族中发现[12, 18]。
HNF1B被认为是最常见的单基因CAKUT原因(MIM137920)。它编码一个属于同源结构域超家族的转录因子,对肾脏和泌尿生殖道、大脑、胰腺、肝脏和甲状旁腺的发育至关重要[12]。致病性HNF1B变异会导致HNF1B肾病(以前称为肾囊肿和糖尿病综合征,RCAD)、多囊肾病、局灶性和节段性肾小球硬化(FSGS)或肾小管病变,以及生殖器异常和单基因糖尿病(以前称为青少年成熟期糖尿病,MODY)[19]。
PAX2被认为是第二常见的单基因CAKUT原因[15]。PAX2变异与肾裂孔综合征(RCS,MIM 120330)相关,有时还与肾发育不全、多囊性发育不良肾或膀胱输尿管反流有关[4, 20]。致病性变异也与儿童和成人的FSGS相关[21, 22]。EYA1是一种在肾脏、鳃弓和耳朵发育中起重要作用的转录因子[12]。EYA1的变异会导致鳃耳肾综合征(BOR,MIM 602588),其中三分之二的受影响者会出现肾缺如和发育不良[12],以及耳朵异常、听力损失、鳃裂和囊肿[12]。SALL1的功能丧失变异会导致Townes-Brocks综合征(TBS,MIM 107480)[23],表现为肾发育不全、异位、多囊肾和膀胱输尿管反流,同时伴有肛门闭锁、耳朵发育不良和听力障碍以及拇指异常[12, 23]。GATA3编码一种在肾脏、内耳和甲状旁腺中表达的锌指转录因子[12]。致病性GATA3变异与甲状旁腺功能减退、感音神经性听力损失、孤立肾、肾发育不全或膀胱输尿管反流相关[12](MIM 146255)[24]。PBX1是另一种转录因子[12],致病性PBX1变异与肾发育不全和多囊肾、反流、男性生殖器异常以及有时先天性心脏异常有关[1]。
基于临床筛查的先前对CAKUT群体频率的估计范围从每56人中有1例[25]、103例[26]或627例[27, 28]到每2400人中有1例[29]不等。更准确的群体频率对于提醒临床医生注意遇到受影响者的可能性、检查肾脏外表现以及制定卫生服务计划非常重要。相反,评估具有肾脏外特征的患者的临床医生也应意识到可能存在CAKUT的潜在诊断。
本研究从一组正常人群(Genome Aggregation Database,gnomAD v.2.1.1)中六个最常见的单基因致病基因的预测致病变异数量来计算CAKUT的群体频率。在Simple ClinVar(图1,https://simple-clinvar.broadinstitute.org/)中检查这些基因的致病变异表明,变异遍布整个基因,包括无义变异和错义变异[12, 18]。我们在gnomAD v.4.1中验证了我们的结果,该数据集更大,包含更多的结构和拷贝数变异,且与gnomAD v.2.1.1仅有20%的重叠。然后,我们将我们的群体频率与ClinVar数据库(https://www.ncbi.nlm.nih.gov/clinvar)、人类基因突变数据库(HGMD,https://www.hgmd.cf.ac.uk/ac/index.php)或Leiden开放变异数据库(LOVD v.3.0,https://www.lovd.nl)中评估为致病的gnomAD变异的频率进行了比较。

图1
此图像的替代文本可能是使用AI生成的。

完整大小的图像
CAKUT相关基因及其致病和可能致病的变异类型分布。这表明,根据ClinVar,可能的致病和致病变异分布在各个基因中(没有明显的热点),变异包括无义变异和错义变异(来自Simple ClinVar,https://simple-clinvar.broadinstitute.org/)。这就是评估所有发现的无义和错义变异(除了最后一个外显子或倒数第二个外显子的最后50个核苷酸中的无义变异)的理由。

我们的方法基于ACMG/AMP原则[30]评估了所有gnomAD变异(图2),但gnomAD没有临床数据,一些良性变异可能被误认为是致病的。尽管如此,之前已经使用类似且有时不太严格的策略发表了多种疾病的群体频率,包括Alport综合征[31]、Gitelman综合征[32]、常染色体显性多囊肾病[33]、黏多糖贮积症[34]、Menke病[35]和Fabry病[36]。在某些情况下,使用独立的生化或组织学方法确认了群体频率[31, 32]。

图2
此图像的替代文本可能是使用AI生成的。

完整大小的图像
在gnomAD v.2.1.1中推导CAKUT相关基因的预测致病变异群体频率的策略。我们的群体频率是根据导致功能丧失的结构变异、经历无义介导衰变的无义变异以及所有计算工具(PP2、SIFT、MT)认为罕见且致病并影响保守残基的错义变异得出的。另一种检测错义变异的方法是使用REVEL。此外,群体频率还根据ClinVar、LOVD或HGMD中评估为致病的gnomAD变异数量来计算。在ClinVar中报告为VUS加上致病或可能致病的冲突变异也被视为致病变异。对于gnomAD v.4.1,我们同时使用了我们的方法和ClinVar评估。

方法
从gnomAD v2.1.1和v4.1版本下载了EYA1、GATA3、HNF1B、PAX2和SALL1的变异(gnomAD v2.1.1来自GRCh37/hg19,www.gnomAD.broadinstitute.org;gnomAD v4.1来自GRCh38/hg38)。gnomAD v2.1.1包含来自研究无关成人糖尿病、神经精神疾病或心脏疾病的临床试验的全外显子测序(WES,n=125,748)和全基因组测序(WGS,n=15,708)数据。参与者并非基于患有肾脏疾病而被招募。gnomAD v4.1包括无关成人(n=807,162),他们的DNA在某些情况下还进行了结构(n=63,046)或拷贝数(n=464,297)变异的检查。gnomAD v2.1.1和v4.1包含相等数量的男性和女性,以及他们的祖先信息,但没有临床数据。两个队列之间的重叠率低于20%。
gnomAD v2.1.1首次访问于2023年3月,并在2024年5月进行了审查;gnomAD v4.1在2024年11月进行了审查。所有gnomAD参与者在招募时均已书面同意其数据被匿名共享并公开用于进一步研究,因此不需要机构审查委员会的批准。

注释和过滤
我们的方法之前已有描述[36]。这些基因中的变异使用ANNOVAR(https://annovar.openbioinformatics.org/)进行注释。排除了内含子区域、5′或3′ UTR区域中的变异,以及内含子、非编码区、剪接区的变异或同义变异。虽然已在CAKUT相关基因中报告了致病性和可能致病的内含子及其他非编码变异,但由于它们罕见且难以准确解读,因此未在此进行研究。其他变异根据以下方法进行了过滤(图2)。

结构变异
无论等位基因计数如何,删除和受影响的外显子都被视为致病变异。重复变异未被包括在内,因为它们的准确解读也很困难。该子集中结构变异的数量已校正,使其与整个队列的数量相当。空变异包括无义变异(最后一个外显子和倒数第二个外显子的最后50个核苷酸除外,因为这些核苷酸可以避免无义介导的衰变)(补充表S1),以及规范剪接位点和移码变异,无论其等位基因计数如何,都被归类为致病性变异。错义变异如果罕见(等位基因计数≤5)并且使用三种生物信息学工具均被判定为致病性(SIFT4G(Sorting Intolerant From Tolerant)得分≤0.05,PP2(Polymorphism Phenotyping v2,PolyPhen-2)得分≥0.95(http://genetics.bwh.harvard.edu/pph2/),以及Mutation Taster中变异被分类为“有害”或(D)或(A)(MT,https://www.mutationtaster.org/info/documentation.html),则被判定为致病性变异。还使用Clustal Omega(https://www.ebi.ac.uk/Tools/)和Ensembl参考序列(http://asia.ensembl.org/index.html)检查了这些变异是否影响脊椎动物(鸡、小鼠、人类)中保守的氨基酸(*或:)。评估错义变异的策略通过两种方式进行验证。使用在独立数据库(通常是LOVD)中被分类为致病性或良性的变异来计算敏感性、特异性以及阳性和阴性预测值(补充表S2)。我们对所有这些基因的评估表现令人满意,具有高敏感性(中位数81%)、特异性(中位数100%)以及阳性(PPV,中位数100%)和阴性预测值(NPV,中位数73%),除了SALL1基因,该基因仅用四种可用的致病性错义变异进行了测试,仅识别出其中一种。其次,在gnomAD v.2.1.1队列中,使用REVEL(Rare Exome Variant Ensemble Learner)得分>0.932或>0.80来评估错义变异,并将其数量加到结构变异和空变异中,以获得独立的群体频率评估[37, 38]。REVEL结合了13个单独的计算机预测工具(包括PP2、SIFT、MT、MutationAssessor和phyloP等)的输出,以提高诊断准确性。最近的研究表明,REVEL得分>0.8与有害性相关[39]。

从gnomAD中下载的符合我们所有致病性标准的变异被分类为“预测致病性”,以区别于ACMG/AMP标准使用的“致病性”和“可能致病性”术语[30]。使用每个基因的平均等位基因计数和检查的总人数来计算六个常染色体显性CAKUT基因的群体频率。这些基因的群体频率假设gnomAD中的每个人只有一个CAKUT基因变异,同时也认识到有时一个变异会出现在多个基因中[40]。

然后,计算了gnomAD v.4.1中不同祖先人群的预测致病性变异的群体频率。接下来,我们在ClinVar、HGMD和LOVD数据库中检查了所有gnomAD变异的先前关于致病性的报告。对于gnomAD中被评为致病性、可能致病性或存在矛盾评估(不同评估包括VUS和致病性或可能致病性)的变异,计算了它们的群体频率。无论在gnomAD中发现的次数多少,这些数据库中的致病性变异都被包括在内。

我们使用我们的方法和gnomAD v.4.1重复了群体频率的计算,包括结构变异(n=63,046)和拷贝数变异(n=464,297),并对整个队列进行了校正(分别乘以13和1.7),以及空变异和错义变化。此外,我们还使用ClinVar中评估为致病性或可能致病性或存在矛盾的变异(P/LP/VUS)来评估gnomAD v.4.1中的CAKUT群体频率。

结果使用卡方检验(https://www.graphpad.com/quickcalcs/)进行了比较。

总体而言,在gnomAD v.2.1.1的461人中,有273个变异出现在六个CAKUT基因中的一个,这些变异被预测为致病性。这相当于CAKUT的群体频率为461/114,963,即每249人中有1人(表1)。表1显示了gnomAD v.2.1.1中CAKUT相关基因的预测致病性变异的群体频率。全尺寸表格显示,SALL1基因中的变异是最常见的预测致病性变异(644人中有1人),其次是EYA1(1,314人中有1人)或HNF1B(1,614人中有1人)。在具有HNF1B变异的人中,近一半发生了缺失[19],校正后的HNF1B结构变异数量(n=33)几乎与错义和空变异的总数(n=41)相当。在其他五个基因中没有发现致病性结构变异。总体而言,使用我们的方法发现更多人具有错义变异(n=388)而不是其他类型的变异(n=73)。

当使用REVEL得分>0.932来评估gnomAD v.2.1.1中的错义变异时,在188人中发现了结构变异、空变异和预测致病性错义变异,相应的群体频率为每611人中有1人(188/114,963)(p<0.0001,与我们之前的评估相比)(表2)。REVEL得分>0.932可能过于严格,导致群体频率被低估。当使用REVEL得分>0.8[39]时,在319人中发现了预测致病性变异,相应的群体频率为每360人中有1人(319/114,963)。表2显示了使用各种数据库在gnomAD v.2.1.1中CAKUT相关基因的预测致病性变异的群体频率。全尺寸表格。

当在ClinVar中检查那些被判定为致病性或可能致病性的gnomAD变异时,在91人中发现了变异,相应的群体频率为每1,263人中有1人(p<0.0001,与我们之前的评估相比)(表2,图3)。虽然ClinVar的评估被认为是准确的,但并非所有gnomAD变异都有相应的评估,因此计算出的群体频率被低估了。特别是,没有对结构变异进行ClinVar评估。如果将我们评估中发现的致病性结构变异数量加上ClinVar的评估结果,那么在114,963人中将有124个变异,即每923人中有1人。

图3的替代文本可能是使用AI生成的。全尺寸图像。

使用不同的策略在gnomAD v.2.1.1和v.4.1中识别出的六个CAKUT基因的预测致病性变异数量。这些条形图显示了每个基因的预测致病性变异数量。然而,ClinVar对这些基因在gnomAD v.2.1.1中的评估数量有限,这表明使用ClinVar的方法低估了致病性变异的群体频率。ClinVar对HNF1B中的78/273个变异(29%)、SALL1中的131/786个变异(17%)、EYA1中的76/310个变异(25%)、PBX1中的6/126个变异(5%)、GATA3中的33/214个变异(25%)和PAX2中的56/229个变异(24%)进行了评估,即中位数为21%,范围为5-29%。

当在gnomAD v.2.1.1中检查那些在HGMD中也发现的变异时,有2,852个变异,相应的群体频率为每40人中有1人(表2,图3)。当使用LOVD中的致病性或可能致病性变异来检查gnomAD v.2.1.1时,有263个变异,相应的群体频率为每437人中有1人(表2,图3)。

当在我们的方法中检查不同祖先人群的预测致病性变异时,它们在非洲/美洲血统的人群中最常见(84/12,487,即每149人中有1人,主要是由于结构变化),其次是东亚人群(41/9,977,即每243人中有1人),而在芬兰人群(15/12,562,即每837人中有1人)和阿什肯纳兹人群(6/5,185,即每864人中有1人)中最少见(表3,图4)。这些计算包括了结构变异、空变异和错义变化,但不包括拷贝数变异。表3显示了不同祖先人群中CAKUT相关基因的预测致病性变异的群体频率。全尺寸表格。

图4的替代文本可能是使用AI生成的。全尺寸图像。

使用不同的策略在gnomAD v.2.1.1中不同祖先人群的六个CAKUT基因中识别出的预测致病性变异数量。这些条形图显示了不同祖先人群(非洲/非裔美国人、拉丁裔、阿什肯纳兹人、东亚人、欧洲人、芬兰人和其他人)中每个基因的预测致病性变异数量。结构变异仅在非洲/非裔美国人人群中被识别。

使用我们的方法和ClinVar评估对gnomAD v.4.1中的CAKUT进行了群体频率计算。gnomAD v4.1的优势在于它包括了一些患者的结构变异和拷贝数变异。我们的评估在2,168人中发现了733个预测致病性变异,相应的群体频率为每372人中有1人(p<0.0001,与我们之前的gnomAD v.2.1的估计相比)(表4)。表4显示了使用我们的方法和ClinVar评估在gnomAD v.4.1的6个CAKUT相关基因中的预测致病性变异。全尺寸表格。

根据我们的评估,最常见的受影响基因是EYA1(1,207人中有1人)、HNF1B(1,454人中有1人)和SALL1(2,300人中有1人)。EYA1的频率(卡方=0.193,p=0.66)和HNF1B变异的频率(卡方=0.257,p=0.61)与gnomAD v.2.1中的结果没有差异,但导致疾病的SALL1变异在gnomAD 4.1中要少见得多(2,300人中有1人,卡方=63.94,p<0.0001)。

使用ClinVar评估时,在458人中有71个致病性或可能致病性或存在矛盾的(P/LP/VUS)变异,相应的群体频率为每1,762人中有1人(p<0.0001,与我们之前的gnomAD v.2.1的估计相比)。同样,没有对结构或拷贝数变化进行ClinVar评估。如果将我们评估中发现的致病性结构变异数量加上ClinVar的评估结果,那么在807,162人中总共有1,154个变异,即每699人中有1人。

然而,ClinVar的评估仅在gnomAD v.4.1中对162/679个HNF1B变异(24%)、259/1,774个SALL1变异(15%)、124/778个EYA1变异(16%)、3/348个PBX1变异(1%)和15/577个GATA3变异(3%)以及17/678个PAX2变异(3%)进行了评估。因此,尽管gnomAD v.4.1包括的结构和拷贝数变异比gnomAD v.2.1.1更多,但其变异的ClinVar评估中位数为9%,范围为1-24%,而gnomAD v.2.1的中位数为21%,范围为5-29%。这意味着,再次表明,从ClinVar评估得出的群体频率被低估了,而gnomAD v.4.1得出的群体频率可能比gnomAD v.2.1的估计更加低估。

这些研究表明,六个最常见的CAKUT基因中预测致病性变异的群体频率在每249人中有1人到每1,263人中有1人之间。然而,由于外显率和表达量的变化,实际具有CAKUT相关临床特征的人数将少于这个数字。根据我们的策略,gnomAD v.2.1.1中最常见的受影响CAKUT基因是SALL1、EYA1和HNF1B,而在gnomAD v.4.1中则是EYA1、HNF1B和SALL1。这与已发表的研究结果不同,后者通常发现HNF1B和SALL1更为常见,这可能部分是由于gnomAD v.4.1中检测到的大量结构和拷贝数变异[13,14,15,16]。然而,如果得到证实,SALL1变异的外显率可能较低,且与较少的CAKUT特征相关,这意味着它们经常被忽视。总体而言,这些基因中的错义变异比空变异更常见,通常错义变异与较不严重的疾病相关[41]。然而,也有一些例外,例如17q12缺失对肾病的预后比HNF1B错义变异更好[42]。

我们的评估表明,这些六个CAKUT基因中的预测致病性变异在非洲/非裔美国人祖先人群中更为常见,部分原因是由于校正了gnomAD v.2.1.1中较少的三个HNF1B结构变异。这一结果证实了全球报告的CAKUT在非洲国家更为常见的现象,尽管社会经济因素也可能有所贡献[43]。CAKUT变异在东亚背景的人群中也很常见。预测致病性变异在阿什肯纳兹人和芬兰人中最少见,这可能是由于他们的相对社会和地理隔离。

然而,在评估这些研究的结果时存在一些方法学上的考虑。只检查了六个CAKUT基因,而实际上已识别出超过150个基因。gnomAD v.2.1.1未能充分代表患有严重或早发性疾病的人群,例如那些因不符合临床试验条件而无法参与试验的CAKUT相关肾衰竭患者。gnomAD v.2.1.1的大多数样本是通过WES检测的,它只检测了结构变化,没有检查拷贝数变化。这对于HNF1B尤为重要,因为其中一半的变异是大的缺失[19]。有趣的是,在gnomAD v.2.1.1版本中,其他五个基因并未发现任何结构变化。尽管我们的分析策略具有对每个变异进行评估的优势,并且我们的致病性判断标准比以往类似研究中的更为严格[32, 33],但其主要的不准确性来源在于对错义突变的评估。这一点通过SALL1变异的低敏感性(见补充表S2)以及与高度严谨的REVEL评估结果的对比得到了证实。ClinVar的评估结果通常较为准确[44],因为这些评估来自经过认证的检测实验室,这些实验室对临床怀疑患有肾脏疾病的患者进行了基因测序,并且遵循ACMG/AMP的标准以及基于最新大型数据集的变异罕见性评估。然而,ClinVar也过度代表了来自临床转诊队列的高外显率变异。此外,ClinVar仅对gnomAD v.2.1.1版本中这六个基因的21%的变异进行了评估(中位数范围为5-29%),并未涵盖结构变化或拷贝数变化。对于gnomAD v.4.1版本,这一比例更低(中位数评估比例为9%,范围为1-24%)。ClinVar评估数量较少,原因包括:由于CAKUT主要通过临床诊断进行,因此进行基因检测的实验室较少;受影响基因数量众多;评估错义突变的难度较大;以及缺乏有效的治疗方法。这表明,CAKUT的单基因形式在人群中的实际发病率可能高于每1263人中1例,甚至可能更接近我们估计的每249人中1例。LOVD和HGMD数据库提供的人群频率数据具有优势,因为这些数据主要来自具有CAKUT临床特征的患者,但与ClinVar不同的是,它们包含了许多在ACMG/AMP指南和大型数据集出现之前就已报告的变异。值得注意的是,LOVD和HGMD数据库中均未记录到SALL1和PBX1的任何变异。

包含基因组和临床数据的大型生物库并不一定能帮助我们获得更准确的人群频率数据。由于我们仍无法准确评估变异的致病性,因此在招募的许多患者中可能不会怀疑他们患有CAKUT,这些患者也可能没有接受过影像学检查来确认肾脏疾病的存在。有些人可能携带致病性变异,但疾病表现并不明显。某些疾病(如反流性肾病)可能在成年后自愈。实际上,LOVD和HGMD都包含了临床信息,但它们的不准确性在于无法确定基因变异是否确实是导致临床表现的原因。

本研究的优势在于:使用了大规模的基因检测队列;采用了严格的变异评估标准;比较了多种分析方法;使用了gnomAD v.4.1作为重复验证队列;并且能够确定不同祖先背景人群中的发病率。然而,本研究也存在一些局限性:gnomAD v.2.1.1版本的人群并不具有代表性——超过一半的研究参与者患有心脏或神经精神疾病或糖尿病,其余为年龄和性别匹配的对照组。gnomAD v.4.1版本并未根据表型排除参与者,因此预计其中会包含一些罕见病患者。所有参与者都不是根据是否患有肾脏疾病来选择的。其他局限性还包括:由于gnomAD数据库中缺乏临床数据,我们无法确认变异的致病性;所有gnomAD变异均未经过ClinVar的评估;结构和拷贝数分析不完整;以及我们的计算评估可能存在误差。此外,我们仅检查了与CAKUT相关的六个基因中的六个;有时,同一个个体中可能同时存在两个CAKUT基因的致病性变异,而且我们没有考虑由于嵌合现象导致的疾病可能性。尽管如此,我们之前曾使用这种方法估计过Alport综合征和单基因疾病(如Fabry病和常染色体显性多囊肾病[31, 45])的人群频率,所有计算出的CAKUT发病率都表明这些疾病的实际发病率比之前认为的要高。

总之,本研究表明,在gnomAD中发现的六个CAKUT基因的预测致病性变异的发病率在每249人到每1263人之间。我们将gnomAD中致病性变异的发病率估计为每249人中1例,这一结果可能偏高,因为错义突变的评估较为困难。相比之下,根据ClinVar数据得出的每1263人中1例的发病率可能偏低,因为并非所有gnomAD变异都经过了ClinVar的评估。先前的研究发现,CAKUT的发病率约为每200人中有1例,其中每5人或总体上每1000人中有1例是由单基因引起的。我们得出的发病率与更多CAKUT病例具有遗传基础的观点一致。重要的是,大约一半的预测致病性变异是错义突变,这些突变通常(但并非总是)与较轻的临床表现相关[41],因此实际具有CAKUT临床特征的人数可能低于我们估计的每249人中1例。未来,计算工具的改进以及利用包含基因组和临床数据的大型数据库,将使我们能够更准确地估计这六个基因的发病率以及疾病的实际外显率。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号