妊娠期糖尿病与2型糖尿病共享遗传机制的多组织转录组学研究揭示COBLL1等四个新型易感基因

《Nature Communications》:Genetic insights and mechanistic parallels in gestational diabetes mellitus and type 2 diabetes

【字体: 时间:2026年01月17日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对妊娠期糖尿病(GDM)与2型糖尿病(T2D)共享遗传基础尚不明确的科学问题,开展了大规模的多组织转录组关联分析。研究人员整合FinnGen R11的GWAS数据和GTEx V8的eQTL数据,通过UTMOST、FUSION和MAGMA等多种分析方法,首次系统鉴定了5个GDM易感基因和97个T2D易感基因,其中COBLL1、NRBP1、IFT172和TRIM54为两者共享。孟德尔随机化分析证实了这些基因与疾病风险的因果关系,功能分析揭示了其在胰岛素分泌、能量平衡等通路中的作用。该研究为理解两种糖尿病的共同发病机制提供了新视角,为精准预防和治疗提供了潜在靶点。

  
在全球范围内,妊娠期糖尿病(Gestational Diabetes Mellitus, GDM)的患病率在过去十五年间显著上升,目前每年影响超过1600万次妊娠。GDM不仅会增加不良妊娠结局的风险,更令人担忧的是,患有GDM的女性日后发展为2型糖尿病(Type 2 Diabetes, T2D)的终身风险显著升高。这种“糖尿病引发糖尿病”的循环现象提示两种疾病之间可能存在深刻的遗传联系。然而,尽管全基因组关联研究(Genome-Wide Association Study, GWAS)已成功鉴定了众多T2D的风险位点,但对GDM特异性遗传基础的理解仍非常有限。以往的GDM遗传研究大多聚焦于其与T2D的遗传重叠,但许多GWAS发现的风险位点位于基因的非编码区,其功能意义难以直接解读,这成为了揭示疾病机制的主要障碍。
为了突破这一瓶颈,研究人员将目光投向了转录组关联分析(Transcriptome-Wide Association Study, TWAS)。这种方法通过利用遗传数据来预测基因表达水平,进而将基因表达与疾病表型关联起来,能够更有效地识别出具有功能意义的基因。传统TWAS通常在单个组织中进行,可能忽略了基因调控在不同组织间的协同效应。近期发展的跨组织TWAS方法,如统一分子特征检验(Unified Test for Molecular Signatures, UTMOST),通过整合多个组织的基因表达数据,提升了发现基因-表型关联的统计效能和全面性。
发表在《Nature Communications》的这项研究,正是利用了这一前沿技术。研究团队旨在系统性地探究GDM和T2D之间的遗传关联和潜在的因果关系,并识别共享的易感基因及其生物学功能。他们提出了一个关键科学问题:GDM和T2D在分子水平上究竟共享哪些遗传风险基因?这些基因又是通过何种生物学途径影响疾病发生的?
为了回答这些问题,研究人员开展了一项整合多种生物信息学分析方法的系统性研究。他们首先利用RHOGE方法评估了GDM和T2D在47种人体组织中的遗传相关性,并探究了二者之间的双向因果关系。接着,他们结合GTEx V8计划的基因表达定量性状位点(expression Quantitative Trait Loci, eQTL)数据和FinnGen R11发布的GDM及T2D的GWAS汇总数据,进行了跨组织的TWAS分析(使用UTMOST方法)和单组织TWAS分析(使用FUSION方法)。同时,他们还采用了MAGMA进行基因水平的关联分析。为了确保结果的稳健性,他们只选取了在这三种分析方法中均显著相关的基因作为候选易感基因。随后,他们对筛选出的基因进行了条件性与联合多SNP分析(Conditional and joint multiple-SNP analysis, COJO)以排除连锁不平衡造成的假阳性。为了验证候选基因与疾病间的因果关系,他们进行了孟德尔随机化(Mendelian Randomization, MR)分析和共定位分析(Colocalization Analysis)。此外,研究还涵盖了表型全关联研究(Phenome-Wide Association Study, PheWAS)、GeneMANIA基因网络分析、通路富集分析、组织与细胞类型特异性分析以及基因-化学物-疾病相互作用分析,从而多层次地阐释候选基因的生物学意义和临床潜在价值。
本研究主要采用了以下几种关键计算生物学方法:1. 遗传相关性分析与因果推断(RHOGE):用于评估GDM与T2D在47种组织中的遗传相关性及双向因果效应。2. 转录组关联分析(TWAS):包括跨组织分析(UTMOST)和单组织分析(FUSION),整合GTEx V8 eQTL数据和FinnGen R11的GWAS汇总数据(GDM病例16,802例,对照237,816例;T2D病例71,728例,对照369,007例,均为欧洲裔)来识别与疾病相关的基因。3. 基因集分析(MAGMA):用于基因水平的关联分析。4. 因果推断与共定位:采用孟德尔随机化(MR)和共定位分析(coloc)验证基因表达与疾病的因果关系。5. 功能注释:包括PheWAS、GeneMANIA网络分析、通路富集分析(g:Profiler)、组织/细胞类型特异性富集分析(TSEA/CSEA)以及基因-化学物相互作用分析(CTD)。
遗传相关性及GDM与T2D的双向因果关系
研究人员首先利用TWAS数据评估了GDM和T2D在47种组织中的遗传相关性。结果发现,两种疾病在所有被分析的组织中均存在显著的表达介导的遗传正相关。其中,冠状动脉组织中的遗传相关性最强(r = 0.92, p = 9.13×10-62)。进一步的1000次Bootstrap分析证实了这种相关性的稳健性。此外,双向回归分析揭示了GDM和T2D之间存在显著的双向因果关系。具体而言,GDM对T2D具有因果效应,且在主动脉(Artery Aorta)中效应最强(OR = 1.86, p = 2.14×10-78)。反过来,T2D对GDM也存在因果效应,同样在主动脉中最强(OR = 1.81, p = 3.94×10-77)。这些结果在传统双向MR分析中得到了印证(GDM→T2D: OR = 1.15, p = 8.17×10-6; T2D→GDM: OR = 1.58, p = 1.94×10-77)。这表明GDM和T2D在遗传上高度相关且可能存在相互促进的因果路径。
GDM和T2D易感基因的鉴定
通过整合UTMOST(跨组织)、FUSION(单组织)和MAGMA(基因水平)三种分析方法的结果,研究团队最终确定了5个GDM的候选易感基因和97个T2D的候选易感基因。尤为重要的是,他们发现其中有四个基因是GDM和T2D所共享的,分别是COBLL1、NRBP1、IFT172和TRIM54。这一发现为理解两种疾病的共同遗传基础提供了直接证据。
条件性与联合分析识别独立遗传信号
为了确保所识别基因信号的独立性,避免因连锁不平衡(Linkage Disequilibrium, LD)导致的假阳性,研究人员对初步筛选出的基因进行了条件性与联合多SNP分析(COJO)。该分析旨在鉴定出在特定组织中对疾病具有独立贡献的基因。例如,对于共享基因COBLL1,在内脏脂肪组织(Adipose Visceral Omentum)中对其进行条件性分析后,GDM的TWAS信号并未受到显著影响,表明COBLL1在此组织中的关联信号是独立的。类似的分析也在其他共享基因上进行,揭示了这些基因在不同组织中与GDM和T2D关联的独立性或相互依赖性。
因果与共定位分析揭示共享基因的组织特异性关联
为了深入探究四个共享基因(COBLL1, NRBP1, IFT172, TRIM54)与GDM/T2D风险的因果关系,研究团队进行了孟德尔随机化(MR)和共定位分析。
  • COBLL1:MR分析显示,该基因在四个组织(包括大脑皮层Brain Cortex)中的表达与GDM和T2D风险存在显著的因果关联(对于GDM,OR = 0.85;对于T2D,OR = 0.82)。共定位分析进一步支持了在内脏脂肪组织、主动脉和胫神经等组织中存在共享的因果变异。
  • NRBP1:该基因与GDM在16个组织中存在因果关联,其中在腿部暴露皮肤(Skin Sun Exposed Lower Leg)中关联最强(OR = 0.77)。与T2D的因果关联也在16个组织中被发现,在主动脉中最强(OR = 0.80)。共定位分析在食管胃连接处和小肠末端回肠等组织支持了NRBP1与T2D的关联。
  • IFT172 和 TRIM54:MR分析发现IFT172在脾脏中的表达与GDM和T2D均存在因果关联。共定位分析则揭示了这两个基因在甲状腺、大脑前扣带回皮层BA24等组织中与两种疾病存在共享的因果变异位点(如rs780096, rs780095)。
    这些结果不仅证实了这四个基因与GDM/T2D风险的因果关系,还凸显了其作用的组织特异性。
表型全关联研究(PheWAS)揭示基因的广泛表型关联
为了探索这四个共享基因是否还与其他疾病或表型相关,研究人员进行了PheWAS分析。结果发现,COBLL1、IFT172和TRIM54的遗传变异与多种二元表型(如内分泌/代谢疾病、肌肉骨骼疾病)和定量表型(如蛋白质组学、代谢组学、实验室检查结果)显著相关。这表明这些基因可能具有多效性,其作用不仅限于糖尿病。然而,NRBP1的变异在本分析中未显示出与任何表型的显著关联。
基因网络与通路富集分析揭示生物学功能
通过GeneMANIA网络分析,研究人员探索了这四个共享基因的相互作用网络及可能参与的生物学通路。
  • COBLL1:其网络主要富集在与肌动蛋白动力学相关的通路上,如肌动蛋白成核、肌动蛋白丝聚合。
  • NRBP1:其网络富集在核苷酸磷酸化相关过程,如DNA模板转录延伸、磷氧裂合酶活性等。
  • IFT172:其网络与微管蛋白运输、纤毛内运输等过程相关。
  • TRIM54:其网络富集在泛素水解酶活性、ω肽酶活性等通路。
    这些分析为理解这些基因如何通过特定生物学过程影响GDM和T2D风险提供了重要线索。
GDM和T2D相关基因的通路富集与组织/细胞类型特异性
对GDM和T2D相关基因集的通路富集分析显示,GDM相关基因在铁硫簇结合、甲基硫转移酶活性等通路上富集。而T2D相关基因则显著富集于电压门控钠通道活性、微管相关过程、中心体等通路,KEGG通路分析还提示其与军团菌病相关。组织特异性表达分析(TSEA)表明,T2D相关基因在心脏、胰腺、肝脏、肾脏和肾上腺中显著富集。GDM相关基因则在肾上腺、脂肪组织、神经、心脏和肌肉中富集。在细胞水平上(CSEA),T2D基因在放射状胶质细胞、I型肺泡细胞等细胞类型中富集,而GDM基因在肥大细胞、角膜上皮细胞等细胞中富集。这些结果提示了这些易感基因发挥作用的具体场所。
共享基因的化学相互作用与疾病通路
利用比较毒理学数据库(CTD)的分析预测了四个共享基因可能与哪些化学物质发生相互作用。例如,COBLL1可能与四氯二苯并对二噁英、双酚A等化学物存在交互;NRBP1、IFT172和TRIM54也各自与一系列环境化学物有潜在相互作用。进一步的基因-化学物-疾病通路分析表明,这些基因可能通过影响体重动态、肝脏疾病、肾脏疾病、炎症等多种生理紊乱参与疾病过程。例如,COBLL1被认为是非酒精性脂肪肝和心肌再灌注损伤的潜在生物标志物。
本研究通过整合多组织转录组数据与遗传数据,深入揭示了GDM和T2D之间密切的遗传关联和双向因果关系。研究不仅证实了两种疾病共享广泛的遗传背景,更重要的是,通过先进的生物信息学方法,首次系统性地鉴定出5个GDM易感基因和97个T2D易感基因,并发现COBLL1、NRBP1、IFT172和TRIM54是二者共享的关键基因。后续的因果推断、功能富集和网络分析表明,这些基因可能通过调节肌动蛋白动力学、胰岛素分泌、纤毛功能、能量代谢等不同生物学途径来影响疾病易感性。
这项研究的发现具有多重重要意义。在科学上,它深化了我们对GDM和T2D共享遗传机制的理解,将疾病关联从遗传位点层面推进到基因功能和组织特异性层面,为揭示疾病的分子病理生理机制提供了新的线索。在临床转化方面,这些新发现的易感基因,特别是四个共享基因,有望成为未来开发新的糖尿病风险预测模型、进行早期个体化风险分层以及探索新型治疗靶点(如针对NRBP1的保护性作用)的重要基础。对于有GDM病史的女性,基于遗传信息的精准风险评估可能有助于更早地识别出高T2D风险人群,从而实施更有效的早期干预措施,打破“糖尿病引发糖尿病”的循环。从公共卫生角度,该研究强调了在更广泛人群中验证这些遗传发现的重要性,并为未来可能将遗传信息整合进糖尿病预防策略提供了科学依据。
当然,研究也存在一些局限性,例如研究对象仅限于欧洲裔人群,限制了结果在其他人群中的普适性;GDM患者主要为年轻女性,而T2D人群年龄分布更广且包含两性,可能存在年龄和性别相关的混杂因素。未来的研究需要在更多样化的人群中进行验证,并借助实验生物学手段进一步阐明这些易感基因的确切分子功能。尽管如此,该项工作无疑为理解两种重要糖尿病的共同遗传基础奠定了坚实基石,开辟了新的研究方向。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号