一项全基因组关联研究将GNPNAT1确定为德黑兰心血管代谢遗传研究中子宫内膜异位症的候选风险位点

《Middle East Fertility Society Journal》:A genome-wide association study identifies GNPNAT1 as a candidate risk locus for endometriosis in the Tehran Cardio-metabolic genetic study

【字体: 时间:2026年05月07日 来源:Middle East Fertility Society Journal 1.3

编辑推荐:

  摘要 背景 迄今为止,阐明子宫内膜异位症遗传结构的人群研究主要集中在欧洲血统的个体上,从而在理解非欧洲人群的遗传影响方面存在空白。本研究旨在识别与伊朗女性子宫内膜异位症相关的潜在遗传变异。 研究设计和方法 我们进行了一项针对子宫内膜异位症的全基因组关联研究,纳入了1978名参

  摘要

背景
迄今为止,阐明子宫内膜异位症遗传结构的人群研究主要集中在欧洲血统的个体上,从而在理解非欧洲人群的遗传影响方面存在空白。本研究旨在识别与伊朗女性子宫内膜异位症相关的潜在遗传变异。

研究设计和方法
我们进行了一项针对子宫内膜异位症的全基因组关联研究,纳入了1978名参与者,其中包括305名子宫内膜异位症患者和1673名未受影响的个体。从TCGS队列中选取了一个独立的验证队列,包含829名女性(101例患者和728名对照组)。使用全基因组复杂性状分析框架分析了超过900万个遗传变异,并进行了综合生物信息学和功能注释分析。

结果
在发现阶段,我们确定了GNPNAT1位点上的rs12886544与子宫内膜异位症易感性具有全基因组显著性(OR = 1.66,p值 = 5.89 × 10^-8)。在验证队列中,效应方向与发现阶段一致,尽管在多重检验校正后该关联不再具有统计学意义(OR = 1.4,95% [CI 0.89–2.11],p = 0.14)。发现队列和验证队列的合并分析显示rs12886544与子宫内膜异位症风险之间存在统计学上的显著关联(合并p值 = 0.001,OR = 1.59,95% CI 1.19–1.89)。表观基因组学结果表明,rs12886544可能影响与Bobby Sox同源物(BBX)转录因子相关的调控基序,暗示其在调节基因表达中可能发挥作用。

结论
我们的发现提供了支持性证据,表明GNPNAT1位点上的rs12886544与伊朗女性的子宫内膜异位症易感性相关。这一关联在一个独立队列中得到了效应方向的一致性支持,并且在合并分析中也具有显著性,尽管需要在更大规模的独立人群中进一步验证。此外,伊朗人群和欧洲人群之间观察到的等位基因频率差异强调了跨种族研究对理解子宫内膜异位症遗传结构的重要性。

图形摘要
该图像的替代文本可能是使用AI生成的。

背景
迄今为止,阐明子宫内膜异位症遗传结构的人群研究主要集中在欧洲血统的个体上,从而在理解非欧洲人群的遗传影响方面存在空白。本研究旨在识别与伊朗女性子宫内膜异位症相关的潜在遗传变异。

研究设计和方法
我们进行了一项针对子宫内膜异位症的全基因组关联研究,纳入了1978名参与者,其中包括305名子宫内膜异位症患者和1673名未受影响的个体。从TCGS队列中选取了一个独立的验证队列,包含829名女性(101例患者和728名对照组)。使用全基因组复杂性状分析框架分析了超过900万个遗传变异,并进行了综合生物信息学和功能注释分析。

结果
在发现阶段,我们确定了GNPNAT1位点上的rs12886544与子宫内膜异位症易感性具有全基因组显著性(OR = 1.66,p值 = 5.89 × 10^-8)。在验证队列中,效应方向与发现阶段一致,尽管在多重检验校正后该关联不再具有统计学意义(OR = 1.4,95% [CI 0.89–2.11],p = 0.14)。发现队列和验证队列的合并分析显示rs12886544与子宫内膜异位症风险之间存在统计学上的显著关联(合并p值 = 0.001,OR = 1.59,95% CI 1.19–1.89)。表观基因组学结果表明,rs12886544可能影响与Bobby Sox同源物(BBX)转录因子相关的调控基序,暗示其在调节基因表达中可能发挥作用。

结论
我们的发现提供了支持性证据,表明GNPNAT1位点上的rs12886544与伊朗女性的子宫内膜异位症易感性相关。这一关联在一个独立队列中得到了效应方向的一致性支持,并且在合并分析中也具有显著性,尽管需要在更大规模的独立人群中进一步验证。此外,伊朗人群和欧洲人群之间观察到的等位基因频率差异强调了跨种族研究在理解子宫内膜异位症遗传结构中的重要性。

引言
子宫内膜异位症是一种慢性、雌激素依赖性的炎症性疾病,其特征是类似子宫内膜的组织在子宫腔外、盆腔腹膜和卵巢中异位存在。大约5-10%的育龄女性受到影响,而在不孕症患者中这一比例可高达20-50%,该疾病表现出显著的临床异质性。它对全球的生殖健康、生活质量和医疗系统造成了巨大负担[1, 2]。尽管主要属于良性病变,但在极少数情况下,子宫内膜异位症可能在生殖器官(如卵巢)内发展成特别严重的状况。尽管其患病率很高,但由于症状非特异性以及需要手术确诊,诊断仍然具有挑战性,这往往导致数年的延迟[3]。子宫内膜异位症的病因是多因素的,涉及遗传易感性和环境因素(如年龄、体重指数(BMI)和生殖史)之间的复杂相互作用。遗传因素估计占疾病易感性的50%。家族研究和双胞胎研究表明具有很强的遗传性:受影响女性的直系亲属患病风险增加多达7倍,单卵双胞胎的一致性显著高于双卵双胞胎,遗传性约为51%[4,5,6,7]。这些发现突显了基因结构在疾病发展中的核心作用。

早期对子宫内膜异位症的遗传学研究主要集中在候选基因上,特别是那些参与雌激素信号传导(ESR1、PGR)和炎症(TNF、IL-1)的基因,反映了激素和免疫失调驱动疾病的假设。后来,遗传关联研究转向了全基因组关联研究(GWAS)。第一个稳健的GWAS信号来自日本的一个队列(Uno等人,2010年),发现了9p21染色体上的CDKN2BAS位点rs10965235,该基因组区域与细胞周期调节有关[8,9,10,11]。不久之后,Painter等人[12]报告了欧洲血统女性中7p15.2染色体上的基因间SNP rs12700667的显著关联,该位点包含与子宫发育相关的基因。随后在欧洲人群中的研究发现了其他位点,包括HOXA10(一个关键的子宫发育和子宫内膜感受性转录调节因子)和NFE2L3(一个与细胞分化和应激反应调节相关的转录因子),这些都可能影响子宫内膜重塑[12,13,14,15]。VEZT附近的变异也与细胞间黏附和上皮完整性有关,这些过程与子宫内膜植入和病变形成有关,而GREB1(一个对雌激素有反应的基因)支持激素驱动信号在子宫内膜异位症发病机制中的核心作用,主要影响子宫内膜和异位盆腔病变[16,17,18]。此外,涉及IL1A和STAT3基因的关联强调了促炎细胞因子信号传导和下游转录程序的贡献,这与子宫内膜、腹腔和病变相关免疫细胞中的炎症微环境一致[12]。一项冰岛研究发现了KDR(编码VEGFR2)、TTC39B和RTN4RL1基因附近的信号,这些信号可能与卵巢/盆腔植入物的血管生成有关,同时一些位点可能与代谢调节(TTC39B)和神经生物学过程(RTN4RL1)相关,这些可能影响症状的异质性,包括疼痛[19]。相比之下,一个波兰队列未能确认之前报道的22个SNP[20]。这些差异强调了遗传研究中种族多样性的重要性,表明某些风险变异可能具有人群特异性。

尽管最近取得了进展,但中东和伊朗人群的子宫内膜异位症遗传图谱仍大部分尚未被探索。虽然欧洲和东亚队列的大规模GWAS已经发现了许多风险位点,但这些发现的普遍性和代表性不足人群中特定遗传风险因素的潜在性尚不清楚。这一空白阻碍了在这些人群中发展精准医疗方法。为了填补中东人群的遗传数据空白并研究特定祖先风险因素的潜力,我们在一个大型伊朗队列中进行了GWAS,具体目标如下:(1)发现与子宫内膜异位症相关的候选和人群特异性遗传变异;(2)评估先前大规模研究中确定的风险位点在我们队列中的适用性;(3)对识别出的变异进行功能注释,以阐明它们在疾病发病机制中的潜在作用。我们的研究旨在扩大对子宫内膜异位症遗传学的全球理解,并为开发针对伊朗人群的靶向诊断和治疗方法做出贡献。

患者和方法
我们使用了德黑兰脂质和葡萄糖研究(TLGS)的数据,这是一项始于1998年的持续队列研究,旨在调查城市居民中非传染性疾病的危险因素[21, 22]。在此框架下,建立了德黑兰心血管代谢遗传研究(TCGS),利用高通量基因分型和测序技术确定关键心血管代谢特征的遗传决定因素[23]。TLGS最初招募了15,005名参与者,所有参与者年龄在3岁或以上。经过培训的工作人员通过标准化访谈收集了有关人口统计学、生殖健康、生活方式因素和医疗史的详细信息。训练有素的全科医生在基线时进行了身体和人体测量,并在随后的七个阶段中每三年进行一次随访。

对于这项分析,我们纳入了第6次随访时年龄在18-50岁之间的非绝经女性,这些女性填写了扩展的生殖问卷[24]。参与者被询问是否有子宫内膜异位症的既往诊断,所有自我报告的病例都通过回顾其医疗记录进行了验证。还检查了报告中度至重度慢性盆腔疼痛、痛经或性交痛的女性?医疗记录。经验丰富的超声技师进行了经腹部(3.5 MHz)或经阴道(5 MHz)超声检查。对于没有既往诊断的女性,使用国际深度子宫内膜异位症分析(IDEA)组的标准化方案评估了疑似子宫内膜异位症。

共有3,450名符合条件的女性参与者被随机分配到两个组:70%(n = 2,415)用于发现阶段,30%(n = 1,035)用于验证阶段。研究的流程图如图1所示。

图1
该图像的替代文本可能是使用AI生成的。

全基因组关联研究(GWAS)中使用的当前子宫内膜异位症研究设计和分析工作流程概述。N表示样本量。

子宫内膜异位症的定义
在本研究中,如果参与者自我报告的诊断结果随后通过医疗记录得到确认,则被归类为子宫内膜异位症病例。此外,无论是否存在慢性盆腔疼痛、痛经或性交痛等症状,超声诊断为子宫内膜异位症的妇女也被纳入子宫内膜异位症组。表现出慢性盆腔疼痛或中度至重度痛经或性交痛但超声检查结果阴性的参与者被排除在外,因为阴性超声结果并不能完全排除子宫内膜异位症,特别是浅表性腹膜疾病。

这种分类遵循2022年ESHRE指南,该指南建议将腹腔镜检查保留给有症状且影像学检查结果阴性或治疗无效的患者,并建议对影像学检查结果阴性的无症状个体不进行常规腹腔镜筛查[26]。因此,最终分析包括406名被诊断为子宫内膜异位症的女性和2401名对照组参与者。

基因分型质量控制
TCGS参与者的基因分型使用Illumina Human OmniExpress-24-v1-0微阵列芯片进行,该芯片包含652,919个SNP位点,由冰岛的deCODE genetics/Amgen公司根据制造商的协议(Illumina Inc., San Diego, CA, USA)执行[23]。选出了1,462个样本进行全基因组测序。使用IMPUTE隐马尔可夫模型(HMM)进行变异插补,其中基于与训练集共享的单倍型对芯片基因分型的个体进行了插补。在关联分析之前,应用了质量控制程序以确保基因型数据在个体和SNP水平上的可靠性[27, 28]。根据以下标准排除了遗传变异:(1)基因分型率低于95%;(2)次要等位基因频率(MAF)小于0.05;(3)偏离哈迪-温伯格平衡(p值 < 1 × 10^-6)。参与者因以下原因被排除:(1)通过PLINK的“性别检查”发现性别不一致;(2)缺失数据超过5%;(3)亲属关系值(IBD)≥ 18.5%;(4)极端杂合度水平 > ± 3SD。

统计分析
我们的功效计算使用了Genetic Association Study(GAS)Power Calculator [29]。根据我们的可用数据和已发表的估计值指定了以下参数:风险等位基因频率:约0.49;基因型相对风险:1.5;子宫内膜异位症患病率:20%;全基因组显著性阈值在发现阶段为5 × 10^-8,在验证阶段为0.05。在这些假设和我们的可用病例(发现阶段305例,验证阶段101例)下,估计的功效分别为96%和92%。

连续变量的正态性使用Kolmogorov–Smirnov检验进行评估。遵循正态分布的变量以平均值±标准差(SD)表示,并使用Student’s t检验在组间进行比较。分类变量以百分比表示,并使用卡方(χ2)检验进行比较。统计方法分别对发现队列和验证队列进行。在发现阶段,使用FastGWA方法在Genome-Wide Complex Trait Analysis(GCTA;版本1.93 beta)中对常染色体变异进行了全基因组关联测试。FastGWA在加性遗传框架下应用混合线性模型,并通过遗传关系矩阵(GRM)考虑了相关性和人群结构。本研究中,将子宫内膜异位症的病例对照状态作为结果变量进行建模,所有检验均为双侧检验。分析调整了初潮年龄、体质指数(BMI)、吸烟情况(无论是否伴有痛经)、以及10个主成分(PCs),以捕捉人群结构的影响。尽管伊朗人群相对同质,但由于地区或种族多样性(波斯人、突厥人、库尔德人和俾路支人)的存在,可能存在细微的遗传亚结构。为了解决这一问题,我们使用PLINK从 autosomal SNPs 中提取了 PCs,并用 GCTA 估计了遗传关系矩阵(GRM)。通过分位数-分位数(Q–Q)图和基因组控制因子(λ)来评估基因组膨胀现象。使用 R (版本 4.0.2)中的 qqman 包生成了曼哈顿图和 Q–Q 图。为了考虑多重检验的影响,将全基因组统计显著性定义为 P 值 < 5 × 10??。使用 LocusZoom 生成了显著位点的区域关联图。

在验证阶段,我们使用 PLINK 中实现的加性遗传模型进行了逻辑回归关联检验。通过 100,000 次迭代的重采样排列检验来评估关联信号的稳健性。报告了比值比(ORs)及其对应的双侧 P 值,统计显著性定义为 P 值 < 0.05。

**GWAS 结果的功能注释**
我们使用 HaploReg 对 GWAS 结果进行了功能解读,该工具有助于识别高连锁不平衡的标记 SNP,并提供有关染色质状态、保守区域和转录因子基序变化的见解 [30]。为了进一步丰富研究结果,我们整合了 ENCODE 和 Roadmap Epigenomics Mapping Consortium 的表观基因组映射数据,从而能够在变异体和基因层面进行解读。我们还利用了其他资源,包括 GWAS Atlas、FinnGen、PheWeb 和 Open Targets,以探索表型注释和先前报道的特征关联 [31,32,33,34]。这些开放访问的数据库有助于识别和优先考虑潜在的因果变异体和基因,为 GWAS 结果提供全面的功能理解 [35]。

**研究人群特征**
共有 2,807 名女性参与了这项研究,其中 406 人患有子宫内膜异位症,2,401 人为对照组。她们被随机分配到两个阶段:发现阶段(305 例病例和 1,673 例对照组)和验证阶段(101 例病例和 728 例对照组)。按子宫内膜异位症状态和研究阶段分层的基线特征见表 1。正如预期的那样,患有子宫内膜异位症的女性报告的痛经和慢性盆腔疼痛发生率高于对照组。

**发现阶段**
经过质量控制后,使用 FastGWA 分析了大约 900 万个推断出的变异体,同时调整了初潮年龄、BMI、吸烟状况以及 10 个主成分。随后在次要分析中引入痛经作为额外的协变量,以评估我们的发现结果的稳定性。基因组膨胀因子(λ = 1.08)表明测试统计量的膨胀程度很小,证实了对人群分层的充分控制,这排除了假阳性关联信号的存在(图 2A)。

**结果**
我们在 14q22.1 染色体上识别出一个全基因组显著位点(rs12886544;OR = 1.66,95% CI:1.35–2.04;p 值 = 5.89 × 10??),如图 2B 所示。这个内含子变异位于 GNPNAT1(葡萄糖胺-磷酸 N-乙酰转移酶 1)基因内,该基因编码六糖胺生物合成途径中的关键酶。值得注意的是,风险等位基因(C)在不同人群中的频率存在显著差异:TCGS 队列中的 MAF = 0.495,而在欧洲人群中 MAF = 0.001,这表明该位点可能对特定人群的子宫内膜异位症易感性有贡献。区域关联图显示 GNPNAT1 附近有一个明显的峰值,没有多次独立信号的证据(图 3)。这项敏感性分析的结果与我们的原始发现(主要 GWAS 模型)高度一致。即使在校正了痛经和其他协变量后,这一关键的全基因组显著关联仍保持稳健。此外,从未调整痛经的模型中的 13 个 SNP(补充表 1A)增加到校正痛经后的模型中的 17 个 SNP(补充表 1B)。这些结果共同表明,是否包括痛经并不会实质性改变检测到的遗传关联,从而增强了我们发现的稳健性和可解释性。据我们所知,这个位点在之前的子宫内膜异位症 GWAS 分析中未曾被报道。三个独立信号映射到 MICAL3 位点(22q12.1),提示这里可能存在一个潜在的调控热点。

**验证阶段**
在验证阶段,我们在一个由 101 例子宫内膜异位症患者和 728 例对照组组成的独立验证队列中进一步评估了最初在发现阶段鉴定出的主要 SNP(rs12886544)。在 PLINK 中进行逻辑回归分析,并调整了发现阶段使用的协变量。经过错误发现率(FDR)校正的多重检验后,没有一个检测到的变异达到统计显著性。对于主要变异 rs12886544,在验证阶段的效应方向与发现阶段观察到的一致。然而,在多重检验校正后,这种关联不再具有统计显著性(OR = 1.4,95% [CI 0.89–2.11],p 值 = 0.14)。随后使用 PLINK 中的逻辑回归结合发现阶段和验证阶段的协变量和分析框架进行了联合分析,结果显示 rs12886544 与子宫内膜异位症易感性之间存在统计学上的显著关联(联合 p 值 = 0.001,OR = 1.59,95% CI 1.19–1.89;表 2)。尽管在验证队列中经过多重检验校正后 rs12886544 的关联未达到统计显著性,但其一致的效应方向和统计上显著的联合分析结果为其在子宫内膜异位症中的作用提供了支持性证据。

**子宫内膜异位症相关 SNP 的功能注释分析**
为了表征 rs12886544 的潜在生物学功能,我们使用了 HaploReg、PheWeb、Open Targets、ENCODE、Roadmap Epigenomics、GWAS Atlas 和 FinnGen(补充表 S3-S6)对其进行了整合功能注释。此前没有 GWAS 将该变异与子宫内膜异位症联系起来。在 1000 Genomes Project 中,该变异与已知编码变异没有显著连锁不平衡(r2 > 0.1),提示其信号是独立的。

在变异体水平上,根据 HaploReg 的预测,rs12886544 位于具有增强子和启动子元件特征的基因组区域内。该变异还与 DNase I 高敏感性位点重叠,表明在多种细胞类型和组织中染色质是开放的可塑状态,尤其是在脂肪组织和卵巢组织中。这些组织在子宫内膜异位症的病理生理学中起着关键作用,突显了 rs12886544 通过表观遗传调控在疾病机制中的潜在功能相关性 [36]。Roadmap Epigenomics 和 ENCODE 项目的注释进一步表明,rs12886544 是生殖系统中的功能显著变异。该 SNP 被预测能修饰一个调控基序,并与转录因子 Bobby Sox 同源物(BBX)相互作用。后续分析揭示了与 rs12886544 相关的表观遗传信号,特别是在卵巢、胎盘和宫颈等生殖组织中组蛋白 H3 第 4 位点的三甲基化(H3K4me3)。这些发现强调了生殖系统的潜在调控作用,为子宫内膜异位症的潜在机制提供了假设基础。

**GNPNAT1 基因的通路分析**
我们利用京都基因与基因组百科全书(KEGG)和 Reactome 数据库确定了与子宫内膜异位症相关的关键生化通路。结果显示,GNPNAT1 基因参与了 UDP-N-乙酰葡萄糖胺的生物合成,这是 N-糖链前体生物合成途径最初两个步骤中的关键供体分子。随后,UDP-N-乙酰葡萄糖胺在糖链前体与目标蛋白结合后成为进一步酶修饰的底物。此外,在表观遗传水平上,它影响转录因子的结合活性,特别是 Bobby Sox 同源物(BBX)的活性,后者在发育过程和 Wnt 信号通路调控中起着关键作用。本分析中识别的显著富集通路与文献中先前通过候选基因关联研究调查的通路进行了比较 [37]。这些基因调控通路链接是从功能基因组和关联数据库中预测得出的。进一步的机制研究可以阐明 rs12886544 和 GNPNAT1 在子宫内膜异位症发病机制中的功能作用。

**讨论**
本研究首次在伊朗人群中进行了子宫内膜异位症的全基因组关联扫描,为这一代表性不足的祖先群体的疾病遗传结构提供了重要见解。我们的分析识别出一个候选的易感位点 rs12886544,它是 14 号染色体上 GNPNAT1 基因内的一个内含子变异,与子宫内膜异位症风险增加显著相关(OR = 1.66,p 值 = 5.89 × 10??)。除了是首次在伊朗人群中进行的子宫内膜异位症 GWAS 之外,我们的研究还评估了这一研究不足的祖先群体的遗传风险,其中等位基因频率和连锁结构的差异可能揭示了主要在欧洲和东亚队列中未能捕捉到的信号。这一发现得到了我们独立发现和验证队列间一致性的进一步支持(联合 p 值 = 0.001,OR = 1.59)。

为了进一步理解我们的发现,我们评估了先前报道的位点,发现六个变异(靠近 WNT4、FN1 和 VEZT 基因)达到了名义显著性,其效应方向与之前的大规模元分析结果一致(补充表 S2)。

我们强调了 GNPNAT1 在生殖生物学中的新兴作用,同时指出其分子机制仍有待澄清。伊朗人群和欧洲人群之间的等位基因频率差异以及现有 GWAS 中样本大小的差异可能是文献中报告的异质性结果的原因,这突显了研究不同祖先群体的价值 [38]。尽管 rs12886544 对子宫内膜异位症发病机制的功能影响尚未通过实验验证,但基因组注释加强了这一非编码变异在生殖障碍中的潜在作用。UK Biobank 数据表明,GNPNAT1 基因与一系列生殖道状况存在显著关联,包括宫颈的非炎症性疾病、与羊膜腔和膜相关的状况以及白血病。此外,Open Target 平台的实验数据表明,小鼠敲除研究表明 GNPNAT1 基因对多种发育表型至关重要,包括羊膜、尿囊和绒毛膜的缺失、胚胎外组织形态异常以及植入和体节形成之间的胚胎致死性,且具有完全的渗透率。

与这些发现一致,FinnGen 队列的数据证实了 GNPNAT1 与多种妇科疾病之间的关联,包括子宫内膜异位症(子宫内的异位症)、深部子宫内膜异位症、涉及输卵管的子宫内膜异位症、直肠阴道隔和阴道的子宫内膜异位症,以及女性不孕、疼痛综合征和其他与女性生殖器官和月经周期相关的疾病(补充表 S6)。因此,基因层面的证据表明 GNPNAT1 与生殖和代谢特征相关,强调了 GNPNAT1 在生殖和相关特征中的潜在作用。

我们利用京都基因与基因组百科全书(KEGG)和 Reactome 数据库确定了与子宫内膜异位症相关的关键生化通路。结果表明,GNPNAT1 基因参与了 UDP-N-乙酰葡萄糖胺的生物合成,这是 N-糖链前体生物合成途径的前两个步骤中的关键供体分子。随后,UDP-N-乙酰葡萄糖胺在糖链前体附着到目标蛋白后作为进一步酶修饰的底物。此外,在表观遗传水平上,它影响转录因子的结合活性,特别是 Bobby Sox 同源物(BBX)的活性,后者在发育过程和 Wnt 信号通路调控中起着关键作用。这项分析中识别的显著富集通路随后与文献中先前通过候选基因关联研究调查的通路进行了比较 [37]。这些基因调控通路链接是从功能基因组和关联数据库中预测得出的。进一步的机制研究可以阐明 rs12886544 和 GNPNAT1 在子宫内膜异位症发病机制中的功能作用。高尔基体中的正确N-糖基化确保了膜蛋白和分泌蛋白的正确成熟,而这一途径的缺陷会导致蛋白质错误折叠、内质网 stress(应激反应)、细胞表面蛋白质组改变,以及随后的细胞信号传导和命运决定过程紊乱[39,40,41]。根据rs12886544的基因组和调控注释,该变异可能通过调节GNPNAT1依赖的过程(如细胞粘附、迁移和信号转导)来影响子宫内膜细胞的行为[42]。我们强调,尽管GNPNAT1在糖基化途径中的生物学作用已得到充分证实,但尚未有直接的实验证据表明rs12886544与子宫内膜组织中GNPNAT1表达或功能的改变有关。此外,O-糖基化(一种由HBP代谢物介导的动态翻译后修饰)在肿瘤细胞中经常上调,促进增殖等机制。抑制HBP可导致肿瘤模型的生长停滞和凋亡。体外研究也表明,GNPNAT1敲低可减少乳腺癌细胞系的增殖和侵袭性[43, 44]。总体而言,这些数据表明GNPNAT1是一个生物学上可信的候选位点,它通过参与关键的糖基化介导的细胞过程来影响子宫内膜疾病的易感性[39, 43]。

最近的研究将UDP-GlcNAc与Wnt信号通路的调节联系起来。Neitzel等人证明,UDP-GlcNAc通过蛋白质糖基化调节Wnt通路活性,这种修饰对受体的正常功能和下游信号级联反应至关重要[45]。除了在Wnt信号通路中的作用外,UDP-GlcNAc还影响透明质酸-CD44相互作用和免疫调节,这些过程部分由白血病抑制因子(LIF)调控,而LIF是一种对子宫内膜接受性和胚胎着床至关重要的细胞因子。在不孕女性中观察到的LIF介导的信号通路紊乱会损害下游效应器,包括STAT3、MAPK和蛋白激酶C(PKC)通路,这些通路对囊胚粘附至关重要[46,47,48]。值得注意的是,STAT3表达在子宫内膜异位症和子宫内膜癌中均升高,这表明STAT3可能是这些疾病的潜在风险因素[49, 50]。

糖基化在子宫内膜功能中起着关键作用,位于GNPNAT1附近的FERM结构域包含Kindlin 2(FERMT2)基因调控高度糖基化蛋白(如MUC1)的糖基化,这些蛋白对于整合素介导的粘附和着床至关重要。同时,O-糖基化修饰在分泌期内支持子宫内膜细胞的增殖和侵袭,突显了糖基化依赖途径对子宫内膜接受性和生育能力的贡献[51]。FERMT2属于FERMT适配蛋白家族,在生殖组织(尤其是子宫内膜和子宫)中高表达,并已被证明可以促进妊娠期间的滋养层粘附和侵袭[52]。基于基因的关联分析显示,FERMT2和GNPNAT1具有可比的显著性水平并存在强相关性,这表明它们可能存在共同的调控关系,可能影响糖基化介导的粘附和着床机制,这些机制也可能影响子宫内膜疾病的易感性[53]。

我们的发现与先前的研究一致。根据PheWeb数据,我们的一些候选变异与生殖和代谢特征有关。rs8143037和rs401910(MICAL3基因的内含子变异)与月经不规律、输尿管解剖异常和痛经相关。rs706042(CHIC1基因的内含子变异)和rs6593654(相邻基因:RWDD3)与宫颈疾病、子宫切除术后阴道壁和阴道穹隆脱垂、绝经前月经过多和卵巢囊肿相关。rs12981001(相邻基因:IL4I1)与子宫内膜增生、月经紊乱、女性生殖道异常出血、月经周期不规律以及无月经或月经稀少相关。rs396717(MICAL3基因的内含子变异)也与子宫内膜增生相关。rs17058669(相邻基因:ZNF516)与绝经和前置胎盘相关。rs111741344(B3GALT1基因的内含子变异)和rs6593654(相邻基因:RWDD3)与卵巢囊肿相关。此外,rs35913552(相邻基因:APOB)和rs13011615(相邻基因:NCKAP1L)与异位妊娠相关。值得注意的是,rs706042(CHIC1)、rs35913552(APOB)和rs13011615(NCKAP1L)还与2型糖尿病、脂质代谢紊乱和高胆固醇血症相关,这些情况可能在子宫内膜疾病患者中更为普遍。这些基因的生物学功能,包括在肌动蛋白细胞骨架调节(MICAL3)、免疫调节(IL4I1、NCKAP1L)、脂质代谢(APOB)和蛋白质糖基化(B3GALT1)中的作用,可能为子宫内膜疾病的病理生理学提供机制见解[54]。

尽管历史上关于子宫内膜疾病的表观遗传因素的证据有限,但最近的体外和体内研究逐渐阐明了表观遗传因素在该疾病发生机制中的重要作用。HaploReg数据库的补充数据提供了支持,表明rs12886544参与表观遗传调节,特别是通过卵巢组织中的H3K4me1核苷酸修饰。该变异的风险等位基因可能影响转录因子的结合活性,尤其是BBX。BBX含有一个高移动性组(HMG)框结构域,该结构域在发育过程和Wnt信号通路调节中起关键作用[55]。有趣的是,研究发现Wnt信号通路参与所有类型的子宫内膜疾病,这一点通过单SNP分析和基于Wnt基因的通路关联研究得到了证实[12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57]。

Marquardt等人的最新研究表明,表观遗传失调,特别是H3K4me1等核苷酸修饰的失调,在改变基因表达方面起着关键作用,从而导致异位子宫内膜生长和不孕。子宫内膜间质细胞中H3K4me1的富集程度不同,调节参与增殖、侵袭和免疫反应的基因[58]。该增强子处H3K4me1的失调可能影响Wnt/β-连环蛋白或TGF-β通路等通路,这些通路已知会促进子宫内膜病变的形成并引发炎症[58]。此外,Timofeeva及其同事的实验数据表明,卵细胞中特定蛋白质及其对应RNA的缺失会影响植入前胚胎的发育。这些关键蛋白质包括转录因子BBX和锌指蛋白646,以及核苷酸修饰因子Ankyrin重复结构域12(ANKRD12)[59]。总体而言,这些发现强调了与该变异相关的表观遗传特征的重要性,表明它可能对子宫内膜疾病病理生理学的分子机制有显著影响。这需要进一步研究其对子宫内膜基因调控的功能影响。观察到的表观遗传修饰表明,它可能影响染色质的可及性、转录因子的招募以及子宫内膜组织内的基因表达调控[45]。

重要的是,我们注意到伊朗队列与欧洲血统参考人群(Ensembl)之间的等位基因频率存在显著差异,这表明不同祖先之间的遗传结构可能存在异质性。除了先前GWAS研究中的样本量差异(从171到17,045名参与者不等)[60]外,种族和遗传背景的差异也可能导致文献中报告的结果不一致[61]。因此,我们将rs12886544确定为与子宫内膜疾病相关的候选基因位点可能是由于这些潜在的种族特异性遗传变异和研究队列的多样化人口特征所致。例如,rs706042、rs12981001、rs251151、rs13011615、rs111741344和rs35913552等SNP在欧洲人群中的效应等位基因频率显著高于伊朗人群(分别为0.816、0.792、0.75、0.83、0.835和0.14、0.21、0.15、0.19、0.19、0.23、0.19)。相比之下,大多数与子宫内膜疾病相关的变异在伊朗和欧洲人群中的等位基因频率大致相当,rs868941587和rs17058669除外(见补充表1)。这两个变异在我们伊朗队列中的频率极低,这可能解释了为什么在以前以欧洲为中心的研究中未检测到这些信号,因为在那些研究中它们的效应可能被掩盖了。这一模式与先前的研究结果一致,即特定祖先的分析可以揭示不同的子宫内膜疾病遗传因素。例如,仅针对东亚血统个体的研究发现了几种与子宫内膜疾病相关的变异,而这些变异在主要基于欧洲人群的研究中未被发现,包括两项独立研究报道的五个SNP[9, 62]以及Wang等人发现的14个SNP[63]。相比之下,Sapkota等人[64]和Sobalska-Kwapis等人[64]的研究纳入了更多种族多样性的群体,报告了更广泛但非重叠的相关SNP集合,进一步强调了人群间的异质性。总体而言,这些观察结果强调了在解释遗传关联结果时考虑人群遗传结构和祖先背景的重要性。

本研究的主要优势在于其稳健的方法论框架,该框架的特点是采用大规模的基于人群的设计。这种方法通过最小化选择偏倚并确保样本代表性,增强了结果的普遍性和统计效能。此外,研究设计的全面性使得能够更准确地评估不同人口群体中的遗传关联,从而提高结果的可靠性和有效性。

必须承认我们研究的局限性。主要局限性在于缺乏通过腹腔镜对所有子宫内膜疾病病例的全面评估,而腹腔镜检查仍是该疾病的确诊标准。此外,我们的数据集缺乏足够的可靠性来精确判断子宫内膜疾病的严重程度。此外,如果超声检查结果未显示子宫内膜疾病的存在,即使是中度至重度痛经的个体也被排除在外。然而,由于阴性超声结果不能完全排除子宫内膜疾病,尤其是在表浅腹膜受累的情况下,我们的结果可能无法完全反映病情较轻的人群。此外,我们的样本量相对较小,与当代的GWAS研究相比,这可能限制了效应估计的精确度。基于风险等位基因频率为0.49、基因型相对风险为1.5、疾病患病率为20%以及标准的全基因组显著性阈值的假设进行的功率计算表明统计效能足够。然而,这些估计基于乐观的假设,应相应地进行解读。我们还意识到“赢者诅咒”的潜在影响,即初步发现分析中观察到的效应大小可能因统计选择偏倚而被夸大[65]。尽管这种偏倚影响各种人群的研究,但在我们的队列中识别出这一变异表明可能存在与祖先相关的异质性或该人群中真正的更大效应。尽管如此,需要在更大规模的同源人群中进行独立验证,以确认这一关联并获得无偏的效应大小估计。

这项研究的另一个关键局限性是缺乏独立的外部验证队列。由于目前缺乏中东或伊朗人群的大规模基因组数据集,我们无法在具有相同祖先特征的队列中验证我们的主要关联。确立这一位点需要在独立的数据集中进行验证,理想情况下应包括来自具有相关祖先特征的人群或如All of Us等大型多祖先生物库的样本。这种外部验证对于确认候选位点的稳健性、普遍性和真实生物学意义至关重要。

我们的研究仅关注位于常染色体上的遗传变异,因此忽略了X染色体的分析。后续研究如果结合性染色体数据,可能会提供更多有价值的见解。此外,我们的分析仅限于单个变异的关联检测,未包括基于单倍型的分析或GNPNAT1位点周围的连锁不平衡(LD)结构的跨人群比较。由于缺乏公开的伊朗LD参考面板,无法进行LD Score Regression(LDSC)分析;将欧洲LD参考面板应用于我们的队列会引入偏差,因为已知人群之间的LD结构存在差异。

总之,我们的GWAS研究识别出的rs12886544是一个可能由于这些祖先差异而产生的特定人群相关的候选位点。总之,我们的研究增加了(i)迄今为止最大的伊朗GWAS数据集,(ii)与已知位点的一致性证据(适度的内部验证),以及(iii)可以用于未来跨祖先荟萃分析和功能随访的特定人群等位基因频率。独立的复制队列和纳入荟萃分析将有助于验证这一关联,并阐明其在风险分层和治疗开发中的临床相关性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号