《Diabetes Research and Clinical Practice》:Sex specific genomic insights into type 1 diabetes through GWAS and single cell transcriptome analysis
编辑推荐:
本研究针对1型糖尿病(T1D)遗传风险存在性别差异但传统研究多将性别作为协变量处理的现状,开展了性别分层GWAS与PBMCs单细胞RNA测序,识别出215个具有性别异质性的全基因组显著SNP及41个具有细胞类型特异性差异表达的性别特异性T1D相关基因,并构建了性别特异性多基因风险评分(PRS)。验证结果表明,性别特异性PRS显著提升了男性和女性T1D风险预测的区分能力(男性AUC:0.668 vs 0.623;女性AUC:0.719 vs 0.635),为T1D的精准预测和性别特异性机制研究提供了新见解。
1型糖尿病(Type 1 diabetes, T1D)是一种慢性自身免疫性疾病,其主要特征是T细胞介导的、产生胰岛素的胰腺β细胞被破坏。该病在儿童和青少年时期发病率达到高峰,全球范围内每年约有15/100,000的儿童发病,且其患病率在过去几十年中持续上升。尽管最强的遗传风险因素位于HLA区域,但全基因组关联研究(Genome-wide association study, GWAS)已鉴定了许多非HLA位点,这些位点通过调节免疫、β细胞存活和细胞因子信号传导等多种通路来影响疾病易感性。流行病学数据提示,T1D存在性别差异:在高发病率人群(主要为欧洲裔)中,男性在儿童期发病队列中通常表现出稍高的发病率,而女性则可能经历更严重的疾病进程以及更高的继发性自身免疫并发症易感性。然而,传统的GWAS通常将男性和女性数据合并分析,这可能掩盖了性别特异性的遗传效应。因此,采取性别分层或性别交互作用的GWAS分析,有望揭示那些在男性和女性中贡献不同的遗传位点,从而改进风险预测并阐明不同的病因学通路。
本研究旨在通过大规模性别分层GWAS,并结合匹配的男、女儿童对的外周血单个核细胞(Peripheral blood mononuclear cells, PBMCs)的单细胞RNA测序(single-cell RNA sequencing, scRNA-seq),从遗传和转录组层面系统描绘T1D的性别特异性图谱,并利用性别特异性多基因风险评分(Polygenic risk score, PRS)提升风险预测的准确性。
主要研究方法
本研究采用了三种关键技术方法。首先,在18,949名欧洲血统个体(包括6,599例T1D患者和12,350名对照)中进行了大规模性别分层全基因组关联研究(GWAS),使用PLINK软件进行统计分析,并测试了加性模型和性别交互模型。其次,为了从机制上理解性别特异性遗传关联,研究对来自9对匹配的男、女儿童对的PBMCs样本进行了单细胞RNA测序(scRNA-seq),利用Seurat和Harmony等生物信息学工具进行数据处理、细胞分群(鉴定出15种细胞类型)和差异表达(Differential expression, DE)分析。最后,研究在一个独立的欧洲血统验证队列(471例患者,2,300名对照)中,评估了基于性别分层GWAS结果构建的男性特异性、女性特异性及标准(合并)PRS模型的预测性能,并通过受试者工作特征(ROC)曲线和DeLong检验进行了统计比较。
研究结果
3.1. GWAS位点
通过性别交互作用分析,在441个基因区域鉴定出2,126个与T1D关联的SNP。其中,有215个SNP在至少一种性别中达到了全基因组显著性水平(P < 5×10-8)。这些位点表现出明显的性别异质性:119个为男性特异性信号,94个为女性特异性信号。在HLA-B区域有两个完全连锁的SNP(rs2249932和rs2249934)在两种性别中都达到了全基因组显著性,但其保护性效应在男性中显著更强。
3.2. scRNA-seq结果
在PBMCs的15种细胞类型中,共鉴定出2,649个受性别影响的差异表达基因。富集分析显示,这些基因显著富集于多个重要的生物学通路,包括MYC靶标、氧化磷酸化、干扰素(IFN)-γ/α反应、TNF-α信号传导、PI3K/AKT/mTORC1信号传导等。值得注意的是,不同细胞类型拥有其独有的富集基因集:例如,单核细胞中富集了干扰素γ/α反应相关基因;幼稚B细胞中富集了mTORC1信号、未折叠蛋白反应(内质网应激)和蛋白质分泌相关基因;而CD8+T细胞中则富集了MYC靶标基因。此外,研究还发现74个位于X染色体的基因在女性中表达量更低,以及151个常染色体基因和2个线粒体基因在不同细胞类型中表现出双向的(即有的细胞类型中上调,有的下调)差异表达模式,其中涉及EB病毒(EBV)感染的基因被显著富集。
3.3. GWAS与scRNA-seq数据的整合
通过整合性别交互GWAS信号与单细胞转录组数据,发现了41个与T1D相关且在不同免疫细胞亚群中呈现性别特异性差异表达的基因。其中,有37个SNP在男性和女性中对T1D的关联呈现相反的方向。这些基因包括ABL2、DOCK5、FLNB、NEDD9、PIK3IP1等,它们在单核细胞、B细胞、NK细胞等特定免疫细胞亚群中表现出显著的性别偏向性表达。
3.4. 性别特异性PRS在独立队列中的验证
在独立验证队列中,性别特异性PRS模型相比标准(合并所有样本)PRS模型,显著提高了对T1D风险的预测区分度。在男性中,性别特异性PRS的AUC为0.668,而标准PRS的AUC为0.623。在女性中,提升更为明显,性别特异性PRS的AUC达到0.719,标准PRS的AUC为0.635。统计检验(DeLong‘s检验和Bootstrap检验)证实了这种提升具有高度显著性。
结论与讨论
本研究通过性别分层GWAS揭示了T1D中大量此前被掩盖的性别特异性遗传位点。这些位点与性别修饰的免疫细胞功能密切相关,例如,男性特异性信号涉及免疫/细胞因子介导的炎症信号、细胞间粘附和屏障完整性破坏、雄激素反应性长链非编码RNA以及线粒体质量控制受损等机制;而女性特异性信号则与雌激素增强的受体和生长因子信号、选择性剪接调控、长链非编码RNA和锌指蛋白调控轴以及细胞骨架重塑等相关。单细胞转录组分析进一步在免疫细胞亚群水平阐明了性别差异表达的复杂景观,揭示了干扰素反应、mTORC1信号、蛋白质分泌和MYC靶标等通路在特定细胞类型(如单核细胞、B细胞、CD8+T细胞)中的性别特异性调控。X染色体基因在女性中的低表达,以及常染色体基因在不同细胞类型中的双向差异表达,为理解性别如何塑造免疫反应和疾病易感性提供了新的分子机制视角。
最重要的是,将性别特异性遗传效应纳入PRS模型,在独立队列中显著提升了男性和女性的T1D风险预测准确性。这证明,在复杂疾病的遗传分析中考虑性别因素,能够捕获被传统合并分析所忽略的遗传结构层,从而为精准医学——即根据个体性别进行更准确的风险分层和预防策略制定——提供了强有力的证据。本研究以T1D为范例,展示了结合性别感知的遗传学分析与单细胞分辨率的转录组学,在揭示疾病机制和改善预测模型方面的巨大潜力,为未来在自身免疫性疾病及其他复杂疾病中开展性别特异性研究指明了方向。