免疫介导的坏死性肌病的遗传基础:基于基因组结构方程建模和人工智能驱动的结构分析

《Computational Biology and Chemistry》:Genetic Basis of Immune-Mediated Necrotizing Myopathy: A Genomic Structural Equation Modeling and AI-Driven Structural Analysis

【字体: 时间:2026年02月28日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  免疫介导坏死性肌病(IMNM)遗传架构解析:采用基因组结构方程模型整合六项相关表型GWAS数据,识别128个显著遗传位点,结合AI驱动的蛋白质结构模拟与动态分析,揭示基因变异通过破坏蛋白结构稳定性及功能域平衡影响疾病表型的机制,建立首个多维度IMNM遗传框架。

  
林泽中|魏吉虎|何新宇|陈益欣|周洪海
广西中医药大学,中国广西南宁,530000

摘要

背景

免疫介导的坏死性肌病(IMNM)是一种由自身抗体引发的自身免疫性肌病,其特征是病情进展迅速且反复发作,目前尚无获批的根治性疗法。遗传因素是该病的重要病因;然而,全面的全基因组关联研究(GWAS)数据尚未阐明IMNM的遗传机制。

方法

我们采用基因组结构方程建模(Genomic SEM)技术进行了大规模多变量GWAS分析,探讨不同表型之间的共同遗传结构,以识别与疾病相关的单核苷酸多态性(SNPs)。随后进行了多项转录组关联分析,以确定与IMNM高度相关的潜在中介位点,这些位点涵盖了组织分层、细胞层次结构和基因组注释。接着利用人工智能建模结合蛋白质分子动力学模拟,解析这些位点如何调节蛋白质结构和功能动态。

结果

本研究通过多尺度方法整合了六种表型的GWAS数据,在Genomic SEM框架内系统分析了5,049,276个常见变异。通过FUMA进行功能注释和独立筛选,我们识别出128个具有统计学意义的候选位点。这些位点可能通过潜在因子效应影响IMNM的遗传风险。蛋白质建模和动力学模拟表明,突变会破坏蛋白质结构的稳定性,扰乱功能域的平衡,从而影响蛋白质的表达。

结论

本研究通过将GWAS应用于间接评估的表型,构建了一个全面的IMNM遗传框架,揭示了该病的遗传特征及其分子机制。

引言

免疫介导的坏死性肌病(IMNM)是一种新近被发现的罕见自身免疫性疾病,属于特发性炎症性肌病(IIMs)范畴。其主要特征包括进行性肌肉无力、存在肌炎特异性自身抗体(MSAs)、血清肌酸激酶(CK)显著升高以及肌纤维坏死伴轻微炎症浸润(Watanabe等人,2016年)。IMNM的病理生物学机制具有多维复杂性,涉及免疫调节微环境与肌细胞代谢之间的动态失衡,并与遗传易感性及环境因素(如他汀类药物暴露、病毒感染)密切相关,导致免疫抑制减量时病情反复发作。这些因素常伴随代谢紊乱和呼吸功能障碍(Lia等人,2022年;Merlonghi等人,2022年)。IMNM占所有IIMs的35%,是最严重且致残性最强的肌炎类型,常对一线免疫治疗产生耐药性,需要升级治疗方案才能获得最佳疗效(Merlonghi等人,2022年)。尽管诊断标准和治疗算法已有显著进展,越来越多的证据表明遗传因素在疾病易感性和严重程度中起作用(Rothwell等人,2016年;Matsubara等人,2018年),但由于IMNM属于罕见病,传统的直接GWAS方法难以系统地揭示其遗传机制。因此,需要新的策略来利用跨表型的遗传信息共享,提高统计功效,从而在样本量有限的情况下深入阐明IMNM的遗传机制。
多变量GWAS方法,如基因组结构方程建模(Genomic SEM),为分析不同表型间的多效遗传基础提供了有力工具。该方法利用遗传协方差结构构建潜在框架,量化表型间的共同遗传贡献,具有灵活的因子参数化、对人群分层的适应性以及严格的模型拟合指标(Grotzinger等人,2019年)。这种方法突破了单变量分析的局限,能够解析与已知生物标志物无关的遗传信号。它已成功应用于慢性疼痛综合征(Zorina-Lichtenwalter等人,2023年)和自闭症谱系障碍(Schaffer等人,2024年)等领域的跨诊断遗传结构分析。同时,人工智能(AI)的突破性进展(如AlphaFold3(Abramson等人,2024年)和ThermoMPNN(Dauparas等人,2022年)使深度学习在结构生物学、蛋白质折叠预测、基因组分析和治疗发现中不可或缺。AI驱动的算法还提升了遗传变异的功能注释、高保真蛋白质结构预测及突变影响预测能力,加速了精准医学和早期诊断的基因组数据挖掘。
在本研究中,我们使用Genomic SEM分析了与IMNM相关的表型和生物标志物的GWAS数据,通过构建多变量潜在因子模型并整合多种后续分析,识别出显著影响IMNM进展的遗传变异。结合AlphaFold3的结构预测、蛋白质动态模拟(PDS)和ThermoMPNN的热力学稳定性分析,全面解析了致病位点及其蛋白质产物的作用机制,为IMNM的多基因结构提供了新见解。

单变量GWAS数据来源

我们整合了六个公开可获取的IMNM相关表型的单变量GWAS数据集:炎症性肌病(IMM;n=495,718)、重症肌无力(MG;n=496,227)、肌痛(n=368,181)、出疹(n=403,515)、间质性肺病(ILD;n=500,348)和肌酸激酶(CK;n=16,742),构建了Genomic SEM框架(表1)。所有用于研究的单变量GWAS数据集均可通过开源仓库获取。相关研究方案均符合伦理规范。

结构方程建模的统计框架

LD-Score回归分析量化了六种肌病相关表型的遗传贡献(h2 Z统计量):炎症性肌病1.29、重症肌无力1.92、肌痛7.98、出疹2.1、间质性肺病2.63和肌酸激酶2.53。所有单变量分析均建立了稳健的遗传参数, pairwise遗传协方差显示了统计完整性(补充表2)。
我们的结构方程建模取得了优异结果

讨论

本研究结合了基因组结构方程建模(Genomic SEM)、FUMA、AlphaFold3、蛋白质动力学模拟和ThermoMPNN,揭示了炎症性肌病、重症肌无力、肌痛、出疹、间质性肺病和肌酸激酶异常的共通遗传基础和分子机制。与传统GWAS分析不同,本研究不仅限于识别风险位点,还试图提供更深入的见解。

结论

本研究深化了对IMNM遗传机制的理解。通过将基因组结构方程建模与AlphaFold3预测、蛋白质动力学模拟和ThermoMPNN模型相结合,我们识别出多个新的风险位点,并对这些变异进行了功能验证。这些遗传风险因子(尤其是CKM/LILRB5)使个体更容易受到环境因素(如他汀类药物使用)的影响,形成了疾病发生的“双击”模型。

缩写说明

IMNM免疫介导的坏死性肌病
GWAS全基因组关联研究
Genomic SEM基因组结构方程建模
IIMs特发性炎症性肌病
CK肌酸激酶
MHC主要组织相容性复合体
LD连锁不平衡
FUMA功能映射与注释
MAGMA基因组微注释的多标记分析
CELLECT复杂表型的细胞类型特异性整合
CFI比较拟合指数
SRMR标准化均方根残差
RMSD均方根偏差
RMSF均值

伦理审批与参与同意

不适用。分析所用数据来自已发表的研究和公共数据库。

资助

本研究得到了国家自然科学基金(82460939)和广西中青年教师基础能力提升项目(2025KY0387)的支持。

作者贡献声明

陈益欣:数据可视化、验证、研究、数据管理。何新宇:数据可视化、验证、研究、数据管理。魏吉虎:撰写初稿、软件开发、方法设计、资金申请、数据分析、概念构建。林泽中:撰写初稿、软件开发、方法设计、数据分析、概念构建。周洪海:审稿与编辑、项目管理、资金申请、概念构建。

利益冲突声明

我没有任何需要声明的利益冲突。

致谢

我们衷心感谢所有提供开放获取GWAS汇总统计的数据合作机构和数据库,这些数据为本研究提供了重要支持。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号