利用生物信息学和机器学习方法识别并验证作为癫痫诊断生物标志物的关键基因

《Computational Biology and Chemistry》:Identification and validation of key genes as diagnostic biomarkers for epilepsy using bioinformatics and machine learning

【字体: 时间:2026年02月27日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  癫痫的分子机制与靶向治疗研究:基于生物信息学与机器学习,识别TYMP和HES4为关键诊断基因,发现其调控免疫微环境,并通过药物相互作用数据库筛选出Calpain抑制剂I作为潜在治疗药物,并在动物模型和细胞系中验证有效性。

  
吴露露|黄玉萍|杨慧|张晨宇|冯丹丹|周国平
南京医科大学第一附属医院儿科,中国南京广中路300号,210029

摘要

癫痫是一种常见的神经系统疾病,其分子发病机制复杂。大约三分之一的患者会出现药物难治性癫痫发作,这严重影响了他们的生活质量。本研究采用整合生物信息学和机器学习的方法来识别与癫痫相关的关键基因。首先利用GEO数据库中的癫痫相关数据集,通过差异表达分析和加权基因共表达网络分析(WGCNA)初步筛选出候选基因。随后通过机器学习算法(包括最小绝对收缩选择算法LASSO、随机森林RF和支持向量机SVM)对这些候选基因进行进一步筛选。TYMPHES4显示出显著的癫痫诊断价值(AUC分别为0.770和0.769)。功能富集分析表明它们参与了关键的信号通路,并与免疫细胞浸润密切相关,强调了它们在调节免疫微环境中的作用。通过RT-qPCR和Western blot在癫痫小鼠模型和癫痫细胞系中验证了TYMPHES4的显著上调。此外,通过对药物-基因相互作用数据库的筛查,发现Calpain抑制剂I是一种潜在的针对TYMP的治疗药物。总体而言,这些发现为癫痫的发病机制提供了新的见解,并为未来的研究和治疗开发指出了有希望的目标。

引言

根据世界卫生组织的数据(Thijs等人,2019年;Karabacak等人,2024年),癫痫是一种普遍的神经系统疾病,全球约有7000万人受到影响。大约50%的癫痫患者同时伴有心理健康问题或认知障碍,这显著降低了他们的生活质量(McDonald等人,2023年)。如果不及时治疗,癫痫导致的严重神经系统损伤风险会增加,进而引发认知并发症,如海马依赖的空间学习和记忆缺陷(Sen等人,2018年)。目前的治疗手段包括抗癫痫药物、生酮饮食、迷走神经刺激和癫痫手术,旨在控制疾病的发作和进展。不幸的是,仍有约三分之一的患者对治疗无反应,发展为药物难治性癫痫,其特征是多种类型的癫痫发作以及进行性的认知和发育衰退(Perucca等人,2020年;Asadi-Pooya等人,2023年;Kj?r等人,2023年)。最近的生物信息学分析为癫痫的研究带来了新的启示;然而,该疾病的精确机制和有效的诊断生物标志物仍不甚明了(Shi等人,2025年)。因此,进一步的研究对于早期诊断和及时干预癫痫至关重要,以改善患者预后并减少并发症。在癫痫研究中整合多种组学策略揭示了新的、以前未被发现的疾病机制。这一新兴方向为精准医学的发展提供了有希望的途径。
本研究旨在实现三个明确的目标:(1)识别新的、可靠的癫痫诊断生物标志物;(2)利用这些生物标志物构建一个简单且易于解释的诊断模型;(3)探索相关的免疫机制并筛选候选治疗化合物。本研究通过整合多种生物信息学方法(包括WGCNA、多种机器学习技术、人工神经网络和分子对接)对癫痫进行了全面的转录组分析,旨在探索与该疾病相关的分子机制,研究关键基因在发病机制中的作用,并通过药物富集分析识别出这些关键基因富集的药物。研究结果为潜在的治疗靶点和联合治疗策略提供了有价值的见解,最终为临床干预和个性化医疗奠定了理论基础。

数据来源

本研究分析的所有数据均来自GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)。我们获取了基因表达数据集GSE143272,并使用GPL10558作为其注释文件。该数据集包含142名患者的表达谱信息,其中51名被归类为对照组,91名为患者组(表1)。本研究的工作流程如图1所示。

差异表达基因的识别

从GEO数据库获取的数据集经过标准化处理。

识别癫痫的差异表达基因

我们对GSE143272进行了标准化处理,识别出癫痫组与对照组之间有64个差异表达基因(DEGs)(图2a)。

识别癫痫相关模块

使用WGCNA识别与癫痫相关的基因模块。图2b显示了癫痫样本的树状图和特征热图。软阈值幂β设为5(图2c)。动态树切割算法定义了六个基因模块(棕色、蓝色、 turquoise色和红色)(图2d)。如图3e所示,相关性分析...

讨论

癫痫是一种常见的慢性神经系统疾病,其全球发病率持续上升。在癫痫的管理方面,常用的治疗方法包括抗癫痫药物、生酮饮食、迷走神经刺激和手术干预;然而,仍有30%的癫痫发作无法得到控制(Schwartz等人,2019年;L?scher等人,2020年;Hollis和Lukens,2025年)。我们的研究通过综合分析识别并验证了与癫痫相关的关键基因...

伦理批准

南京医科大学动物实验伦理审查委员会批准了本研究的动物实验(IACUC-2503056)。

未引用的参考文献

(Sen等人,2018年)

资助

本研究得到了国家自然科学基金(81970579)和2025年国家临床重点专科建设项目(JSPH-ZKJS-2025-01)的支持。

CRediT作者贡献声明

周国平:撰写、审稿与编辑、监督。张晨宇:数据可视化、验证、正式分析。冯丹丹:数据可视化、验证。黄玉萍:撰写、审稿与编辑、监督、方法学、数据管理。杨慧:验证、监督。吴露露:初稿撰写、数据可视化、方法学、正式分析、数据管理、概念构建。

利益冲突声明

作者声明没有已知的财务利益或个人关系可能影响本文的研究结果。

致谢

我们衷心感谢刘炳旭先生在数据准备和数据分析方面的宝贵帮助。他的专业知识和细致入微的态度极大地提升了本文的质量。

参与同意

不适用。

出版同意

不适用。

知情同意

不适用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号