综述:下一代神经退行性疾病生物标志物的计算策略:多组学整合、人工智能与分子建模

《Computational Biology and Chemistry》:Next-Generation Computational Strategies for Neurodegenerative Biomarkers: Multi-Omics Integration, AI, and Molecular Modeling

【字体: 时间:2026年02月22日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  神经退行性疾病(NDs)的复杂分子机制可通过整合多组学数据、结构生物信息学与AI模型实现突破,传统单组学方法存在局限性。本文系统综述多组学(基因组、转录组、蛋白组、代谢组)与结构建模(同源建模、分子对接、动态模拟)结合的机制性生物标志物发现策略,强调机器学习在解析高维异质数据中的优势,并分析其临床转化挑战。

  
作者:Pravej Alam、Gulam Mustafa Hasan、Taj Mohammad、Md. Imtaiyaz Hassan
沙特阿拉伯阿尔卡赫杰(Alkharj)11942,萨塔姆·本·阿卜杜勒阿齐兹大学(Prince Sattam Bin Abdulaziz University)科学与人文学院生物系

摘要

神经退行性疾病(Neurodegenerative Diseases, NDs)是一种逐渐加重的疾病,其发病机制由复杂的分子紊乱和选择性神经元丢失驱动。传统的生物标志物发现方法,如单组学分析或经验性筛选,往往无法捕捉到这些疾病的多元因素。如今,可以通过整合大规模组学数据与结构和分子建模方法,利用整合计算生物学揭示具有机制相关性的生物标志物。本文综述了最新的整合计算策略进展,这些策略结合了基因组学、转录组学、蛋白质组学和代谢组学,并与结构生物信息学及分子建模相结合,以识别具有机制信息的生物标志物。我们涵盖了系统级和基于网络的整合方法、机器学习(Machine Learning, ML)和人工智能(Artificial Intelligence, AI)框架,以及基于同源性/AI的建模、分子对接和分子动力学(Molecular Dynamics)等验证方法。同时,通过蛋白质结构建模来验证基于组学的预测结果,以确定关键的生物标志物和治疗靶点。最后,我们讨论了主要挑战,如数据异质性、可重复性以及结构建模的局限性,以及新兴趋势,如人工智能驱动的多组学研究、单细胞空间分析(single-cell spatial profiling)和数字孪生模拟(digital twin simulations)。总体而言,这些整合计算策略有望加速可靠、具有机制信息性且可临床转化的生物标志物的发现,从而推动神经退行性疾病的精准医学发展。

引言

神经退行性疾病(NDs),如阿尔茨海默病(Alzheimer’s Disease, AD)、帕金森病(Parkinson’s Disease, PD)、亨廷顿病(Huntington’s Disease, HD)和肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis, ALS)等,是一种进行性且致残的疾病,会导致中枢神经系统中的选择性神经元死亡和异常蛋白质聚集(Bhavani et al., 2020; Wilson et al., 2023)。尽管经过数十年的研究,至今仍未发现有效的疾病修饰疗法,主要原因在于这些疾病的复杂性(Zaky et al., 2024; Khan et al., 2023)。由于患者通常在神经元受到严重且不可逆的损伤后才会出现临床症状,因此早期和精确的诊断仍然具有挑战性(Pathak et al. 2022)。这促使人们努力寻找能够检测疾病发作、追踪疾病进展并预测治疗反应的分子生物标志物,这也是神经退行性疾病研究的核心目标(Ali 2024)。
高通量组学技术(包括基因组学、转录组学、蛋白质组学和代谢组学)的最新发展为描述疾病在各个分子层面的复杂性提供了前所未有的大量生物数据(Ogunjobi et al., 2024; Dar et al., 2023)。这些数据集有助于揭示神经退行性的分子基础,但数据的整合和解释具有挑战性。传统的单组学研究常常产生不一致或不可重复的生物标志物结果,因为样本异质性、批次效应以及疾病的复杂性会影响研究结果(Perng and Aslibekyan 2020)。为了解决这些问题,结合系统生物学、生物信息学和网络分析的整合计算方法已成为多组学研究中识别有效且多维生物标志物的有效工具(Ali 2023)。
与此同时,结构生物信息学和分子建模的最新进展使得从数据驱动的生物标志物发现转向结构引导的验证成为可能(Yin, 2024; Dar et al., 2023)。对参与神经退行性疾病的蛋白质和大分子复合物(包括β-淀粉样蛋白、tau蛋白、α-突触核蛋白和TDP-43)的结构表征,为了解它们的致病构象和聚集机制提供了宝贵见解(Candelise et al. 2021)。此外,分子对接、分子动力学(MD)模拟和自由能计算使研究人员能够研究候选生物标志物蛋白的构象稳定性、结合相互作用和功能动态(Khan et al., 2025; Choudhury et al., 2025; Singh et al., 2025)。将组学水平的关联数据与分子层面的结构信息相结合,不仅可以通过统计显著性来优先筛选生物标志物,还可以根据生物学合理性和药物可行性进行评估(La Cognata et al. 2021)。
人工智能(AI)和机器学习(ML)在生物标志物发现流程中的应用将是该领域的另一项变革(Ali, 2022; Pal et al., 2025)。AI/ML方法能够处理异质性组学数据,揭示复杂的非线性模式,并提高疾病相关分子特征的预测准确性(Nuka et al., 2025; Chudzik et al., 2024)。结合结构建模工具(如AlphaFold2(Yang et al. 2023)和RoseTTAFold(Krishna et al. 2024),以AI为中心的平台可以将生物标志物发现提升到预测性结构生物学的水平,将基因型-表型特征与大分子活性联系起来(Wu and Xie 2025)。这些计算领域的整合,包括组学整合、网络药理学、机器学习和结构建模,代表了生物标志物发现、验证和临床应用方式的范式转变。这些整合框架有助于加深对疾病机制的理解,并通过将生物标志物特征与个性化治疗策略相结合来改进精准医学。
尽管在计算生物学、多组学整合和结构建模方面取得了显著进展,但现有的神经退行性疾病研究综述往往孤立地关注个别方法学领域,或仅提供描述性总结,缺乏充分的批判性综合。本文的主要目的是提供一个整合和分析性的框架,将计算基因组学、多组学分析、AI和结构生物学结合起来,以推进神经退行性疾病的生物标志物发现和机制理解。具体而言,本文区分了描述性目标(总结当前的计算和组学方法)和分析性目标(批判性地评估它们的转化潜力、方法学局限性和未来的临床应用性)。
图1展示了神经退行性疾病中生物标志物发现的整个计算和结构流程,并将其与分子层面的验证相结合。通过解决数据异质性、有限的生物标志物验证以及建模内在无序蛋白质的挑战,本文旨在提供一个前瞻性的视角,以支持更稳健且具有临床相关性的生物标志物开发。

方法

本文采用叙述性综述框架,结合系统元素以提高透明度和可重复性。通过使用与神经退行性疾病、生物标志物、多组学、计算生物学和结构建模相关的关键词,在PubMed、Web of Science、Scopus和Google Scholar中进行了针对性搜索,筛选出相关文献。选择的研究基于其在生物标志物发现方面的相关性和方法学的严谨性。

神经退行性疾病研究中的组学方法

高通量组学技术彻底改变了我们对神经退行性疾病分子复杂性的认识(Cardillo et al., 2025; Liu and Song, 2025)。各种组学方法分别测量疾病生物学的不同方面,当结合起来时,可以为生物标志物发现提供多维视角。本节重点介绍了当前神经退行性疾病研究中使用的关键组学方法、它们的工作流程、在分析方法上的优势以及整合应用的潜力。

生物标志物识别的计算框架

神经退行性疾病研究中多组学数据的快速增长需要强大的计算方法来生成生物学上相关的信息(Cardillo et al. 2025)。生物标志物的发现已经从简单的差异分析发展到整合性的系统级建模,这种建模将分子相互作用、生物途径和临床结果联系起来(Wu and Xie 2025)。用于生物标志物发现的计算模型大致可以分为基于网络的模型和基于途径的模型。

结构生物信息学和分子层面的验证

虽然基于组学和计算网络的方法在识别候选生物标志物方面有效,但结构生物信息学提供了分子特征与其机制作用之间的必要桥梁(Zaji et al. 2023)。结构分析提供了关于生物标志物蛋白在病理突变或配体作用下的折叠、相互作用和响应的原子级信息(Amir et al. 2019)。在神经退行性疾病研究中,结构生物信息学尤为重要。

神经退行性疾病的案例研究

整合计算方法主要被用于发现主要神经退行性疾病的分子生物标志物和治疗靶点(La Cognata et al., 2021; Srivastava et al., 2024)。这些研究通过整合多组学分析、网络建模和结构验证,阐明了神经元功能障碍的共性机制,为新的诊断方法和治疗策略提供了可能(Clark et al., 2021; Kim et al., 2024)。本节展示了代表性的案例研究。

挑战、新兴趋势和未来方向

尽管在结合计算生物学和结构生物学发现生物标志物方面取得了显著进展,但这些方法在转化潜力方面仍存在许多局限性(Dar et al., 2023; Cardillo et al., 2025)。神经退行性疾病极其复杂,不仅在基因上而且在表型上也具有多因素特性(Khan et al., 2023)。发现可重复且临床有效的生物标志物仍是一项持续的科学研究任务。

结论与展望

神经退行性疾病由于其多因素病因和重叠的病理特征,构成了重大的生物医学挑战。在过去十年中,整合计算生物学通过将多组学数据与结构和系统级模型相结合,提高了我们对疾病机制的理解。多组学方法使得发现失调的基因、蛋白质、代谢物和信号网络成为可能。在蛋白质结构预测、分子对接和分子动力学方面的进展也为研究提供了新的方向。
未引用的参考文献
(Abdullayev, 2025, 2023; Kanehisa and Goto., 2000)
资助
作者感谢萨塔姆·本·阿卜杜勒阿齐兹大学通过项目编号(PSAU/2025/01/39110)资助了这项研究工作。
CRediT作者贡献声明
Md. Imtaiyaz Hassan:撰写与编辑、可视化、监督、软件开发、项目管理、正式分析、数据管理、概念构思。 Gulam Mustafa Hasan:资源获取、项目管理、方法论设计、研究实施、正式分析。 Taj Mohammad:撰写初稿、可视化、验证、资源管理、方法论设计、正式分析、数据管理。 Pravej Alam:撰写初稿、项目管理、方法论设计、研究实施、资金筹集。
利益冲突声明
作者声明他们没有已知的利益冲突或个人关系可能影响本文的研究结果。
致谢
PA感谢萨塔姆·本·阿卜杜勒阿齐兹大学通过项目编号(PSAU/2025/01/39110)资助了这项研究工作。
利益冲突
不存在需要声明的利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号