神经退行性疾病(NDs),如阿尔茨海默病(Alzheimer’s Disease, AD)、帕金森病(Parkinson’s Disease, PD)、亨廷顿病(Huntington’s Disease, HD)和肌萎缩侧索硬化症(Amyotrophic Lateral Sclerosis, ALS)等,是一种进行性且致残的疾病,会导致中枢神经系统中的选择性神经元死亡和异常蛋白质聚集(Bhavani et al., 2020; Wilson et al., 2023)。尽管经过数十年的研究,至今仍未发现有效的疾病修饰疗法,主要原因在于这些疾病的复杂性(Zaky et al., 2024; Khan et al., 2023)。由于患者通常在神经元受到严重且不可逆的损伤后才会出现临床症状,因此早期和精确的诊断仍然具有挑战性(Pathak et al. 2022)。这促使人们努力寻找能够检测疾病发作、追踪疾病进展并预测治疗反应的分子生物标志物,这也是神经退行性疾病研究的核心目标(Ali 2024)。
高通量组学技术(包括基因组学、转录组学、蛋白质组学和代谢组学)的最新发展为描述疾病在各个分子层面的复杂性提供了前所未有的大量生物数据(Ogunjobi et al., 2024; Dar et al., 2023)。这些数据集有助于揭示神经退行性的分子基础,但数据的整合和解释具有挑战性。传统的单组学研究常常产生不一致或不可重复的生物标志物结果,因为样本异质性、批次效应以及疾病的复杂性会影响研究结果(Perng and Aslibekyan 2020)。为了解决这些问题,结合系统生物学、生物信息学和网络分析的整合计算方法已成为多组学研究中识别有效且多维生物标志物的有效工具(Ali 2023)。
与此同时,结构生物信息学和分子建模的最新进展使得从数据驱动的生物标志物发现转向结构引导的验证成为可能(Yin, 2024; Dar et al., 2023)。对参与神经退行性疾病的蛋白质和大分子复合物(包括β-淀粉样蛋白、tau蛋白、α-突触核蛋白和TDP-43)的结构表征,为了解它们的致病构象和聚集机制提供了宝贵见解(Candelise et al. 2021)。此外,分子对接、分子动力学(MD)模拟和自由能计算使研究人员能够研究候选生物标志物蛋白的构象稳定性、结合相互作用和功能动态(Khan et al., 2025; Choudhury et al., 2025; Singh et al., 2025)。将组学水平的关联数据与分子层面的结构信息相结合,不仅可以通过统计显著性来优先筛选生物标志物,还可以根据生物学合理性和药物可行性进行评估(La Cognata et al. 2021)。
人工智能(AI)和机器学习(ML)在生物标志物发现流程中的应用将是该领域的另一项变革(Ali, 2022; Pal et al., 2025)。AI/ML方法能够处理异质性组学数据,揭示复杂的非线性模式,并提高疾病相关分子特征的预测准确性(Nuka et al., 2025; Chudzik et al., 2024)。结合结构建模工具(如AlphaFold2(Yang et al. 2023)和RoseTTAFold(Krishna et al. 2024),以AI为中心的平台可以将生物标志物发现提升到预测性结构生物学的水平,将基因型-表型特征与大分子活性联系起来(Wu and Xie 2025)。这些计算领域的整合,包括组学整合、网络药理学、机器学习和结构建模,代表了生物标志物发现、验证和临床应用方式的范式转变。这些整合框架有助于加深对疾病机制的理解,并通过将生物标志物特征与个性化治疗策略相结合来改进精准医学。
尽管在计算生物学、多组学整合和结构建模方面取得了显著进展,但现有的神经退行性疾病研究综述往往孤立地关注个别方法学领域,或仅提供描述性总结,缺乏充分的批判性综合。本文的主要目的是提供一个整合和分析性的框架,将计算基因组学、多组学分析、AI和结构生物学结合起来,以推进神经退行性疾病的生物标志物发现和机制理解。具体而言,本文区分了描述性目标(总结当前的计算和组学方法)和分析性目标(批判性地评估它们的转化潜力、方法学局限性和未来的临床应用性)。
图1展示了神经退行性疾病中生物标志物发现的整个计算和结构流程,并将其与分子层面的验证相结合。通过解决数据异质性、有限的生物标志物验证以及建模内在无序蛋白质的挑战,本文旨在提供一个前瞻性的视角,以支持更稳健且具有临床相关性的生物标志物开发。