《Artificial Intelligence in Medicine》:Multimodal biomarker AI techniques for early neurocognitive disorder diagnosis: A systematic review
编辑推荐:
阿尔茨海默病早期诊断中多模态AI优势及临床转化挑战。系统综述2010-2025年间27项研究,整合神经影像、血液标志物、认知测试等多模态数据提升诊断效能(AUC达0.85-0.95),但预后预测(AUC 0.75-0.85)和外部验证不足制约临床应用。
Feliciana Catino|Fabio Castellana|Roberta Zupo|Viviana Giannoccaro|Luisa Lampignano|Angelo Michele Petrosillo|Francesco Addabbo|Giancarlo Sborgia|Giuseppe Colacicco|Carlo Santoro|Giovanni Boero|Donato Impedovo|Yalin Zheng|Rodolfo Sardone
意大利塔兰托市城市健康中心-塔兰托地方卫生局
摘要
背景
阿尔茨海默病(AD)及相关痴呆症的早期诊断仍然具有挑战性,因为没有单一的生物标志物能够充分反映其复杂的多因素病理机制。近年来,能够整合多种数据源(如神经影像、液体生物标志物、遗传学和认知评估)的多模态人工智能(AI)模型已成为提高早期检测和风险分层的有前景策略。
方法
我们进行了基于PRISMA指南的系统性回顾(PROSPERO: CRD420251049848),涵盖了2010年至2025年期间发表的研究。我们纳入了27项经过同行评审的研究,这些研究应用AI/ML方法对至少两种生物标志物进行诊断分类或预后预测(例如,轻度认知障碍(MCI)向AD的转化),特别关注那些包含至少一种微创和/或广泛可应用的模态的研究(例如,认知测试、基于血液的生物标志物、APOE/遗传学、视网膜成像或常规临床特征)。使用QUADAS-2评估了偏倚风险。
结果
在纳入的27项研究中,多模态AI模型通常优于最佳的单模态基线模型,尤其是在结合互补的生物信息时(例如,将影像学与分子或临床特征结合)。诊断任务的区分度通常较高(内部验证下的AUC值在0.85–0.95范围内),而预后预测——尤其是MCI向AD的转化——则更具挑战性(最佳模型的AUC值通常在0.75–0.85之间)。然而,关于模型泛化能力的证据有限,因为外部验证较为少见,且QUADAS-2经常指出与过拟合风险和验证不完整相关的问题。
讨论
总体而言,多模态AI比单模态方法能更全面地反映AD/MCI相关的病理机制,并能在一定程度上改善早期诊断分类和预后预测。然而,将其应用于临床实践仍受到有限的外部验证和异质报告的制约,这影响了模型的泛化能力和临床信任度。未来的工作应优先考虑前瞻性多中心研究、稳健的外部验证以及透明的报告(包括可解释性分析),以支持其在实际中的应用。
引言
目前全球有超过5500万人患有痴呆症,预计随着人口老龄化,这一数字每20年将翻一番[1]。阿尔茨海默病(AD)是导致痴呆的主要原因(占病例的60–70%[2]),而AD的病理变化在出现明显症状前几年就开始了。这一临床前期阶段为早期检测和干预提供了关键窗口。在轻度认知障碍(MCI)等前驱阶段诊断神经认知障碍,可以及时调整生活方式或采用新兴疗法来延缓疾病进展。然而,早期诊断仍然具有挑战性:早期AD的认知症状较为微妙且多样,传统的临床评估往往缺乏区分早期AD与正常衰老或其他情况的敏感性和特异性。
近年来,人们越来越重视反映AD潜在神经病理学的生物标志物,例如AT(N)分类框架(淀粉样蛋白、tau蛋白、神经退行性标志物)。已建立的生物标志物包括神经影像学测量和脑脊液(CSF)检测,这些方法提供了AD病理的体内证据[2],[3]。例如,体积MRI可以显示脑萎缩的模式,氟脱氧葡萄糖PET可以检测大脑代谢降低,而淀粉样蛋白或tau蛋白PET示踪剂可以可视化病理性蛋白质聚集体[2],[4]。同样,CSF中的淀粉样蛋白-β和磷酸化tau蛋白水平可作为AD病理的生化确认[2],[4]。这些方法显著提高了诊断准确性,并被用于研究和专业诊所中,即使在MCI阶段也能识别AD[3],[5]。最近,一些侵入性较小的生物标志物(如基于血液的检测方法,例如血浆磷酸化tau蛋白、神经丝轻链)显示出作为筛查工具的潜力[4]。此外,基于视网膜血管和神经变化可能与AD中的脑神经退行性变相关的新兴技术(如视网膜成像)也在研究中[6]。同时,视网膜光学相干断层扫描(OCT)或其变体——光学相干断层扫描血管造影(OCTA)作为一种非侵入性生物标志物也得到了研究,有证据表明视网膜AD相关病理与OCTA相关[6],并且最近的研究使用OCTA结合血液生物标志物进行早期痴呆检测和多模态筛查[14],[26]。
每种生物标志物方法都捕捉疾病的不同方面。MRI评估结构性神经退行性变,PET揭示分子或功能性病理,CSF和血液生物标志物指示核心蛋白病理,遗传学提供终生风险信息,认知测试测量临床表现。视网膜OCT/OCTA作为一种非侵入性生物标志物,能够捕捉可能反映中枢AD相关过程的神经轴突和微血管改变[6],[26]。没有一种单一方法能够提供完整的疾病图谱。AD及相关痴呆症是由多种病理因素共同作用的结果——因此,整合多种生物标志物的多模态方法理论上可以更好地捕捉这种复杂性并提高诊断信心[7]。重要的是,多模态整合具有生物学依据:眼-脑之间的联系(包括视网膜淀粉样蛋白相关发现和神经血管共变)支持这样的假设:OCTA检测到的视网膜变化可能与MRI显示的神经退行性变相关,当在单一模型中融合这些信息时可以提供互补信号[6],[26]。在临床实践中,神经科医生已经考虑结合多种数据点(影像学、实验室检测、认知检查)来诊断痴呆;挑战在于如何最优地结合这些数据,尤其是在疾病早期变化较为微妙时。
AI和机器学习提供了从高维多模态数据中自动学习模式的强大工具,这些模式可能超出人类临床医生的识别能力[8],[9]。通过在大型数据集上训练,机器学习模型可以检测出与早期AD相关的多变量特征组合(例如,微妙的MRI萎缩 + 轻微的生物标志物升高 + 轻微的认知缺陷[8],[10]。从机制上看,当不同模态指标不同的但生物学上相关的路径(例如,神经退行性变、蛋白病变、血管功能障碍)时,这种结合可以利用互补且部分相关的信息来提高诊断区分度和预后风险分层,即使数据来源存在异质性[7],[11]。近年来,多模态生物标志物和AI在神经退行性疾病研究领域的交叉点上引起了越来越多的关注[11],[12]。早期的概念验证研究表明,结合MRI和CSF检测可以改善MCI向AD转化的预测能力,优于单独使用任一方法[3],[13]。后续研究纳入了更多类型的数据——从PET成像[7],[14]和基因组谱型[15]到基于视网膜OCT/OCTA的生物标志物,包括用于早期检测和多模态视网膜-血液筛查的AI模型[6],[14],[26]。值得注意的是,像阿尔茨海默病神经影像学倡议(ADNI)这样的大型联盟提供了推动这些发展的多模态数据集[8],[15]。特别是深度学习,通过自动从图像和其他数据中提取复杂特征,推动了最新进展(例如,卷积神经网络可以学习微妙的脑图像模式,而循环神经网络可以模拟认知衰退的纵向轨迹[14],[16]。人们乐观地认为,这样的模型可能在临床症状出现之前就检测到脑部变化,从而开启“临床前期”诊断的新时代[4],[6] [3] [13]。从转化医学的角度来看,这也支持了选择可扩展、负担较低的模态(例如OCT/OCTA和血液生物标志物,以及认知测试)的合理性,这些方法可以在减少对侵入性或高成本检测依赖的同时保持较高的准确性,使早期筛查在非专业中心也能实施[4],[14],[26]。
尽管取得了快速进展,但仍存在一些差距和不确定性。不同研究报道的成功程度各不相同,而且这些模型在控制研究环境之外的泛化能力尚不清楚。许多模型本质上是“黑箱”,可解释性有限,这引发了对其临床应用的担忧。此外,其在医疗保健中的实施需要标准化和监管批准,这取决于其在不同人群中的稳健表现。因此,有必要全面总结当前的证据,以评估该领域的现状。
本系统性回顾旨在通过批判性地评估2010年1月至2025年9月期间发表的所有相关研究来填补这一空白,这些研究应用AI对多模态生物标志物进行早期AD/MCI诊断或预后预测。除了量化多模态AI是否提高了预测性能外,该回顾还明确关注临床可行性:确定哪些侵入性较小、可扩展的筛查方法(例如OCT/OCTA和其他视网膜成像、基于血液的生物标志物、认知/临床数据、APOE/遗传学)在多模态模型中具有临床意义,与依赖高成本和/或侵入性检测(例如PET和通过腰椎穿刺获取的CSF)的工作流程相比。这一重点基于生物学和转化医学的假设:不同的模态捕捉了早期阿尔茨海默病病理的互补(和部分相关的)方面——例如,OCTA检测到的视网膜神经血管改变可能与MRI显示的脑神经退行性变共变——因此,临床可用的融合策略(视网膜 ± 血液 ± 认知,以及可用的视网膜-脑组合)可能比主要依赖PET/CSF确认的方法实现更早和更便捷的检测。在这个背景下,指导回顾的主要问题是:多模态AI在早期神经认知障碍诊断方面的创新程度如何?具体来说,该回顾考察了AI驱动的多模态系统是否优于单模态方法,并明确了哪些模态组合在筛查和风险分层方面最具临床相关性(即那些适合更广泛、负担较低的部署)。此外,回顾还总结了尝试的数据整合类型、使用的机器学习技术、模型的验证方法,以及研究结果对临床转化的意义,从而明确了多模态AI从概念验证发展到可扩展的早期检测途径所需解决的实用限制。
部分内容摘要
方案和注册
本回顾遵循系统评价和荟萃分析的优先报告项目(PRISMA)指南[17]进行。回顾方案详细说明了目标、纳入标准和方法,并提前在PROSPERO平台上注册(ID: CRD420251049848)。我们重点关注了过去十年(2010年1月至2025年9月)的AI技术和生物标志物发展情况。展示研究选择过程的PRISMA流程图如下
研究选择和特征
我们的搜索最初识别出1245条记录,去除重复项后,对78篇全文文章进行了详细评估;其中27项研究符合所有纳入标准并被纳入定性分析(表1)。总结研究选择的PRISMA[17]流程图如图1所示。在全文阶段最常见的排除原因是研究为单模态(例如,仅使用MRI的深度学习,没有其他模态)或未报告相关数据
主要发现和意义
在我们的更新回顾中的27项研究中,多模态AI模型在早期神经认知障碍诊断方面始终优于单模态方法。通过整合两种或更多类型的数据(例如神经影像、液体生物标志物、视网膜成像、认知测量),这些模型在识别早期阿尔茨海默病病理或预测疾病进展方面表现出更高的准确性和稳健性。例如,结合体内视网膜
作者披露
F. Catino构思了这项回顾并监督了整个项目。F. Catino和F. Castellana制定了搜索策略并进行了文献筛选。F. Castellana和R. Zupo提取数据并进行了质量评估。F. Catino起草了手稿。V. Giannocaro、L. Lampignano、G. Sborgia、G. Colacicco、A.M. Petrosillo、F. Addabbo、F. Panza、C. Santoro、G. Boero、D. Impedovo、Y. Zheng和R. Sardone参与了结果的解释和关键修订
CRediT作者贡献声明
Feliciana Catino:撰写——初稿、方法论、数据分析。Fabio Castellana:监督、软件开发、方法论、概念化。Viviana Giannoccaro:数据验证。Luisa Lampignano:数据验证、概念化。Angelo Michele Petrosillo:撰写——审阅与编辑、概念化。Francesco Addabbo:软件开发、方法论。Giancarlo Sborgia:研究调查。Giuseppe Colacicco:概念化。Carlo Santoro:可视化、验证、监督。
代码可用性
本研究没有创建任何自定义的计算机代码或专用软件。分析依赖于标准统计方法和数据汇总。任何用于计算或图表生成的脚本均可根据要求从相应作者处获得。
利益冲突声明
所有作者声明没有财务或非财务上的利益冲突。
致谢
作者感谢所有参与讨论并提供宝贵反馈的合作者和同事。我们还要感谢我们的机构以及在整个研究过程中提供支持的技术人员。