基于Transformer和纵向多模态数据的阿尔茨海默病早期诊断与预后深度生存预测模型研究

《IEEE Transactions on Big Data》:A Deep Survival Model for Predicting Alzheimer's Diagnosis Based on Multi-Modal Longitudinal Data

【字体: 时间:2026年02月22日 来源:IEEE Transactions on Big Data 5.7

编辑推荐:

  本研究利用纵向多模态数据构建了一个基于Transformer架构的生存预测模型LSM-AD,旨在解决阿尔茨海默病(AD)早期诊断与进展预测的难题。结果表明,整合更长病程历史和MRI生物标志物数据可显著提升预测性能(AUROC最高提升15%),并揭示了认知评估在跨期预测中的核心作用,为AD的临床监测和个性化干预提供了重要工具。

  
在全球人口老龄化的背景下,阿尔茨海默病(Alzheimer's Disease, AD)已成为一个日益严峻的全球公共卫生挑战,它不仅严重影响着数百万患者的生活质量,也给医疗保健系统带来了沉重负担。AD是一种进行性神经退行性疾病,其典型的临床轨迹是从认知正常(Cognitively Normal, CN)状态进展至轻度认知障碍(Mild Cognitive Impairment, MCI),并最终发展为AD。早期、准确地预测这一进展轨迹,对于及时进行临床干预、优化治疗规划、延缓疾病发展至关重要。然而,AD的病理过程漫长且复杂,其早期诊断和精准预后一直是个巨大的科学难题。
传统的疾病预测模型往往依赖单次就诊的“快照”数据,这如同只观察电影的一个静止画面,难以把握疾病发展的动态全貌。尽管近年来机器学习方法已被广泛探索,但如何高效利用患者随时间推移产生的海量、多源、且常常存在数据缺失的纵向医疗记录,从中捕捉细微但有预测价值的疾病进展模式,仍是一个关键挑战。此外,在真实的临床环境中,患者的随访可能不规律,某些检查(如磁共振成像MRI)可能在某些时间点缺失,这要求预测模型必须具备强大的鲁棒性。
为了解决这些难题,并深入探索纵向数据在AD预测中的价值,一项研究发表在《IEEE Transactions on Big Data》上。研究人员开发并验证了一个名为“LSM-AD”的深度生存预测模型,其核心在于利用Transformer编码器来处理患者的纵向多模态就诊数据序列,并结合加性生存模型来预测未来多年的疾病进展风险。这项研究不仅对模型的预测性能进行了全面评估,还系统性地分析了患者历史数据的时长、采集频率以及不同模态(特别是认知评估和MRI生物标志物)对预测结果的贡献,为理解AD进展的动态过程和优化临床数据采集策略提供了宝贵的洞见。
为开展这项研究,研究人员主要运用了以下关键技术方法:
  1. 1.
    数据来源与处理:研究数据来自阿尔茨海默病神经影像学倡议(ADNI)数据库。最终纳入了1404名基线时未被诊断为AD且有至少一次随访诊断的参与者。输入特征包括人口统计学、基因型(如APOE4等位基因数)、认知测试(如MMSE、CDR等)以及MRI体积测量和脑脊液(CSF)生物标志物。数据处理包括独热编码分类变量和对数值变量进行z-score归一化。
  2. 2.
    模型架构(LSM-AD):模型核心是一个基于Transformer的序列到分类神经网络。每个医疗访视被编码为一个输入词元,通过自注意力机制捕捉访视序列中的长短期依赖关系。模型前端采用Knockout层处理输入特征中的缺失值,通过为缺失特征分配分布外值来实现隐式边缘化。模型后端包含两个专门的生存预测头(分别用于CN-to-MCI和MCI-to-AD进展预测),采用加性风险层结构来估计未来每年的累积进展风险。
  3. 3.
    训练与评估策略:训练时通过随机丢弃部分历史访视进行数据增强,以提升模型对不同历史数据完整性的泛化能力。采用重加权交叉熵损失函数来解决随访期间标签不平衡的问题。评估时,采用一种特定的算法(Algorithm 2)通过生成多个伪测试集并计算平均AUROC来减轻纵向数据中的时间偏倚,确保评估的鲁棒性。模型性能通过接收者操作特征曲线下面积(AUROC)进行评估。
研究结果
1. 与现有模型的比较
在MCI向AD进展的第三年预测任务中,LSM-AD与现有模型进行了比较。当仅使用MRI生物标志物作为纵向特征时,LSM-AD的3年AUROC达到了81.33%,优于其前身模型LongForMAD(78.65%)。当结合认知评估和MRI时,两者性能都达到较高水平(LSM-AD为92.54%),可能触及了由AD诊断标签本身存在的噪音所导致的天花板效应。
2. 纵向MRI生物标志物的影响
分析显示,纳入更长的MRI历史数据通常能提升预测性能,但收益存在边际递减。对于CN向MCI的进展预测,将历史数据从2年延长至3年有时甚至会导致性能下降,这可能是因为早期数据噪声较大。而对于MCI向AD的进展预测,纳入3年历史数据则能带来持续的益处。此外,年度(相比双年度)采集MRI数据能带来更优的预测表现,尤其是在CN向MCI的预测中。
3. 纵向认知评估的影响
认知评估本身具有很高的预测价值,即使在没有任何历史数据(仅单次就诊)的情况下也能取得不错的预测效果。在认知评估的基础上加入MRI生物标志物可以进一步提升性能,但增加认知评估的历史数据长度所带来的额外性能增益相对有限。当同时使用认知评估和MRI生物标志物时,LSM-AD与其前身模型LongForMAD的性能非常接近。
4. 横断面模态重要性分析
通过特征重要性分析发现,在仅使用单次就诊数据进行预测时,认知评估(COGN)的贡献远高于MRI生物标志物。在CN向MCI进展的预测中,移除认知评估会导致AUROC显著下降(第2年下降超过15%),而移除MRI影响甚微。在MCI向AD进展的预测中,认知评估同样占据主导地位。这表明,基于单次评估,认知测试比结构性的MRI扫描更能直接反映功能性的认知衰退迹象。
进一步的沙普利值(Shapley values)分析量化了不同模态组的相对贡献。对于CN-to-MCI进展,认知特征贡献了近50%的重要性,MRI贡献小于20%。对于MCI-to-AD进展,认知特征的重要性随随访时间延长而稳步增加,到第5年超过65%,而MRI特征的影响始终有限。
结论与讨论
本项研究通过提出并系统评估LSM-AD模型,深入阐释了利用患者纵向多模态数据进行阿尔茨海默病预测的价值与潜力。研究得出的核心结论是:首先,整合更长的患者纵向病史数据能够带来比仅依赖单次就诊数据更优的预测性能,这凸显了历史背景信息对于提升预测准确性的重要性。其次,在仅使用MRI作为纵向特征时,LSM-AD模型通过引入Knockout层和加性生存预测头等架构创新,相较于前代模型LongForMAD取得了显著进步(AUROC提升最高达15%),证明了其在处理数据缺失和进行生存风险建模方面的优越性。
研究进一步揭示了不同数据模态的差异化贡献。横断面(单次就诊)分析表明,认知评估是预测性能的最主要驱动力,其重要性远高于MRI生物标志物。这很可能是因为认知功能的细微变化往往是疾病最早期的临床表现,先于大脑结构发生可被常规MRI检测到的显著萎缩。而纵向分析则显示,MRI生物标志物在提供补充信息方面具有价值,特别是当结合认知评估数据时,能够进一步提升模型的综合预测能力。此外,研究还指出,数据采集的频率(如年度 vs. 双年度)以及历史时长的选择(并非越长越好,存在最优窗口)都会影响预测效果,这为设计经济高效的临床监测方案提供了实证依据。
这项研究的意义在于,它不仅提供了一个强大的、能够处理现实世界中不规则且不完整医疗数据的预测工具,还通过详实的分析加深了我们对“何种数据在何时最为有用”的理解。模型对缺失数据的鲁棒性使其尤其适用于资源有限的临床环境。未来,该模型框架有望通过集成更先进的图像编码器、开发多类别有序生存模型或结合自适应历史选择机制,进一步优化对AD多阶段渐进过程的捕捉与预测能力,并推动基于影像数据的个性化监测与干预策略的发展。最终,这类研究将助力实现阿尔茨海默病的更早发现、更准预测和更优管理。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号