《IEEE Aerospace and Electronic Systems Magazine》:Early Detection of Alzheimer’s Disease Using Vision Transformers on CWT-Transformed EEG Signals in Response to Olfactory Stimuli
编辑推荐:
本研究针对阿尔茨海默病(AD)早期诊断困难、传统方法成本高且有创等问题,开发了一种基于嗅觉刺激脑电图(EEG)信号的新型诊断框架。研究人员通过连续小波变换(CWT)将EEG信号转换为时频图像,并采用视觉Transformer(ViT)模型进行分析,在患者水平分类准确率达到91.43%,显著提升了AD早期诊断的准确性与实用性,为神经退行性疾病的非侵入性筛查提供了新思路。
随着全球人口老龄化加剧,阿尔茨海默病(Alzheimer's Disease, AD)已成为威胁老年人健康的重大公共卫生问题。这种进行性神经退行性疾病不仅严重影响患者的认知功能,还给家庭和社会带来沉重负担。目前临床上常用的诊断方法如磁共振成像(MRI)、正电子发射断层扫描(PET)和脑脊液(CSF)生物标志物检测等,虽然具有一定准确性,但存在成本高、耗时长、部分有创等局限性,限制了其在早期筛查中的广泛应用。
脑电图(EEG)作为一种非侵入性、成本低廉的脑功能监测技术,为AD早期检测提供了新途径。近年来研究发现,嗅觉功能障碍与AD早期病理变化存在显著相关性,这是由于嗅觉系统与AD易损脑区(如海马和皮层)有着直接连接。然而,传统EEG分析依赖专家经验,主观性强且效率低下,而深度学习方法的实际应用又受到数据集稀缺、模型泛化能力不足等挑战。
在这项发表于《IEEE Access》的研究中,由Azhar Hatem Jebur Albaidhani、Gorkem Serbes和Hamza Osman Ilhan组成的研究团队,创新性地将嗅觉刺激与先进深度学习技术相结合,开发了一种基于EEG信号的AD早期诊断新方法。研究团队通过系统比较多种时间频率分析技术和深度学习模型,最终确定连续小波变换(Continuous Wavelet Transform, CWT)与视觉Transformer(Vision Transformer, ViT)的组合方案在AD检测中具有最优性能。
研究方法的核心技术路线包括:首先,研究团队利用一个包含35名参与者(13名AD患者、7名轻度认知障碍(Mild Cognitive Impairment, MCI)患者和15名正常对照)的嗅觉EEG数据集,参与者接受柠檬和玫瑰两种气味的奇数球范式刺激。EEG信号经过预处理后,采用短时傅里叶变换(Short-Time Fourier Transform, STFT)和CWT两种方法将一维EEG信号转换为二维时频图像(分别为频谱图和尺度图)。随后,研究团队设计了五折受试者级别交叉验证方案,并系统评估了五种深度学习架构的性能:自定义卷积神经网络(Convolutional Neural Network, CNN)、迁移学习模型(VGG16和ResNet50)、CNN与CatBoost的混合模型以及ViT。
关键技术方法方面,研究采用4通道EEG记录(Fp1、Fz、Cz和Pz电极),采样率为200Hz。通过独立成分分析(Independent Component Analysis, ICA)去除眼电伪迹,信号滤波范围为0.5-40Hz。时频分析中,CWT采用Morlet母小波生成尺度图,STFT生成频谱图,所有图像统一调整为224×224像素。模型评估采用严格的患者级别五折交叉验证,确保同一患者的数据不会同时出现在训练集和测试集中。
研究结果显示,CWT变换在捕获EEG信号中AD相关特征方面显著优于STFT。在图像级别分类中,ViT模型在CWT尺度图上达到85.18%的最高准确率,而STFT频谱图的准确率仅为63.34%。自定义CNN、ResNet50、VGG16和CNN+CatBoost模型在CWT数据上的准确率分别为81.25%、80.69%、79.82%和81.66%,均显著高于其在STFT数据上的表现。
模型性能比较表明,ViT在患者级别聚合后表现尤为突出,准确率达到91.43%。通过多数投票策略在试验级别进行预测整合后,准确率进一步提升至88.8%。混淆矩阵分析显示,ViT模型能有效区分正常对照组与患者组,主要错误发生在AD与MCI的区分上,这与临床诊断挑战一致。
时频表示分析证实,CWT的多分辨率特性使其更适合处理非平稳的EEG信号,能更好地捕获AD相关的瞬态特征。相比之下,STFT的固定窗口限制了对快速变化脑电模式的捕捉能力,导致分类性能下降和交叉验证变异性增高。
讨论与结论部分指出,本研究首次将嗅觉刺激EEG、CWT时频分析和ViT深度学习架构相结合,为AD早期诊断提供了创新解决方案。该方法不仅实现了较高的分类准确率,还突出了嗅觉通路作为AD早期生物标志物的重要性。研究结果表明,基于CWT的时频表示能有效捕获AD相关的脑电特征,而ViT模型在利用这些特征进行分类方面展现出显著优势。
该研究的临床意义在于,提供了一种低成本、非侵入性的AD早期筛查工具,有望在社区医院和基层医疗机构推广应用。特别是对于资源有限的环境,这种基于EEG的方法比MRI或PET更具可行性。此外,研究中采用的受试者级别交叉验证和类别不平衡处理策略,增强了模型的泛化能力和临床适用性。
研究团队也指出了本研究的局限性,包括使用的四通道EEG montage限制了空间分辨率,单一气味对刺激可能无法全面反映嗅觉通路功能,以及需要在更大规模、多中心数据集上进行外部验证。未来工作将探索更高密度的EEG记录、更丰富的嗅觉刺激范式,并整合模型可解释性技术,以进一步提升诊断效能和临床转化价值。
这项研究为神经退行性疾病的早期检测开辟了新途径,展示了多模态数据融合与先进深度学习技术在医疗诊断中的巨大潜力。随着技术的不断完善和验证,这种基于嗅觉诱发EEG的分析方法有望成为AD早期筛查的重要工具,助力实现痴呆症的早发现、早干预。