痴呆症(Arvanitakis, Shah, & Bennett, 2019)是一种以广泛认知衰退为特征的后天性脑功能障碍综合征。其病因通常源于神经元损伤或神经退行性疾病,这些疾病会严重损害患者的日常活动和社会功能。最常见的痴呆症类型包括阿尔茨海默病(AD)、额颞叶痴呆(FTD)和行为变异型额颞叶痴呆(bvFTD)。这些形式的痴呆症各具独特的病因和病理变化,导致受影响的大脑区域存在显著差异。鉴于痴呆症类型的多样性,精确识别对于制定个性化治疗计划和优化临床结果至关重要。
目前,AD的诊断主要依赖于脑脊液(CSF)分析、功能性磁共振成像(MRI)(Leng et al., 2025)和脑电图(EEG)(Devi & Latha, 2025)。通过腰椎穿刺收集CSF可能会引发感染等并发症。MRI设备成本高昂且维护复杂,通常仅限于大型医院或研究机构使用。相比之下,EEG信号(Wang, Huang, Li, Yan, & Zhang, 2024)是非侵入性的、便携的且经济实惠,使其成为临床筛查的宝贵工具。
然而,基于EEG的临床诊断仍面临几个关键挑战,包括跨受试者的泛化能力差、EEG数据集中的数据量有限以及特征提取能力不足。在一些研究中(Shen, Liu, Hu, Zhang, & Song, 2022),使用对比学习通过对齐同一受试者的样本来减轻受试者间的变异性,并取得了积极的结果。然而,传统的对比学习方法往往依赖于简单的配对构建策略,这可能无法捕捉EEG数据的复杂高维结构,在挖掘有价值的信息样本方面效率较低。在图像识别领域,动态三元组对比学习(Zeng, 2025)根据嵌入空间中的欧几里得距离动态选择每个小批次中最难处理的样本,从而进一步提高了性能。这为改进跨受试者EEG信号分析算法的设计提供了新的且有前景的方向。
另一个挑战是EEG数据集通常规模较小,导致深度学习模型容易过拟合。通过数据增强增加训练数据的变异性可以在一定程度上缓解这一问题。一些研究采用了添加噪声(Lashgari, Liang, & Maoz, 2020)或通过掩码进行数据增强(He, Liu, Zhu, & Du, 2021)等方法。然而,哪种增强策略能够最有效地引入现实的、临床预期的扰动,并从而实现最佳的痴呆症诊断性能,仍然是一个未解决的研究问题。
关于特征提取,EEG数据本质上包含了空间、时间和频率域的区分性信息,这些信息对于痴呆症诊断等任务具有指示性(Yagmur, Cura, & Akan, 2023)。然而,许多传统方法要么单独处理这些域,要么依赖于手工制作的特征提取方法,未能充分捕捉它们之间的复杂相互依赖性。因此,一些最近的EEG分析方法将显式特征提取技术(如短时傅里叶变换(STFT)与深度学习网络相结合(Shayeste & Asl, 2023)。然而,它们的诊断性能在很大程度上取决于网络架构,构建有效的特征提取网络是提高痴呆症诊断准确性和可靠性的关键瓶颈。
为了解决这些挑战,本研究提出了一种结合对比学习和数据增强的时空频率变换器(STFFT),用于痴呆症诊断中的鲁棒EEG信号分析(DDformer)。该模型使用时空频率编码器和变换器从经过STFT处理的EEG信号中提取和压缩多域的时间、频率和空间特征,并进一步结合动态三元组对比学习和数据增强来减轻跨受试者的泛化问题。本工作的关键贡献包括:
1.我们提出了一种新的监督对比学习策略,结合了动态三元组和数据增强,用于跨受试者的EEG分析。这种方法特别减轻了高受试者间变异性的影响,显著提高了模型提取鲁棒、跨受试者不变表示的能力。
2.我们提出了DDformer架构,其中包含一个时空频率融合变换器(STFFT)模块,用于鲁棒的EEG信号编码。STFFT模块结合了时空频率编码器和变换器,从STFT处理的EEG信号的时间、频谱和空间域中提取和融合互补特征。它与我们的对比学习策略结合,形成了DDformer架构,能够提取复杂的神经活动模式的丰富、鲁棒表示。
3.我们证明了DDformer架构在具有挑战性的跨受试者痴呆症诊断任务中的优越有效性。我们的模型在多个公共数据集上的表现优于现有方法,为早期痴呆症筛查和鉴别诊断提供了一个可靠且客观的评估工具。