编辑推荐:
本文提出并评估了一种结合连续小波变换(CWT)、变分模态分解(VMD)及像素级融合技术,从治疗前静息态脑电图(EEG)中生成时频图像,并利用预训练卷积神经网络(CNN)(包括ResNet-18、MobileNet-V3、EfficientNet-B0和TinyViT-Hybrid)构建计算机辅助决策(CAD)系统,用于预测患者对选择性5-羟色胺再摄取抑制剂(SSRI)和重复经颅磁刺激(rTMS)两种抑郁疗法的个体化反应。研究在严格的被试独立交叉验证下,分别达到了82.50% (SSRI)和83.53% (rTMS)的受试者水平预测准确率,揭示了时频表示的选择具有疗法特异性,其重要性不亚于模型架构的复杂度,为临床实现抑郁治疗方案的精准选择提供了高效、稳健的技术框架。
2. 材料
本研究使用了两个EEG数据集对所提出的CAD系统进行评估。
2.1. SSRI数据集
该数据集来自马来西亚国油大学,包含30名被诊断为抑郁症患者的五分钟治疗前静息态(闭眼)EEG记录。所有患者均接受了SSRI治疗。记录采用10-20国际电极放置系统,采样频率为256 Hz,包含19个通道。抑郁严重程度在为期六周的治疗前后通过贝克抑郁量表(BDI)进行评估。治疗后BDI评分降低超过50%的患者被标记为“有反应者”,改善≤50%的则被标记为“无反应者”。该数据集包含12名有反应者和18名无反应者的EEG记录。
2.2. rTMS数据集
该数据集收集自伊朗德黑兰Atieh医院,包含46名抑郁症患者的治疗前EEG记录。同样在闭眼静息态下记录了五分钟EEG信号,采用10-20国际电极系统,采样频率为500 Hz,19个通道。所有患者接受了为期六周的rTMS治疗,并依据BDI评分改善标准(>50% vs. ≤50%)划分为有反应者和无反应者,各23名。
3. 预处理
EEG信号首先经过0.5-70 Hz的带通滤波以保留生理节律,并使用50 Hz陷波滤波器抑制工频干扰。运动伪迹通过EEGLAB工具箱的伪影子空间重建(ASR)进行校正。所有滤波均采用零相位前向-反向滤波以防止相位失真。处理后的信号以平均参考(CAR)进行重参考。随后,将每位受试者的连续EEG数据分割为长度为15秒、无重叠的片段,以平衡频谱分辨率和统计稳健性。最后,使用多尺度主成分分析(MSPCA)对每个15秒的EEG片段进行去噪,该方法结合了小波分解和主成分分析(PCA),可有效去除多个时间尺度上的噪声。
4. 方法论
本研究提出的CAD系统工作流程主要包括五个阶段:预处理、图像生成、交叉验证、分类和性能评估。
4.1. 时频图像生成
为了从治疗前EEG信号中提取信息丰富的时频模式,本研究生成了三种类型的时频表示:基于连续小波变换(CWT)的图像、基于变分模态分解(VMD)的图像以及融合两者的表示。
- •
4.1.1. 连续小波变换(CWT):CWT通过将信号与母小波的缩放和平移版本相关联,提供信号的高分辨率时频分解,能够捕捉EEG信号的非线性和非平稳特性。本研究选取解析Morlet小波作为母小波,其时频能量分布(即尺度谱)由CWT系数的平方模获得。
- •
4.1.2. 变分模态分解(VMD):VMD是一种自适应信号分解技术,将输入信号分解为一组具有窄带特性的本征模态函数(IMF)。本研究从分解得到的IMF中计算希尔伯特谱,生成基于VMD的时频图像,其优势在于能稳定地提取振荡频率成分。
- •
4.1.3. 融合表示:除了单独分析CWT和VMD图像,本研究还构建了基于像素级的平均融合图像,旨在结合两种时频域的信息,以期获得更丰富的特征。
4.2. 预训练CNN架构与分类
研究评估了四种知名的预训练卷积神经网络架构:
- 1.
ResNet-18:一种轻量级的残差网络,通过跳跃连接促进了更深层的训练。
- 2.
MobileNet-V3:利用深度可分离卷积和注意力模块实现高效率。
- 3.
EfficientNet-B0:通过复合缩放平衡网络宽度、深度和分辨率以获得更佳性能。
- 4.
TinyViT-Hybrid:将残差卷积块与紧凑的视觉变换器(ViT)相结合,在低复杂度模型中同时捕捉局部和全局表征。
这些模型均在ImageNet数据集上预训练,并针对当前任务(将时频图像分类为“有反应者(R)”或“无反应者(NR)”)进行微调。评估采用图像独立和被试独立的6折交叉验证(CV)策略,以分别考察模型对图像和受试者个体的泛化能力。
5. 结果与讨论
5.1. 图像级分类性能
实验结果揭示出清晰的疗法特异性模式:对于SSRI疗效预测,基于CWT的表示具有最佳判别力,其中ResNet-18模型达到了99.43%的图像级准确率;而对于rTMS疗效预测,基于VMD的表示在统计上更优,ResNet-18达到98.77%的准确率。CWT和VMD的像素级融合并未在两种疗法中一致地提升超越最佳单个表示的性能。
5.2. 架构比较
成对Wilcoxon符号秩检验确认了一个两层的架构层次:ResNet-18和TinyViT-Hybrid在所有条件下均显著优于MobileNet-V3和EfficientNet-B0,而ResNet-18和TinyViT-Hybrid之间在统计上无显著差异。这表明结合设计良好的谱图像与简单的预训练残差网络,无需循环或注意力层即可实现有竞争力的性能。
5.3. 受试者级预测性能
在严格遵循临床实际、避免被试信息泄漏的被试独立交叉验证下,该框架在受试者水平上对SSRI和rTMS的预测准确率分别为82.50%和83.53%。这一结果证明了该CAD系统在实际临床应用中的潜在价值。
5.4. 通道特异性分析
对单个EEG通道的分析揭示了与已知神经生理机制一致的脑区特异性:在CWT表示下,SSRI预测主要依赖于枕叶通道;而在VMD表示下,rTMS预测则主要依赖于额颞叶通道。这进一步支持了不同抗抑郁疗法作用于不同大脑回路和神经振荡机制的假说。
6. 结论
本研究证明了利用治疗前EEG信号预测抑郁治疗个体反应的可行性。核心发现是:时频表示的选择是疗法特异性的,其重要性至少与模型架构的复杂度相当。具体而言,CWT更适合捕捉与SSRI反应相关的时频模式,而VMD则更擅长表征与rTMS反应相关的振荡活动。通过将精心设计的谱图像与简单的预训练残差网络(如ResNet-18)相结合,即可实现高性能的预测,而无需更复杂的循环或注意力机制。这些发现为开发稳健、高效的EEG-based CAD系统以支持临床医生为抑郁症患者选择最佳初始治疗方案奠定了重要基础。