《Scientific Reports》:Multi-scale EEG feature decoding with Swin Transformers for subject independent motor imagery BCIs
编辑推荐:
本研究针对脑机接口(BCI)中因脑电信号(EEG)的跨被试变异性和非平稳性导致的模型泛化能力差的问题,提出了一种紧凑卷积Swin Transformer(CCST)架构。该模型通过卷积特征提取和分层窗口自注意力机制,有效捕捉局部电极交互和全局时间依赖性,在BCI Competition IV(2a, 2b)和PhysioNet MI数据集上采用留一被试交叉验证(LOSO)分别达到68.27%、76.61%和71.70%的分类准确率,显著提升了跨被试泛化能力,为神经康复和辅助技术提供了高效解决方案。
在人机交互领域,脑机接口(BCI)技术为实现大脑与外部设备的直接通信提供了革命性途径。其中,基于运动想象(Motor Imagery, MI)的BCI系统在辅助技术和神经康复领域扮演着关键角色。然而,脑电信号(Electroencephalography, EEG)固有的跨被试变异性和非平稳特性,使得开发能够泛化到新用户的BCI系统面临严峻挑战。传统的深度学习模型往往需要针对每个用户进行单独校准,这严重限制了BCI技术在真实场景中的应用价值。
针对这一瓶颈问题,来自纳扎尔巴耶夫大学的研究团队在《Scientific Reports》上发表了一项创新性研究,提出了一种名为紧凑卷积Swin Transformer(Compact Convolutional Swin Transformer, CCST)的新型混合架构。该研究旨在解决当前EEG解码模型中局部特征提取与全局依赖性建模之间的平衡问题,同时提升计算效率,为开发真正实用的跨被试BCI系统开辟了新途径。
研究人员采用了几项关键技术方法:首先,通过卷积层进行局部时空特征提取,包括时间卷积(核大小1×25)和空间卷积(核大小C×1);其次,利用Swin Transformer的分层窗口自注意力机制捕捉长程时间依赖性;第三,采用留一被试交叉验证(Leave-One-Subject-Out, LOSO)严格评估模型泛化性能;最后,在三个标准数据集(BCI Competition IV 2a、2b和PhysioNet MI)上进行全面评估,确保结果的可比性和可靠性。
模型架构设计
CCST模型的核心创新在于巧妙融合了卷积神经网络(CNN)的局部特征提取能力和Swin Transformer的全局建模优势。模型包含四个关键阶段:块嵌入(Patch Embedding)将原始EEG信号转换为紧凑的令牌表示;位置嵌入(Positional Embedding)通过可学习参数编码时序信息;多个Swin Transformer块通过窗口自注意力和循环移位机制实现分层特征学习;分类头(Classification Head)通过全局平均池化和全连接层输出最终预测。这种设计使CCST能够在降低计算复杂度的同时,有效捕获EEG信号中的多尺度时空模式。
跨数据集性能评估
在BCI Competition IV 2a数据集上的实验结果显示,CCST在未使用数据增强(Data Augmentation, DA)的情况下达到了68.27%的平均分类准确率,显著优于EEGNet(46.60%)、EEGConformer(43.00%)等基准模型。特别值得注意的是,CCST在Subject 8和Subject 9上分别取得了91.49%和89.58%的极高准确率,证明了其对不同被试EEG模式的高度适应性。
在BCI Competition IV 2b数据集的测试中,CCST同样表现优异,平均准确率达到76.61%。模型在Subject 4、Subject 5和Subject 9上的性能尤为突出,准确率均超过86%,这表明CCST在处理不同电极配置(该数据集仅使用3个EEG电极)时仍保持稳定性能。
最令人印象深刻的结果来自大规模PhysioNet MI数据集的评估,该数据集包含109名被试,更能反映真实场景下的被试变异性。CCST在此数据集上取得了71.70%的平均准确率,而其他基准模型的性能大多在50%左右徘徊,这充分证明了CCST在跨被试泛化方面的显著优势。
计算效率分析
除了性能提升外,CCST在计算效率方面也展现出明显优势。与使用全局自注意力的传统Transformer模型相比,CCST采用的窗口自注意力机制将计算复杂度从O(L2)降低到O(L×W),其中L为序列长度,W为窗口大小(本研究设置为4)。具体而言,CCST的浮点运算数(FLOPs)为18.94 MMac,参数数量为150.96k,推理时间为0.002407秒,在保持高性能的同时满足了实时BCI应用的低延迟需求。
统计显著性验证
通过Wilcoxon符号秩检验和Bonferroni校正进行的统计分析表明,CCST在BCI IV 2a和PhysioNet MI数据集上的性能改进具有统计显著性(p<0.005)。虽然在BCI IV 2b数据集上部分对比未达到显著性阈值,但CCST仍然在多数被试上保持了稳定的性能优势。
特征可视化分析
t-SNE可视化结果进一步证实了CCST学习到的特征表示具有更好的类间分离度和类内紧凑性。在不同数据集上,左右手运动想象任务对应的特征簇呈现出清晰的分离模式,这表明CCST确实捕获了与运动想象相关的判别性神经特征。
本研究通过系统性的实验验证和理论分析,确立了CCST作为跨被试MI-BCI研究的有效框架。该模型不仅解决了EEG解码中的关键科学问题,还为脑机接口技术在神经康复、辅助设备和认知训练等领域的实际应用提供了技术支撑。未来工作的重点将放在模型在真实场景中的部署优化、跨会话泛化能力的提升以及多模态生理信号融合等方面,进一步推动BCI技术从实验室向临床和实践的转化。