基于Swin Transformer的多尺度EEG特征解码实现跨被试运动想象脑机接口

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Scientific Reports》：Multi-scale EEG feature decoding with Swin Transformers for subject independent motor imagery BCIs

【字体：大中小】 时间：2026年01月21日 来源：Scientific Reports 3.9

编辑推荐：

　　本研究针对脑机接口(BCI)中因脑电信号(EEG)的跨被试变异性和非平稳性导致的模型泛化能力差的问题，提出了一种紧凑卷积Swin Transformer(CCST)架构。该模型通过卷积特征提取和分层窗口自注意力机制，有效捕捉局部电极交互和全局时间依赖性，在BCI Competition IV(2a, 2b)和PhysioNet MI数据集上采用留一被试交叉验证(LOSO)分别达到68.27%、76.61%和71.70%的分类准确率，显著提升了跨被试泛化能力，为神经康复和辅助技术提供了高效解决方案。

在人机交互领域，脑机接口(BCI)技术为实现大脑与外部设备的直接通信提供了革命性途径。其中，基于运动想象(Motor Imagery, MI)的BCI系统在辅助技术和神经康复领域扮演着关键角色。然而，脑电信号(Electroencephalography, EEG)固有的跨被试变异性和非平稳特性，使得开发能够泛化到新用户的BCI系统面临严峻挑战。传统的深度学习模型往往需要针对每个用户进行单独校准，这严重限制了BCI技术在真实场景中的应用价值。

针对这一瓶颈问题，来自纳扎尔巴耶夫大学的研究团队在《Scientific Reports》上发表了一项创新性研究，提出了一种名为紧凑卷积Swin Transformer(Compact Convolutional Swin Transformer, CCST)的新型混合架构。该研究旨在解决当前EEG解码模型中局部特征提取与全局依赖性建模之间的平衡问题，同时提升计算效率，为开发真正实用的跨被试BCI系统开辟了新途径。

研究人员采用了几项关键技术方法：首先，通过卷积层进行局部时空特征提取，包括时间卷积(核大小1×25)和空间卷积(核大小C×1)；其次，利用Swin Transformer的分层窗口自注意力机制捕捉长程时间依赖性；第三，采用留一被试交叉验证(Leave-One-Subject-Out, LOSO)严格评估模型泛化性能；最后，在三个标准数据集(BCI Competition IV 2a、2b和PhysioNet MI)上进行全面评估，确保结果的可比性和可靠性。

模型架构设计

CCST模型的核心创新在于巧妙融合了卷积神经网络(CNN)的局部特征提取能力和Swin Transformer的全局建模优势。模型包含四个关键阶段：块嵌入(Patch Embedding)将原始EEG信号转换为紧凑的令牌表示；位置嵌入(Positional Embedding)通过可学习参数编码时序信息；多个Swin Transformer块通过窗口自注意力和循环移位机制实现分层特征学习；分类头(Classification Head)通过全局平均池化和全连接层输出最终预测。这种设计使CCST能够在降低计算复杂度的同时，有效捕获EEG信号中的多尺度时空模式。

跨数据集性能评估

在BCI Competition IV 2a数据集上的实验结果显示，CCST在未使用数据增强(Data Augmentation, DA)的情况下达到了68.27%的平均分类准确率，显著优于EEGNet(46.60%)、EEGConformer(43.00%)等基准模型。特别值得注意的是，CCST在Subject 8和Subject 9上分别取得了91.49%和89.58%的极高准确率，证明了其对不同被试EEG模式的高度适应性。

在BCI Competition IV 2b数据集的测试中，CCST同样表现优异，平均准确率达到76.61%。模型在Subject 4、Subject 5和Subject 9上的性能尤为突出，准确率均超过86%，这表明CCST在处理不同电极配置(该数据集仅使用3个EEG电极)时仍保持稳定性能。

最令人印象深刻的结果来自大规模PhysioNet MI数据集的评估，该数据集包含109名被试，更能反映真实场景下的被试变异性。CCST在此数据集上取得了71.70%的平均准确率，而其他基准模型的性能大多在50%左右徘徊，这充分证明了CCST在跨被试泛化方面的显著优势。

计算效率分析

除了性能提升外，CCST在计算效率方面也展现出明显优势。与使用全局自注意力的传统Transformer模型相比，CCST采用的窗口自注意力机制将计算复杂度从O(L²)降低到O(L×W)，其中L为序列长度，W为窗口大小(本研究设置为4)。具体而言，CCST的浮点运算数(FLOPs)为18.94 MMac，参数数量为150.96k，推理时间为0.002407秒，在保持高性能的同时满足了实时BCI应用的低延迟需求。

统计显著性验证

通过Wilcoxon符号秩检验和Bonferroni校正进行的统计分析表明，CCST在BCI IV 2a和PhysioNet MI数据集上的性能改进具有统计显著性(p<0.005)。虽然在BCI IV 2b数据集上部分对比未达到显著性阈值，但CCST仍然在多数被试上保持了稳定的性能优势。

特征可视化分析

t-SNE可视化结果进一步证实了CCST学习到的特征表示具有更好的类间分离度和类内紧凑性。在不同数据集上，左右手运动想象任务对应的特征簇呈现出清晰的分离模式，这表明CCST确实捕获了与运动想象相关的判别性神经特征。

本研究通过系统性的实验验证和理论分析，确立了CCST作为跨被试MI-BCI研究的有效框架。该模型不仅解决了EEG解码中的关键科学问题，还为脑机接口技术在神经康复、辅助设备和认知训练等领域的实际应用提供了技术支撑。未来工作的重点将放在模型在真实场景中的部署优化、跨会话泛化能力的提升以及多模态生理信号融合等方面，进一步推动BCI技术从实验室向临床和实践的转化。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号