《Frontiers in Neurorobotics》:AMANet: a data-augmented multi-scale temporal attention convolutional network for motor imagery classification
编辑推荐:
本文提出了一种数据增强多尺度时序注意力卷积网络(AMANet),通过滑动窗口分割、共空间模式(CSP)特征提取和多尺度时序卷积动态捕捉脑电(EEG)信号特征,结合高效通道注意力(ECA)机制自适应加权关键通道,显著提升了小样本条件下运动想象脑机接口(MI-BCI)的解码性能。在BCI Competition IV数据集2a和2b上分别达到84.06%和85.09%的分类准确率,验证了模型在医疗康复与人机交互等领域的应用潜力。
引言
运动想象脑机接口(Motor Imagery BCI, MI-BCI)因其非侵入性和高时间分辨率的特点,在神经信号解码领域受到广泛关注。然而,脑电(EEG)信号具有样本量有限、噪声干扰强和非平稳性等挑战,制约了解码精度的提升。近年来,基于卷积神经网络(CNN)的模型虽在特征提取方面取得进展,但多数方法依赖固定尺度的卷积核,难以全面捕捉多尺度时序特征。为此,本研究提出AMANet网络,融合数据增强、多尺度卷积和注意力机制,以提升小样本EEG解码的鲁棒性与分类性能。
方法
AMANet包含五大模块:数据增强模块(DG-Block)通过滑动窗口(长度500,步长75)分割原始EEG信号,并利用共空间模式(CSP)提取12对(2a数据集)或2对(2b数据集)空间滤波器,再通过线性缩放(缩放因子β服从正态分布)增强数据多样性;多尺度时序模块(MST-Block)采用并行卷积核(尺寸为1×8、1×16、1×24)提取多尺度时序特征,并通过空间卷积(核尺寸C1×1)细化空间信息;高效通道注意力模块(ECA)通过一维卷积(核大小k=3)自适应加权特征通道,强化判别性特征;深度可分离融合模块(DSF-Block)通过深度卷积与点卷积整合时空特征;分类模块通过全连接层输出类别概率。所有卷积层均采用ELU激活函数与批归一化(BN)以提升训练稳定性。
实验结果
在BCI Competition IV-2a数据集上,AMANet的平均分类准确率达到84.06%,Kappa系数为0.78,显著优于EEGNet、Incep-EEGNet等基线模型。其中,被试S8的准确率最高(93.40%),而S5和S6较低(74.65%、76.39%),反映个体差异对模型性能的影响。在IV-2b数据集上,模型平均准确率为85.09%,且在高伽马数据集(High-Gamma)上达到95.48%。混淆矩阵与t-SNE可视化表明,模型对四分类任务(左/右手、脚、舌)具有清晰的特征分离能力,但二分类任务中部分类别存在重叠。
消融实验与参数优化
消融研究显示,移除多尺度模块或注意力机制分别导致准确率下降至81.13%和75.67%,而禁用数据增强则使性能降至75.85%,验证了各模块的协同作用。卷积核尺寸实验表明,{8,16,24}为最优组合,过大核(如{16,32,48})会因参数增加导致过拟合。注意力机制对比中,ECA以84.06%的准确率优于CBAM和SE模块,因其轻量化结构更适合小样本场景。滑动窗口参数优化确定窗口长度500、步长75为最佳配置。
结论
AMANet通过多模块协同有效解决了小样本EEG解码中的过拟合与特征提取难题,在多数据集上展现了优越的分类性能。未来工作将聚焦于跨被试泛化能力提升及模型轻量化部署,以推动其在临床康复与边缘计算中的应用。