情感识别脑机接口(BCI)对人机交互至关重要,在医学和神经科学中有重要应用。在各种测量方法中,脑电图(EEG)因其非侵入性、客观性和高时间分辨率而脱颖而出(Li 等人,2022d;Weng 等人,2024)。最近,深度学习被用于从 EEG 数据中识别情感,并取得了显著成功(Ding 等人,2023;Kan 等人,2023;Li, Chen, Jin, 2022a;Li, Zheng, Zong, Cui, Zhang, Zhou, 2018;Zhong 等人,2020)。在早期阶段,大多数方法采用监督学习(Li 等人,2022d;Weng 等人,2024)。这种范式需要标记数据来有效训练模型。然而,由于手动注释所需的时间和努力,收集标记的 EEG 数据具有挑战性(Li 等人,2022d;Weng 等人,2024)。此外,标签的准确性往往取决于专业知识和自我报告,可能导致潜在的噪声和偏差,从而影响模型性能(Weng 等人,2024)。
目前,研究人员转向自监督学习来为下游情感识别任务提取 EEG 信号的表示(Banville 等人,2021;Kan 等人,2023;Shen 等人,2022;Wang 等人,2023)。这种方法通常涉及预训练任务,这些任务可以为未标记数据自动生成标签,从而减少对标记数据集的依赖。最近的研究展示了自监督学习在 EEG 情感识别中的潜力(Li, Chen, Niu, Xu, Dong, Jin, Zhu, 2024a;Li, Wang, Zheng, Lu, 2022b;Li, Chen, Li, Fu, Wu, Ji, Zhou, Niu, Shi, Zheng, 2023;Shen 等人,2022;Wang 等人,2023)。然而,仍然存在两个关键挑战。首先,现有的预训练任务在充分保留 EEG 信号中的情感相关信息方面存在局限性。虽然许多在计算机视觉等领域成功的任务(Chen 等人,2020;He, Chen, Xie, Li, Dollár, Girshick, 2022a;He, Fan, Wu, Xie, Girshick, 2020;Noroozi 和 Favaro,2016)被改编用于 EEG 情感识别(Li, Wang, Zheng, Lu, 2022b;Li, Chen, Li, Fu, Wu, Ji, Zhou, Niu, Shi, Zheng, 2023;Shen 等人,2022),如图 1(a) 所示,但它们的设计对情感 EEG 数据的特点考虑不足。这个问题阻碍了在表示学习过程中捕获与情感相关的信息,这对下游任务的性能至关重要。因此,理想的方法是设计专门促进保留情感相关信息的预训练任务。其次,EEG 信号中的高个体间差异阻碍了自监督模型在不同个体间的泛化(Li 等人,2022d;Weng 等人,2024)。因此,增强个体间泛化对于自监督 EEG 情感识别模型的实际应用至关重要。这些挑战凸显了需要一种独立于受试者的自监督方法,能够捕获与情感相关和可泛化的 EEG 情感表示。
差异熵(DE)是一种基于专业知识的数学定义的手工特征。现有研究表明,它与 EEG 信号中的情感状态有很强的相关性(Shi 等人,2013)。在许多针对各种数据集的深度学习研究中,DE 在 EEG 情感识别中的有效性已被广泛认可(Du 等人,2020;Guo 等人,2024;Liu, Wang, Jiang, An, Gu, Li, Zhang, 2024a;Liu, Wang, An, Li, Wang, Zhang, 2024b;Luo 等人,2024;Zheng 和 Lu,2015)。因此,这一观察表明我们可以利用它来设计自监督任务,保留与情感相关的信息。此外,作为一种统计特征,DE 的有效性依赖于跨个体的一致神经生理基础。因此,它关注的是普遍模式而非个体特异性。这一事实进一步表明,将其整合到自监督任务设计中也有可能减轻高个体间差异的影响。因此,我们受到启发,探索基于这一知识的新颖自监督任务,以解决保留情感相关信息和个体间差异这两个挑战。
具体来说,我们使用 DE 作为监督来指导网络的学习过程,如图 1(b) 所示。我们的最终目标不是精确复制 DE,而是利用这一任务获得丰富的中间表示,以服务于下游的情感识别任务。作为数据驱动的自适应学习范式,深度学习可以通过这种与 DE 相关的任务获得关键能力:它可以自主发现数据中与任务相关的所有潜在模式,包括那些未被手工制作的 DE 特征覆盖的模式。通过固定的手工制作的 DE 特征很难实现这一点。一个经典的类比是计算机视觉中的掩码重建任务(He 等人,2022a)。其最终目标不是完美恢复被掩码的像素,而是迫使模型通过该过程学习与重建相关的图像语义,从而显著提高其在各种下游任务中的性能。
在这项工作中,我们提出了一种基于知识的自监督学习方法用于 EEG 情感识别。通过近似差异熵的提取过程,将有效特征的先验知识融合到学习过程的设计中。具体来说,我们的框架包括两个用于异构表示学习的级联模块。首先,提出了一个多分支卷积差异熵学习(MCDEL)模块作为硬对齐,直接从原始 EEG 数据的不同频段学习差异熵。这要求 MCDEL 分别近似不同频段的 DE 计算。为此,MCDEL 基于一维因果卷积和多分支结构构建。其次,我们提出了一个对比熵对齐(CEA)模块作为软对齐,用于在高维空间中揭示复杂的情感语义。该模块防止模型过度强调低级特征,同时忽略更复杂的语义表示的对齐。在 SEED 和 DREAMER 数据集上进行了广泛的实验。在独立于受试者的评估协议下,我们的方法优于现有的自监督学习方法。可视化结果进一步突显了它在减少个体间差异和捕获与情感相关信息方面的影响。为了证明其实际适用性,我们评估了该方法对标记数据减少的鲁棒性。结果表明,即使在标记数据较少的情况下,它也能表现良好。此外,广泛的消融研究证实了每个提出模块的有效性。我们工作的主要贡献可以总结如下:
- 1.
本研究提出了一种基于知识的自监督学习方法,将有效手工特征的知识融合到学习过程中,以近似 DE 提取作为预训练任务。我们的框架包括两个级联模块:MCDEL 和 CEA。
- 2.
MCDEL 模块被提出作为硬对齐,用于从原始 EEG 数据的多个频段构建 DE 特征。它采用一维因果卷积和多分支结构来覆盖不同频段的信号。
- 3.
CEA 模块被提出用于细化学习到的特征。作为软对齐模块,CEA 强调在高维空间中学习到的特征和手工特征的一致性。
- 4.
在两个公共情感 EEG 数据集 SEED 和 DREAMER 上进行了广泛的实验。我们的方法比现有的自监督方法实现了更高的独立于受试者的性能。