由于非侵入性、毫秒级的时间分辨率以及在基础神经科学和辅助技术领域的广泛应用,脑电图(EEG)已成为脑机接口(BCI)[43], [45], [49], [68], [73]研究中的关键技术。近年来,基于EEG的BCI系统在运动想象分类[1], [2], [16], [37]、情绪识别[10], [12], [24], [25], [29], [42], [50], [57], [66]、注意力和工作负荷评估[17], [20]、听觉/视觉刺激解码[38], [39], [54],甚至想象语音解码[27], [40]等应用中取得了有希望的结果。这些系统的成功在很大程度上依赖于准确解码神经信号,而这又依赖于大量高质量、标记好的EEG数据的可用性。
然而,获取高质量、标记好的EEG数据仍然是BCI研究中的一个关键瓶颈。 EEG记录通常需要专门的设备、严格控制实验室环境以及长时间的记录会话,使得大规模数据收集既昂贵又耗时。此外,注释过程——无论是将EEG信号与外部刺激、行为结果还是内部认知状态对齐——往往涉及帧级的时间精度和专家领域知识,这使得它既费力又难以扩展。这些实际限制严重限制了大规模、精心策划的数据集的可用性,成为开发可靠、高性能BCI系统的根本障碍。
对于深度学习[11], [26], [36], [62], [63], [77]等现代数据驱动方法来说,这一挑战尤为突出,因为这些方法需要大量的训练数据以避免过拟合并实现可靠的性能。在许多实际的BCI场景中——例如临床诊断[65], [67]、移动系统[6], [31]或个性化应用[75], [76]——只有有限量的标记数据可用,这成为阻碍算法进展和实际部署的关键瓶颈。为应对这些挑战,最近的研究探索了EEG基础模型[14], [28], [30], [34], [61], [64], [69], [70]的开发,这些模型旨在通过从大规模未标记的EEG数据中学习通用表示,并通过微调将其转移到下游任务中,以缓解标记数据稀缺的问题。尽管这些模型显示出前景,但有证据表明,它们仍然需要大量的标记数据才能有效地进行任务特定适应。因此,BCI应用中标记数据稀缺的挑战在很大程度上仍未解决。
为了解决这一限制,我们提出了EEGDiffuser,这是一个基于扩散概率模型[21], [22], [53], [55]的生成框架,旨在根据任务相关标签合成EEG信号。EEGDiffuser将信号生成过程建模为一系列去噪步骤,将高斯噪声转换为结构化的、类似EEG的信号,并通过条件机制确保与所需任务标签的一致性。重要的是,EEGDiffuer的目标不是替代真实的EEG数据,而是提供一种可扩展且可控的方法来生成真实、与标签对齐的合成数据。这样的合成数据可以帮助缓解标记EEG数据的稀缺性,从而实现更有效的模型训练,并可能提高BCI中的解码性能。基于合成EEG信号的这种改进解码过程的示意图如图1所示。
从EEG解码的角度来看,像EEGDiffuser这样的生成模型提供了模拟额外样本、解决数据不平衡问题以及在数据有限条件下支持预训练的宝贵机会。更广泛地说,它们促进了数据高效和适应性BCI系统的开发,可能降低实际部署的障碍。我们的实证评估表明,用EEGDiffuser生成的信号增强真实数据可以持续提高跨受试者或跨会话的EEG解码性能,尤其是在数据量少的情况下。进一步分析证实,生成的信号保留了与真实EEG数据中发现的基本神经生理特征一致,突显了它们在BCI研究中的实际价值。
我们的主要贡献总结如下:
•合成框架:我们提出了EEGDiffuser,一个基于标签的扩散模型,用于生成EEG信号以缓解BCI中的数据稀缺问题。
•实证评估:我们在多种BCI任务和数据集上进行了广泛的评估,显示EEGDiffuer生成的合成数据一致地提升了多个EEG解码器的性能。这突显了其在实际应用中的价值。
•神经生理分析:我们的分析表明,生成的信号表现出与真实EEG相似的神经特征,支持了它们的神经生理合理性以及它们在神经解码和更广泛的神经科学发现方面的潜力。