《Scientific Data》:An EEG dataset for handwriting imagery decoding of Chinese character strokes and Pinyin single vowels
编辑推荐:
本研究针对非侵入性脑机接口(BCI)手写想象解码算法开发受限于训练数据稀缺的瓶颈,首次推出专用于手写想象的开放EEG数据集。该数据集通过双范式设计(汉字笔画想象与拼音单韵母想象)采集21名健康参与者32通道EEG信号,经严格质控提供18,480个标准化试次,为运动功能障碍患者书写交流功能重建研究提供高质量数据支撑。
在脑科学与神经工程领域,非侵入式脑机接口(BCI)技术为运动功能障碍患者重建交流能力带来了革命性希望。其中,基于脑电图(EEG)的手写想象解码技术,因其能恢复精细书写能力而备受关注。然而,该领域长期面临高性能解码算法开发与训练数据稀缺之间的尖锐矛盾——现有公开数据集数量匮乏且缺乏标准化设计,严重制约着解码模型的泛化能力与临床转化进程。
为突破这一瓶颈,研究团队在《Scientific Data》发表了首个专注于手写想象的开放EEG数据集。该研究通过创新性的双范式实验设计,同步采集汉字笔画想象(横、竖、撇、捺、折五类基本笔画)与拼音单韵母想象(a/o/e/i/u/ü六类元音)的神经活动数据。实验招募21名健康参与者完成间隔24小时的两轮会话,使用32导联EEG系统以1000 Hz采样率记录神经电信号。经严格质控筛选后,最终提供18,480个符合Brain Imaging Data Structure(BIDS)标准的标准化试次,每个试次包含完整的时序标注与事件标记。
关键技术方法涵盖:①32通道EEG采集系统(1000 Hz采样率)②双范式实验设计(汉字笔画想象200试次/会话,拼音单韵母想象240试次/会话)③跨会话数据采集(间隔≥24小时)④基于BIDS标准的质控流程⑤21名健康参与者队列。
研究结果方面:
- •
数据完整性验证:通过信号质量筛查与试次标准化,确保18,480个试次均包含完整的事件相关电位(ERP)与频谱特征
- •
多维度特征捕获:汉字笔画想象任务有效提取运动想象相关的μ节律(8-12 Hz)与β节律(18-26 Hz)调制,拼音任务显著激活语言相关区域的θ节律(4-7 Hz)同步化
- •
跨会话稳定性:双会话设计证实神经特征在24小时间隔后仍保持较高重测信度(组内相关系数>0.75)
结论表明,该数据集首次实现对手写想象神经表征的多维度系统捕获,为解码算法开发提供三大支撑:①标准化数据格式助力模型跨研究比较②双范式设计支持语言与运动神经机制的协同研究③高质量试次为深度学习模型训练提供充足样本。这项研究不仅填补了手写想象EEG数据集的空白,更通过严格质控与标准化流程,为BCI技术走向临床实用化奠定了数据基石。