《Array》:Label-efficient sleep staging from multi-channel EEG with self-supervised contrastive learning and iterative self-distillation
编辑推荐:
为解决人工睡眠分期耗时、主观且大规模标注数据稀缺的难题,研究者提出了一种结合自监督对比学习与迭代自蒸馏的标签高效多通道EEG睡眠分期框架。该方法通过双分支CNN与交叉注意力融合模块提取多导联EEG特征,利用时序相邻性构建对比学习正负样本进行预训练,再使用极少量标签微调,并借助伪标签迭代自蒸馏提升性能。在Sleep-EDF-v2数据集上,仅使用1%标注数据即实现了76.31%的准确率与66.53%的Macro-F1分数,显著降低了标注成本,并为临床便携式设备的部署提供了紧凑模型。
精准的睡眠分期对于评估睡眠质量和诊断睡眠障碍至关重要。目前,临床上的金标准是基于多导睡眠图(PSG)的人工判读。然而,这一过程不仅费时费力,而且高度依赖专家的主观经验,存在判读者间差异。同时,构建大规模、高质量的标注数据集成本高昂,成为开发自动化、可部署睡眠分期算法的瓶颈。此外,在真实世界的医院或可穿戴设备应用场景中,还需考虑患者数据隐私、有限的跨机构数据共享能力、资源受限设备的推理效率等多重约束。因此,开发一种能够从大量未标注数据中学习稳健特征、仅需极少量标注即可达到高精度,并且模型轻量、适合资源受限环境部署的睡眠分期框架,具有重要的临床意义和应用价值。
一项发表于《Array》期刊的研究,题为“Label-efficient sleep staging from multi-channel EEG with self-supervised contrastive learning and iterative self-distillation”,正是瞄准了上述挑战。该研究由浙江大学信息与电子工程学院的研究团队完成,提出了一种面向部署的、标签高效的多通道脑电图(EEG)睡眠分期新方法。该方法巧妙地将自监督对比学习与迭代自蒸馏相结合,核心目标是利用海量未标注的PSG数据学习通用的EEG表征,从而在仅使用极少量标注数据进行微调时,也能获得与全监督方法相媲美的性能。
为了验证这一思路,研究者们主要运用了以下几个关键技术方法:首先,构建了一个双分支卷积神经网络(CNN)结合交叉注意力融合(CAF)模块的骨干网络,用于独立处理并有效融合Fpz-Cz和Pz-Oz两个导联的EEG信号。其次,设计了一种基于时序邻近性的对比学习预训练策略,利用连续30秒EEG片段在时域上的相似性构建正样本对,并采用动量更新与记忆队列来维护负样本,通过InfoNCE损失函数学习鲁棒的表征。最后,提出了一个迭代自蒸馏(ISD)流程,在预训练和有限标签微调后,通过师生模型交替生成和利用伪标签,逐步将更多未标注数据纳入训练,进一步提升模型性能。研究使用的数据主要来自公开的Sleep-EDF扩展版(SleepEDF-v2)数据集。
4.1. 与最先进方法的比较
为了评估方法的有效性,研究在SleepEDF-v2数据集上,将所提方法与SimCLR、TS-TCC、Cosleep、MulEEG和MV-TTFC等前沿的自监督学习(SSL)基线模型进行了对比。评估场景设定为仅使用1%的标注数据进行微调。结果显示,本文提出的方法在总体准确率(ACC)和宏观平均F1分数(Macro-F1)两项核心指标上均取得了最优成绩,分别达到76.31%和66.53%。具体到各个睡眠阶段,该方法在清醒期(W)、N1期和快速眼动睡眠期(REM)的F1分数上表现最佳,表明其学习到的表征在区分轻度睡眠、REM期与清醒期方面尤为有效。图3展示了模型在整个测试集上的混淆矩阵,直观反映了模型在不同睡眠阶段间的分类情况。此外,图4则展示了模型对受试者1整晚睡眠的预测结果与人工标注金标准的对比,可视化了模型的预测能力,该受试者达到了81%的片段级准确率。
4.3. 消融研究
研究通过系统的消融实验验证了所提出框架各个组件的贡献。实验主要考察了三个核心模块的影响:多通道交叉注意力融合(CAF)模块、自监督对比预训练(SSL)阶段以及迭代自蒸馏(ISD)阶段。结果表明,完整的模型(包含CAF、SSL和ISD)在所有标注比例(1%、10%、50%、100%)下均能取得最佳性能。移除CAF模块会导致性能明显下降,尤其是在低标签比例(1%)时最为显著,这证明了跨通道信息融合对于捕捉互补时空特征至关重要。仅使用监督学习(无SSL预训练)在标签稀缺时(1%)性能严重不足,而引入SSL预训练后性能大幅提升,凸显了利用未标注数据学习通用表征的巨大价值。进一步加入ISD阶段后,模型性能得到持续、稳定的提升,特别是在1%和10%的极低标签比例下,增益更为明显,证明了伪标签迭代优化对于充分挖掘未标注数据潜力的有效性。
方法学贡献的进一步分析
研究的核心创新在于其精心设计的三阶段训练流程,如图1所示。第一阶段,模型通过对比学习从完全未标注的数据中学习具有判别性的EEG表征,其关键在于利用睡眠EEG数据的时序连续性,将相邻的30秒片段视为正样本对。第二阶段,冻结预训练好的特征编码器,仅用一个轻量级的分类头,在极少量的标注数据(如1%)上进行微调。第三阶段,通过迭代自蒸馏,利用教师模型为大量未标注数据生成伪标签,学生模型在混合了真实标签和伪标签的数据集上训练,随后师生角色互换进行多轮迭代,逐步提升模型性能并纠正早期伪标签中的错误。这种设计使得模型能够以极低的标注成本,充分利用海量未标注数据。
研究的网络架构设计也颇具巧思,如图2所示的双分支CNN与交叉注意力融合模块构成了模型的核心。每个分支独立处理一个EEG通道,通过卷积层提取特征后,利用交叉注意力机制让两个通道的特征相互查询、补充信息,最后融合成一个统一的表征。这种设计既保留了两个通道的独立性,又实现了深度的信息交互,模拟了专家在判读多导联EEG时会综合不同位置信号信息的认知过程。
结论与重要意义
本研究成功提出并验证了一个高效的、面向实际部署的多通道EEG睡眠分期框架。该框架的核心优势在于其卓越的“标签效率”,仅需1%的标注数据即可达到与现有SSL基线模型使用更多数据相当甚至更优的性能(76.31%准确率,66.53% Macro-F1)。这一特性极大地缓解了构建大规模标注睡眠数据集带来的沉重负担。
研究的贡献是多方面的。在方法学上,它创新性地将时序对比学习与迭代自蒸馏相结合,为标签稀缺场景下的生物医学时间序列分析提供了一个可复用的范式。所设计的双分支CNN与交叉注意力融合架构,为有效整合多通道生理信号特征提供了新的思路。在应用价值上,该方法产生的模型紧凑、计算开销低,非常适合于部署在资源受限的临床床边设备或可穿戴设备上,支持本地化、隐私保护的推理。其采用的单中心训练设置,避免了敏感医疗数据的跨机构流转,符合实际医院的隐私和安全要求。
总而言之,这项工作为实现精准、自动化、低成本的睡眠监测与分期迈出了坚实的一步。它不仅为睡眠医学的数字化诊断提供了有力的工具,其“预训练+微调+自蒸馏”的框架以及对于多通道信号融合的探索,也对其他基于生理信号的疾病辅助诊断任务具有重要的借鉴意义,推动了人工智能在医疗健康领域,特别是在数据标注成本高昂场景下的实用化进程。