复杂小波卷积神经网络:用于可解释且鲁棒的癫痫预测

《Knowledge-Based Systems》:Complex Wavelet Convolutional Neural Network for Interpretable and Robust Seizure Prediction

【字体: 时间:2026年02月27日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  癫痫预测;复杂小波卷积网络;Morlet小波;EEG信号处理;参数化核

  
李浩天|卢伟森|李毅|周卫东
山东大学集成电路学院,中国济南250100

摘要

卷积神经网络(CNN)被广泛用于癫痫发作预测。然而,大多数CNN依赖于具有单一频谱尺度的实值核函数,这些核函数能够捕捉振幅信息,但忽略了表征癫痫发作前脑电图(EEG)活动的相位动态。同时,这些学习得到的核函数在物理意义上的可解释性有限。为了解决这些问题,我们提出了复小波卷积网络(CWCN),它用参数化的复Morlet小波核函数替代了传统的卷积核函数。每个核函数仅由两个可学习参数(尺度 和相位)控制,从而实现了对EEG振幅和相位的端到端联合建模,显著减少了参数数量,并具有特定的时频解释能力。在两个长期头皮EEG数据库CHB-MIT(儿童)和SH-SDU(混合年龄)上的评估表明,基于CWCN的模型在CHB-MIT上的准确率为99.03%,AUC为98.39%;在SH-SDU上的准确率为96.94%,AUC为96.54%,证明了其在不同人群和记录条件下的鲁棒性。通过将小波分析与卷积操作相结合,CWCN提供了一个可解释、紧凑且性能优异的癫痫发作预测框架,该框架直接编码了具有生理意义的振荡结构,为仅基于振幅的、黑箱式的CNN提供了原理上的替代方案。代码可访问于 https://github.com/HTLi-acuo/CWCN

引言

癫痫是一种慢性神经系统疾病,影响全球约1%的人口[1]。其典型特征是由于异常的、过度的神经元放电导致的反复发作,对患者的安全和生活质量构成严重威胁[[2], [3], [4]]。可靠的自动癫痫发作预测(ASP),即从脑电图(EEG)记录中检测癫痫发作前状态,仍然是现代神经工程的核心目标,因为它可以实现早期预警和及时的治疗干预。
然而,基于EEG的癫痫发作预测仍然是一个巨大的挑战,因为EEG信号具有高度的可变性、非平稳性和噪声污染[5,6]。为了实现可靠的ASP,人们探索了各种信号处理和机器学习方法。传统的EEG分析通常依赖于专家设计的手工时间、频谱或时频特征,并结合支持向量机(SVM)[7,8]、k最近邻(KNN)[9,10]、决策树[11]和随机森林[12]等机器学习算法来预测癫痫发作。然而,这些方法严重依赖于专家知识,并将特征提取和分类视为独立的过程,无法满足复杂EEG模式自动化建模的需求。
近年来,深度学习方法在各种应用领域表现出了优于传统机器学习方法的能力。特别是卷积神经网络(CNN)[[13], [14], [15]]、循环神经网络(RNN)[[16], [17], [18], [19]]和基于注意力的模型[[20], [21], [22]]在复杂时间序列建模方面取得了显著进展。这些进步为深度学习模型在基于EEG的自动癫痫检测(ASD)和ASP中的广泛应用铺平了道路,使得可以直接从原始EEG信号中提取时空特征。然而,大多数基于CNN的模型依赖于实值卷积核函数,这些核函数主要捕捉与振幅相关的信息,而忽略了同样重要的神经振荡的相位动态[23]。相位信息编码了通常在癫痫发作前出现的节律同步和跨频率耦合[24,25]。例如,Liu等人[26]使用Stockwell变换(S变换)提取EEG相位谱图用于癫痫发作识别,证明了相位特征在区分发作状态方面的优越性能。忽略相位会限制对癫痫活动完整时空结构的建模能力。此外,传统的CNN核函数缺乏明确的物理意义,限制了可解释性并妨碍了临床应用。
癫痫发作的特征是异常的节律性神经元活动和突然的频率变化,这反映在独特的振幅和周期性成分中[27]。为了更好地建模癫痫发作前信号的时间特征,先前的研究已将时频分析方法整合到深度学习架构中[[28], [29], [30]]。其中,小波变换特别适用于非平稳EEG的建模,因为它具有出色的时频定位能力[[31], [32], [33]]。然而,大多数这些方法将这种分析作为与分类无关的预处理步骤,限制了学习区分性特征的灵活性。为了克服这些限制,我们提出了复小波卷积网络(CWCN),这是一种新颖的端到端架构,它用参数化的复Morlet小波核函数替代了传统的实值核函数。这种设计使CWCN能够联合建模EEG的振幅和相位动态,提供了在时间和频率域中具有物理意义的脑振荡表示。本研究的主要创新和贡献如下:
  • 1)
    我们提出了CWCN,它使用复Morlet小波作为可学习的卷积核函数,实现了复数域中的振幅-相位联合建模,并提供了信号动态的紧凑且具有物理意义的表示。
  • 2)
    在CWCN中,每个核函数仅由两个参数(尺度和相位)调节,允许自适应调整时间分辨率和频率同步,同时大幅减少了可训练参数的数量。
  • 3)
    CWCN将复小波直接嵌入到卷积层中,将复小波分析和深度学习统一在一个可微分、可训练的框架中。与实值小波不同,复小波保留了相位和振幅信息,这在基于EEG的癫痫发作预测中非常重要。
  • 4)
    CWCN将癫痫发作预测推向了一个更具可解释性、基于生理学且计算效率更高的深度学习范式,在两个EEG数据库上展示了竞争性的性能。
  • 本文的其余部分组织如下。第2节回顾了相关工作。第3节详细描述了所提出的CWCN,并推导了前向传播和反向传播的相应公式。第4节介绍了数据库并展示了实验结果。第5节进一步讨论了CWCN的性能和可解释性,并与其他方法进行了比较。最后,第6节总结了本研究。

    小节片段

    基于小波变换的CNN

    近年来,为了提高深度学习模型的多尺度建模能力和可解释性,研究人员尝试将小波框架整合到CNN中。2018年,Fujieda等人[34]首次将小波变换引入CNN,这显著推动了小波卷积神经网络的发展。Liu等人[35]将离散小波变换(DWT)和逆小波变换(IWT)整合到U-Net架构中,以实现高分辨率特征

    提出的方法

    本节详细介绍了所提出的方法,包括预处理步骤、CWCN的架构、前向传播和反向传播算法的理论推导以及后处理步骤。

    实验和结果

    在本节中,我们介绍了EEG数据库、实验设置和评估指标,并对CWCN模型在两个头皮EEG数据库CHB-MIT和SH-SDU上的性能进行了系统评估。

    消融研究

    为了研究不同参数对CWCN模型的影响,我们在CHB-MIT数据库上进行了消融实验,结果总结在表7中。配置M-01到M-04对应于不同的角频率ω0,反映了卷积核的中心频率对模型性能的影响。观察到当ω0=9时,模型在两个水平上都取得了相对最好的结果,其次是ω0=11。这表明CWCN模型主要

    结论

    我们提出了一个新颖的CWCN框架,它用可学习的复Morlet核函数替换了传统的实值滤波器,每个核函数仅由两个可学习参数(尺度和相位)控制。该设计联合建模了EEG的振幅和相位,提供了具有物理意义的时频表示,并显著减少了参数数量和计算负担。为了验证其有效性,我们在两个头皮EEG数据库上进行了癫痫发作预测实验,CWCN模型

    CRediT作者贡献声明

    李浩天:概念化、方法论、软件、形式分析、研究、可视化、撰写原始草稿。卢伟森:方法论、撰写原始草稿。李毅:撰写-审阅与编辑。周卫东:概念化、资金获取、监督、撰写-审阅与编辑。

    CRediT作者贡献声明

    李浩天:撰写——原始草稿、可视化、软件、方法论、研究、形式分析、概念化。卢伟森:撰写——原始草稿、方法论。李毅:撰写——审阅与编辑。周卫东:撰写——审阅与编辑、监督、资金获取、概念化。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

    致谢

    感谢国家自然科学基金(编号62271291)、山东省自然科学基金重点项目(编号ZR2024LZH007)、深圳市科技计划(GJHZ20220913142607013)以及NIH资助(AG077576和AG057848)的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号