基于差分四元模式与定向叶状符号语言的脑电信号可解释分类框架:在ALS与新生儿癫痫检测中的应用

【字体: 时间:2026年03月06日 来源:IBRO Neuroscience Reports 2.9

编辑推荐:

  为解决脑电(EEG)信号自动分类中可解释性不足、模型通用性差及深度学习方法计算复杂度高等问题,研究人员开发了一种名为“差分四元模式可解释特征工程(DiffQuadPat-centric XFE)”的新框架。该研究整合了新型特征提取器DiffQuadPat、累积权重邻域成分分析(CWNCA)特征选择、t-algorithm优化的k-近邻(tkNN)分类器以及可解释人工智能(XAI)方法定向叶状(DLob)符号语言。在肌萎缩侧索硬化症(ALS)和新生儿癫痫两个EEG数据集上,模型在10折交叉验证下均达到超过98%的分类准确率,并生成了脑区(皮层与半球)层面的连接图谱,为临床决策提供了高精度且可解释的支持工具。

  
在神经科学和临床诊断领域,脑电(EEG)信号如同大脑的“字母”,忠实地记录着神经元的活动,是揭示神经功能变化的关键窗口。然而,解读这些信号并非易事。像肌萎缩侧索硬化症(ALS)和新生儿癫痫这类严重神经系统疾病,其异常EEG模式是诊断的重要线索,但传统的专家判读依赖性强、效率低,且易受主观因素影响。近年来,机器学习和深度学习虽然为自动化EEG分析带来了曙光,能实现高精度的分类,但它们常常深陷“黑箱”困境——模型决策过程难以解释,这让依赖模型进行临床决策的医生难以完全信任。此外,现有研究大多只针对单一数据集,模型的通用性存疑,而复杂的深度模型又常伴随着高昂的计算成本和对大量数据的渴求,限制了其在临床环境中的实际应用。面对这些挑战,一项发表于《IBRO Neuroscience Reports》的研究,由Bilge ?zgor、?mer Faruk G?kta?、Mehmet Baygin、?engül Do?an、Türker Tuncer团队共同完成,提出了一种全新的、兼顾高精度与可解释性的解决方案。
为了开发一个既准确、高效又可解释的EEG信号分类工具,研究人员设计并构建了一个名为“以差分四元模式为中心的可解释特征工程(DiffQuadPat-centric XFE)”框架。这个框架的核心是几个关键技术方法的组合应用。首先,他们引入了全新的特征提取器——差分四元模式(DiffQuadPat)。这是一种受Transformer(自注意力模型)思想启发的功能,通过对四个连续通道值进行组合差分变换和基于排序的转换,生成六种变换信号,再通过组合转移表(CTT)提取出丰富的特征,从而捕捉EEG通道间的复杂关系。其次,为了从高维特征中筛选出最具信息量的部分,研究人员采用了累积权重邻域成分分析(CWNCA)进行特征选择。之后,分类任务由基于t-algorithm优化的k-近邻(tkNN)分类器完成,这是一个自组织和迭代的、决策过程简单可预测的分类器。最后,也是本研究的亮点之一,是引入了定向叶状(DLob)符号语言来实现可解释性。DLob能将选定的特征映射为符号化的解释,揭示与大脑皮层和半球水平的关联,并生成可视化的连接图谱,直观展示不同脑区间的相互作用。研究在两个公开的EEG数据集上进行了验证:一个是针对肌萎缩侧索硬化症(ALS)的检测数据集(来自6名ALS患者和170名对照者,共5,262段EEG信号,32通道),另一个是针对新生儿癫痫发作的检测数据集(包含7,011段发作信号和3,422段对照信号,共10,433段,19通道),旨在评估模型在不同疾病和设备配置下的泛化能力。
研究结果
1. 卓越的分类性能
该DiffQuadPat-centric XFE框架在两个数据集上均表现优异。在10折交叉验证下,模型在EEG ALS数据集上达到了98.84%的准确率,在EEG新生儿癫痫数据集上更是达到了99.38%的准确率。所有评估指标,包括灵敏度、特异度、精确率、F1分数和几何均值,均超过了98%,证明了该框架强大的分类能力和在不同任务间的良好泛化性。
2. 清晰的可解释结果
通过DLob符号语言的解码,研究不仅实现了高精度分类,还生成了直观的、临床可理解的解释。研究输出了由DLob符号组成的字符串(如“FL”、“FR”分别代表左、右额叶),并据此生成了皮层连接图谱和半球连接图谱。这些图谱以热图和转移概率矩阵的形式,清晰地揭示了疾病相关的主要脑区活动模式。分析发现,对于ALS检测,激活最频繁的脑区是额叶(尤其是左额叶FL),过渡模式以“FL-FL”最为常见。而对于新生儿癫痫检测,激活最显著的是颞叶(特别是“TR-TR”过渡)。此外,两个疾病都显示出对大脑左半球的显著影响。
3. 复杂度分析与模型优势
研究进一步计算了所生成DLob字符串和半球字符串的信息熵和复杂度熵。结果显示,新生儿癫痫检测的复杂度熵(94.12%)高于ALS检测的(88.35%),表明新生儿癫痫的脑电活动模式可能更为复杂和不可预测。与传统的决策树、线性判别、支持向量机、k-近邻和人工神经网络等分类器相比,本研究采用的tkNN分类器表现出最佳性能,验证了模型架构的有效性。
结论与讨论
本研究成功地开发并验证了一个新颖的、以差分四元模式(DiffQuadPat)为中心的可解释特征工程(XFE)框架。该框架的核心贡献在于,它将高精度的EEG信号分类与前所未有的可解释性紧密结合,填补了当前相关研究的空白。模型不仅在ALS和新生儿癫痫检测任务上分别取得了超过98%和99%的分类准确率,展现了卓越的性能和跨数据集的泛化能力,更重要的是,它通过DLob符号语言提供了脑区层面的可视化解释。这些解释表明,ALS与额叶(特别是左额叶)活动密切相关,而新生儿癫痫则与颞叶活动关联更强,且两种疾病均表现出左半球优势。这些发现不仅为临床医生理解模型决策、建立诊断信心提供了有力工具,也为探索疾病背后的神经生理机制提供了新线索。
与现有的状态模型(SOTA)相比,本研究提出的框架在分类精度和可解释性深度上均具有竞争力。例如,本模型在10折交叉验证下的性能优于许多仅关注分类或解释性有限的现有研究。此外,该框架具有线性时间复杂度,相对于需要大量计算资源的深度模型,它是一个计算高效的“轻量级”方案,更易于在临床环境中部署。
研究的局限性包括所使用的两个数据集的样本量相对有限,未来需要在更大规模、更多样化的数据集上进一步验证。尽管如此,这项工作为开发下一代临床辅助诊断系统指明了一个有前景的方向:将先进的特征工程、强大的分类算法和直观的可解释人工智能技术相结合,以推动神经科学研究和临床神经病学实践向更精准、更透明、更可信赖的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号