基于差分四元模式与定向叶状符号语言的脑电信号可解释分类框架：在ALS与新生儿癫痫检测中的应用

【字体：大中小】 时间：2026年03月06日 来源：IBRO Neuroscience Reports 2.9

编辑推荐：

　　为解决脑电（EEG）信号自动分类中可解释性不足、模型通用性差及深度学习方法计算复杂度高等问题，研究人员开发了一种名为“差分四元模式可解释特征工程（DiffQuadPat-centric XFE）”的新框架。该研究整合了新型特征提取器DiffQuadPat、累积权重邻域成分分析（CWNCA）特征选择、t-algorithm优化的k-近邻（tkNN）分类器以及可解释人工智能（XAI）方法定向叶状（DLob）符号语言。在肌萎缩侧索硬化症（ALS）和新生儿癫痫两个EEG数据集上，模型在10折交叉验证下均达到超过98%的分类准确率，并生成了脑区（皮层与半球）层面的连接图谱，为临床决策提供了高精度且可解释的支持工具。

在神经科学和临床诊断领域，脑电（EEG）信号如同大脑的“字母”，忠实地记录着神经元的活动，是揭示神经功能变化的关键窗口。然而，解读这些信号并非易事。像肌萎缩侧索硬化症（ALS）和新生儿癫痫这类严重神经系统疾病，其异常EEG模式是诊断的重要线索，但传统的专家判读依赖性强、效率低，且易受主观因素影响。近年来，机器学习和深度学习虽然为自动化EEG分析带来了曙光，能实现高精度的分类，但它们常常深陷“黑箱”困境——模型决策过程难以解释，这让依赖模型进行临床决策的医生难以完全信任。此外，现有研究大多只针对单一数据集，模型的通用性存疑，而复杂的深度模型又常伴随着高昂的计算成本和对大量数据的渴求，限制了其在临床环境中的实际应用。面对这些挑战，一项发表于《IBRO Neuroscience Reports》的研究，由Bilge ?zgor、?mer Faruk G?kta?、Mehmet Baygin、?engül Do?an、Türker Tuncer团队共同完成，提出了一种全新的、兼顾高精度与可解释性的解决方案。

为了开发一个既准确、高效又可解释的EEG信号分类工具，研究人员设计并构建了一个名为“以差分四元模式为中心的可解释特征工程（DiffQuadPat-centric XFE）”框架。这个框架的核心是几个关键技术方法的组合应用。首先，他们引入了全新的特征提取器——差分四元模式（DiffQuadPat）。这是一种受Transformer（自注意力模型）思想启发的功能，通过对四个连续通道值进行组合差分变换和基于排序的转换，生成六种变换信号，再通过组合转移表（CTT）提取出丰富的特征，从而捕捉EEG通道间的复杂关系。其次，为了从高维特征中筛选出最具信息量的部分，研究人员采用了累积权重邻域成分分析（CWNCA）进行特征选择。之后，分类任务由基于t-algorithm优化的k-近邻（tkNN）分类器完成，这是一个自组织和迭代的、决策过程简单可预测的分类器。最后，也是本研究的亮点之一，是引入了定向叶状（DLob）符号语言来实现可解释性。DLob能将选定的特征映射为符号化的解释，揭示与大脑皮层和半球水平的关联，并生成可视化的连接图谱，直观展示不同脑区间的相互作用。研究在两个公开的EEG数据集上进行了验证：一个是针对肌萎缩侧索硬化症（ALS）的检测数据集（来自6名ALS患者和170名对照者，共5,262段EEG信号，32通道），另一个是针对新生儿癫痫发作的检测数据集（包含7,011段发作信号和3,422段对照信号，共10,433段，19通道），旨在评估模型在不同疾病和设备配置下的泛化能力。

研究结果

1. 卓越的分类性能

该DiffQuadPat-centric XFE框架在两个数据集上均表现优异。在10折交叉验证下，模型在EEG ALS数据集上达到了98.84%的准确率，在EEG新生儿癫痫数据集上更是达到了99.38%的准确率。所有评估指标，包括灵敏度、特异度、精确率、F1分数和几何均值，均超过了98%，证明了该框架强大的分类能力和在不同任务间的良好泛化性。

2. 清晰的可解释结果

通过DLob符号语言的解码，研究不仅实现了高精度分类，还生成了直观的、临床可理解的解释。研究输出了由DLob符号组成的字符串（如“FL”、“FR”分别代表左、右额叶），并据此生成了皮层连接图谱和半球连接图谱。这些图谱以热图和转移概率矩阵的形式，清晰地揭示了疾病相关的主要脑区活动模式。分析发现，对于ALS检测，激活最频繁的脑区是额叶（尤其是左额叶FL），过渡模式以“FL-FL”最为常见。而对于新生儿癫痫检测，激活最显著的是颞叶（特别是“TR-TR”过渡）。此外，两个疾病都显示出对大脑左半球的显著影响。

3. 复杂度分析与模型优势

研究进一步计算了所生成DLob字符串和半球字符串的信息熵和复杂度熵。结果显示，新生儿癫痫检测的复杂度熵（94.12%）高于ALS检测的（88.35%），表明新生儿癫痫的脑电活动模式可能更为复杂和不可预测。与传统的决策树、线性判别、支持向量机、k-近邻和人工神经网络等分类器相比，本研究采用的tkNN分类器表现出最佳性能，验证了模型架构的有效性。

结论与讨论

本研究成功地开发并验证了一个新颖的、以差分四元模式（DiffQuadPat）为中心的可解释特征工程（XFE）框架。该框架的核心贡献在于，它将高精度的EEG信号分类与前所未有的可解释性紧密结合，填补了当前相关研究的空白。模型不仅在ALS和新生儿癫痫检测任务上分别取得了超过98%和99%的分类准确率，展现了卓越的性能和跨数据集的泛化能力，更重要的是，它通过DLob符号语言提供了脑区层面的可视化解释。这些解释表明，ALS与额叶（特别是左额叶）活动密切相关，而新生儿癫痫则与颞叶活动关联更强，且两种疾病均表现出左半球优势。这些发现不仅为临床医生理解模型决策、建立诊断信心提供了有力工具，也为探索疾病背后的神经生理机制提供了新线索。

与现有的状态模型（SOTA）相比，本研究提出的框架在分类精度和可解释性深度上均具有竞争力。例如，本模型在10折交叉验证下的性能优于许多仅关注分类或解释性有限的现有研究。此外，该框架具有线性时间复杂度，相对于需要大量计算资源的深度模型，它是一个计算高效的“轻量级”方案，更易于在临床环境中部署。

研究的局限性包括所使用的两个数据集的样本量相对有限，未来需要在更大规模、更多样化的数据集上进一步验证。尽管如此，这项工作为开发下一代临床辅助诊断系统指明了一个有前景的方向：将先进的特征工程、强大的分类算法和直观的可解释人工智能技术相结合，以推动神经科学研究和临床神经病学实践向更精准、更透明、更可信赖的方向发展。

热点排行