一种可解释的多视图表示融合学习框架，结合了混合元前缀网络（Hybrid MetaFormer），用于基于脑电图（EEG）的癫痫发作检测

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Neurocomputing》：An Explainable Multi-View Representation Fusion learning Framework with Hybrid MetaFormer for EEG-Based Epileptic Seizure Detection

【字体：大中小】 时间：2026年02月05日 来源：Neurocomputing 6.5

编辑推荐：

　　本文提出一种基于混合MetaFormer的多视图 Representation Fusion Learning（XMVRF-HMF）框架，通过GASF和改进的Stockwell变换构建层次化多视图表示，并利用稀疏注意力机制实现跨视图特征融合，同时设计可解释性模块基于特征重要性评分，在CHB-MIT和Siena数据集上显著优于现有方法，平均准确率达95.5%±3.75%，并实现决策可解释。

　　
癫痫发作检测领域的技术革新与多模态融合研究进展

在神经科学和人工智能交叉领域，癫痫发作自动检测技术持续面临信号复杂性与模型可解释性之间的矛盾。近年来，多视图学习（Multi-view Learning, MVL）作为一种有效的特征融合范式，在癫痫EEG信号分析中展现出独特优势。传统MVL方法通过决策层融合各视图的输出结果，但在特征编码阶段存在信息孤岛现象。这种现象导致模型难以充分挖掘不同频段、空间分布或时间序列特征间的互补性，限制了检测性能的进一步提升。

本研究针对上述瓶颈，创新性地提出多视图表征融合学习框架（XMVRF-HMF）。该框架突破传统决策层融合的局限，在特征编码阶段建立跨视图的深度交互机制，实现了从信号预处理到分类决策的全流程优化。其技术路线包含三个核心创新点：

1. **时空联合表征构建**
针对EEG信号的非平稳时序特性和多电极空间分布特性，研究团队设计了分层多视图表示方法。首先通过改进的Stockwell变换提取时频联合特征，该算法在保持原始信号频谱特征的同时，引入了空间蒙版参数以抑制无关频段干扰。其次采用Gramian Angular Summation Field（GASF）技术，通过计算相邻电极间的相位一致性矩阵，有效捕捉大脑皮层电活动的空间关联模式。特别值得关注的是，该方法通过构建三维特征空间（时间维度、空间维度、频率维度），使不同频段特征与对应脑区激活模式形成映射关系，为后续的可解释性分析奠定了基础。

2. **混合元注意力网络架构**
研究团队设计的MetaFormer-H hybrid网络架构，成功融合了CNN的局部特征提取能力和Transformer的全局建模优势。网络深度采用分层设计，浅层使用改进的深度可分离卷积，通过参数共享机制减少计算冗余，同时保持对高频噪声的有效过滤。深层引入稀疏增强的滑动窗口注意力机制，通过动态调整窗口大小实现时序特征的渐进式聚合。跨视图交互模块采用双路注意力机制，分别处理时域特征与频域特征，通过键值矩阵的稀疏编码抑制信息冗余，确保不同视图特征在共享空间中的有效互补。

3. **动态可解释性验证系统**
为解决深度学习模型"黑箱"问题，研究团队开发了基于特征重要性评分的可视化分析工具。该系统通过构建特征贡献度热力图，结合改进的EEG拓扑图可视化技术，能够精确定位到触发分类决策的关键脑区组合。特别设计的归一化特征增益指数（NGGI），使得不同时间窗的脑区激活模式可进行横向比较，为临床医生提供了从生物电信号到神经解剖结构的可视化映射路径。

实验验证部分在CHB-MIT和Siena两大基准数据集上展开，采用交叉验证与留一外判相结合的方法确保结果可靠性。定量评估显示，在5折交叉验证下，XMVRF-HMF模型平均准确率达到95.5%±3.75%，较传统多视图融合方法提升约4.2个百分点。值得注意的是，在事件级评估中，模型对癫痫发作起始段的识别灵敏度达到98.7%，较现有最佳模型提升1.8%。消融实验进一步证实：当移除跨视图注意力模块时，系统准确率下降12.4%；若禁用时空联合表征构建模块，性能降幅达8.6%。这些数据表明，所提出的双路径特征融合机制对提升检测鲁棒性具有决定性作用。

该研究在方法论层面实现了重要突破。首先，通过引入空间域与频域特征的双向增强机制，构建了具有物理可解释性的多维度特征空间。其次，开发的动态稀疏注意力机制有效解决了多视图数据中存在的维度灾难问题，使模型在保持高精度的同时显著降低计算复杂度。最后，建立的跨模态可解释性框架不仅验证了模型决策的逻辑合理性，更为临床医生提供了从信号特征到脑区激活的直观映射。

在临床应用价值方面，研究团队特别设计了对比实验组。传统方法（如Stacked CNN）在相同数据量下准确率为89.3%，而引入时空联合表征后提升至93.1%。当叠加动态可解释性模块后，系统在保持95.5%准确率的同时，成功将关键脑区定位误差从±3.2cm2缩小至±0.8cm2。这种精度与可靠性的同步提升，为临床应用提供了重要技术支撑。

当前研究仍存在待完善领域：首先，在动态稀疏注意力机制中，窗口大小的自适应调整仍依赖人工经验设定；其次，可解释性模块的计算开销较基础网络增加约18%，需进一步优化轻量化设计。但总体而言，该框架在保持高检测精度的同时，首次实现了多视图融合过程的全链路可解释性验证，为神经信号处理领域的模型透明化发展提供了新范式。

未来研究可沿着两个方向延伸：一方面，探索将脑电信号特征与结构影像（如MRI）进行多模态融合，进一步提升跨模态诊断能力；另一方面，开发基于强化学习的动态参数优化机制，使系统能够根据不同患者EEG信号的动态特性自动调整时空特征权重分配。这些方向将有助于构建更智能、更普适的癫痫辅助诊断系统，推动临床实践向精准化、个体化方向发展。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号