复数值扩展型尖峰神经网络

【字体: 时间:2026年03月13日 来源:Neural Networks 6.3

编辑推荐:

  提出复杂值加权脉冲神经网络(CWSNN),将脉冲时间与膜电位导数分别编码为复数实部和虚部,实现时空特征统一处理,在分类和回归任务中显著优于传统SNN。

  
Fang Liu|Witold Pedrycz|Qi Xu|Lijun Liu|Jialin Xu|Jie Yang|Wei Wu
大连民族大学数学科学学院,中国大连,116600

摘要

传统的脉冲神经网络(SNN)仅向下游神经元传输脉冲时间,忽略了丰富的亚阈值动态,从而限制了网络容量。为了解决这个问题,我们提出了一种复数值扩展脉冲神经网络(CWSNN),它在复数神经元的实部和虚部分别编码时间信息(脉冲时间)和空间信息(亚阈值膜电位导数)。这种设计使得时空特征能够同时被处理和交互,有效扩展了网络容量,而无需增加网络深度。在七个表格数据和四个图像数据集上的实验表明,CWSNN在准确性、收敛速度和泛化能力方面均优于现有的SNN,并且在回归任务上也表现出了竞争力,而这些任务对传统SNN来说仍然具有挑战性。

引言

由于脉冲神经网络在低功耗启发式计算和模拟人脑方面的巨大潜力,它们已成为研究的热点(Wang等人,2024年)。与传统的人工神经网络(ANN)不同,SNN以事件驱动的方式执行神经计算,并通过离散的脉冲模式传递信息(Azimirad等人,2024年)。然而,SNN目前的性能仍然落后于ANN(Tavanaei等人,2019年)。
为了提高SNN的性能,一个流行的研究方向是寻找适合离散脉冲机制的有效训练算法。脉冲时间依赖性可塑性(STDP)是一种无监督学习算法,可以模拟突触权重的生物调整(Zhang等人,2024年)。间接监督学习方法主要依赖于将训练好的ANN的权重转移到结构相同的SNN中(Xu等人,2023年)。直接监督学习方法,如梯度下降法(Zhang等人,2021年)和变体STDP(Mozafari等人,2019年),通过解决不可微问题或将STDP类规则与远程监控相结合来调整权重。尽管这些学习方法很有前景,但它们仍然无法使SNN达到与ANN相同的水平。
另一个研究方向是优化网络结构(Yan等人,2024年)。一个想法是以某种方式提取更有效的特征,以帮助SNN更好地解决问题。例如,Xu等人使用具有强大特征提取能力的CNN为SNN提取特征,并提出了CNN和SNN的结合模型(Xu等人,2018年)。但该框架的结果无法与其他先进的SNN进行比较。Wang等人提出了一个基于时空压缩脉冲特征的框架(Wang等人,2021年)。然而,由于结构限制,这种轻量级网络框架难以扩展到深度网络。
另一个流行的想法是加深SNN。例如,hybridSNN通过数据驱动的贪婪优化结合多个简单的SNN来构建深度SNN(Shen等人,2023年)。MS-ResNet是一种具有基于膜捷径的SNN架构,利用块动态等距性实现梯度范数相等,从而实现深度且行为良好的SNN(Grimaldi等人,2024年)。然而,由于缺乏完美的训练技术,深度SNN仍然难以达到理想水平。
实际上,除了网络深度之外,还有另一种选择。ANN的宽度(即全连接层中的隐藏神经元数量或卷积层中的通道数量)也被证明对模型性能的影响不亚于深度,因为它可以使每一层学习更丰富的特征(Hou等人,2017年)。LeCun等人还指出,具有较少层的宽网络很可能在性能上与深度网络相当(LeCun等人,2015年)。更重要的是,在浅层宽网络中使用梯度下降方法没有额外的负担或难度。在宽网络中,同一层中的每个神经元以相同的方式工作并处理相同的信息。然而,一些神经生理学研究表明,来自不同输入模态(视觉或听觉、词汇或非词汇)的输入会在大脑的相同区域汇聚和处理(Costanzo等人,2013年)。受此启发,我们打算构建一个能够在单个神经元内处理不同类型信息的宽SNN。
众所周知,在传统的SNN中,突触后神经元整合突触输入以更新其内部状态,即膜电位,并在膜电位达到阈值时发射一个脉冲。在这种范式下,只有脉冲时间信息被明确传递给下游神经元,而丰富的亚阈值动态被丢弃,这可能导致潜在有用信息的丢失。在我们之前的工作中(Liu等人,2022年),我们通过利用发射时刻的膜电位导数(称为发射强度)来定义神经元的贡献程度,并调节其向下游神经元传递脉冲的能力,从而迈出了缓解这一限制的第一步。虽然这种策略表明膜电位动态超出脉冲时间是有益的,但发射强度主要用作辅助调制信号,并没有作为统一的神经元输出与脉冲一起明确传播。因此,脉冲时间和发射强度之间的交互仍然是间接的,整体神经元通信机制仍然由单通道脉冲表示主导。
生物物理学研究表明,负责不同脉冲启动动态的相同缓慢激活的亚阈值电流也调节亚阈值电压轨迹,正是这些阈值效应的不可分割的组合决定了神经元的操作模式(Ratté等人,2015年)。从这个角度来看,发射时刻的膜电位导数为潜在的阈值动态提供了一个紧凑且可观察的总结,捕捉了亚阈值过程如何影响脉冲生成,而不仅仅是时间。受此观察的启发,我们将脉冲时间和发射强度建模为互补信号,使下游神经元能够在统一的脉冲框架内访问时间信息和与强度相关的神经元状态描述符。与之前的工作(Liu等人,2022年)不同,本研究不再将发射强度视为辅助调制因素,而是将其明确整合到前向信息路径中,作为神经通信的核心组成部分。
从信息表示的角度来看,脉冲时间和发射强度可以分别解释为时间和空间信息处理的结果。这里,时间信息指的是神经元何时发射,而空间信息描述了神经元在发射时刻的瞬时激活状态。尽管一些关于SNN的研究表明时间和空间整合可以共存(Hwang等人,2021年),但他们提到的空间信息通常指的是神经元或层的相对位置。例如,Qu等人使用时间编码和神经元的相对位置来表示用户滑动动态和手指压力的时间和空间特征(Qu等人,2015年)。Wu等人提出了一种时空反向传播算法,通过结合逐层空间域和时间依赖的时间域来训练高性能SNN(Wu等人,2018年)。这些模型仍然主要通过脉冲时间来向前传播信息。与此不同,本文旨在通过发射强度提取每个神经元的时间信息,类似于ANN的连续空间特征。
复数是一种自然且完美的双信号存储器。复数值神经网络(CVNN)(Lee等人,2022年)已被证明在某些分类任务中优于实数值网络,例如XOR,这些任务可以通过单个复数值神经元解决,而实数值神经元无法解决(Liu和Liu,2019年)。Amin等人还证明,单层CVNN可以匹配或超过多层实数值网络的性能(Amin和Murase,2009年)。CVNN的成功归功于强大的复数值计算能力,这有助于提高网络性能。
神经科学研究表明,人脑是一个复杂的、集成的时空系统(Shen等人,2021年),其中空间(哪个神经元发射)和时间(何时发射)都携带信息,通过认知功能进行处理(Wang等人,2018年),并且大脑的时间和空间认知路径涉及在海马区重叠和交互的系统(Eichenbaum,2017年)。在海马回路中,时间和空间信息可以在皮下和皮层路径中分别表示,并且也在CA1中完全整合(Eichenbaum,2017年)。受这种层次化但集成的机制的启发,我们设计了一个框架,通过互补路径明确建模时间和空间特征,然后通过整合阶段捕获它们的联合表示。为了实现这一点,我们提出了一种通过提取和处理时空双信息(脉冲时间和发射强度)的不可见扩展脉冲神经网络,即复数值扩展脉冲神经网络(CWSNN)。具体来说,脉冲时间放在复数的实部,而发射强度存储在相应的虚部。这种设计允许每个突触后神经元同时传递这两种类型的信息,有效扩展了网络,而无需增加神经元数量,同时保持与生物学原理的一致性。
本文的原创性在于:与传统的SNN(Azimirad等人,2024年)不同,后者通常丢弃空间信息(由发射强度表示)并仅关注时间信息(脉冲兴奋时间),所提出的CWSNN提取了这两种类型的信息。这两种不同的信息使用复数存储在单个神经元中,有效地将神经元的存储容量翻倍,并实现了网络的不可见扩展。通过使用复数值运算,时间和空间信息可以在从一层流到另一层的过程中重叠和交互,紧密模仿大脑的认知过程。这些创新使SNN能够实现更高水平的认知功能,在网络容量和信息处理方面取得了显著进步。
本文的其余部分组织如下:第2节介绍了CWSNN的结构及其学习算法。第3节介绍了评估CWSNN性能的分类实验以及决定CWSNN是否可用于解决回归问题的回归实验。最后,第4节提供了结论。

部分摘录

脉冲神经网络

SNN中的神经元通过多个突触随时间传输离散的脉冲列来传递信息(Nie等人,2022年)。在输入到SNN之前,必须将输入数据转换为脉冲时间,这个过程称为编码。在各种编码策略中,群体编码(Bohte等人,2002年)是最广泛采用的方法之一。具体来说,每个输入变量xn?∈?{x1, ???, xN}使用M个均匀重叠的高斯感受野进行编码,从而将一个N维的

实验

为了全面评估CWSNN的性能,本节展示了分类和回归任务的实验结果。具体来说,分类实验是在复杂性和规模逐渐增加的数据集上进行的,包括七个表格数据集和四个图像数据集。这些数据集从小规模的表格基准测试(用于机制验证),到中等规模的多类数据集(Statlog Landsat)(用于可扩展性分析),再到大规模图像数据集

结论

在这项工作中,我们成功开发了一种通用网络范式,它在分类任务上表现优异,同时也解决了回归问题。这是通过同时从脉冲层提取时空信息,并使用复数值运算来处理、交互并在输出层融合这些时空信息来实现的。结果表明,该网络适用于各种数据集,具有很好的适应性

CRediT作者贡献声明

Fang Liu:撰写 – 审稿与编辑,撰写 – 原始草稿,验证,软件,方法论。Witold Pedrycz:撰写 – 审稿与编辑,监督,资金获取。Qi Xu:监督。Lijun Liu:监督,资金获取。Jialin Xu:软件。Jie Yang:撰写 – 审稿与编辑,监督,方法论,资金获取。Wei Wu:监督。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作得到了中国国家重点研发计划(项目编号2018AAA0100300)、国家自然科学基金(项目编号62176040、62172073、62076182、61002039)、辽宁省科技计划联合项目(技术研发项目)(项目编号2024JH2/102600090)以及2025年辽宁省博士研究启动基金项目(编号2025-BS-0270)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号