基于脉冲时序的可塑性(STDP)长期以来一直是突触学习的基础模型,其理论基于赫布原理(Hebbian principle),即因果相关的脉冲会增强突触强度(Bi和Poo,1998年;Markram等人,1997年)。当突触前神经元在突触后神经元之前放电时,会发生长时程增强(LTP);如果顺序相反,则会发生长时程抑制(LTD)。这种成对机制得到了大量实验证据的支持,并已被成功用于脉冲神经网络(SNNs)的学习模型(Bi和Poo,2001年;Sj?str?m等人,2001年)。基于STDP的无监督学习方法也被证明能够有效地从自然场景中提取视觉特征(Ferré等人,2018年;Kheradpisheh等人,2016年;Masquelier和Thorpe,2007年)。当这些模型与竞争性抑制或卷积层结合使用时,在MNIST、CIFAR-10和ETH-80等分类基准测试中表现出色。
尽管STDP在生物学上具有合理性,但在计算环境中存在两个主要限制。首先,它依赖于毫秒级的脉冲时序精度,这在嘈杂的环境中(如大脑皮层)难以实现和维持(Markram、Gerstner、Sj?str?m,2011年;Markram、Gerstner、Sj?str?m,2012年)。其次,其成对性质导致计算复杂度为二次方(见附录A),因为它需要评估所有突触前后的脉冲配对。这些限制影响了模型的可扩展性和鲁棒性,尤其是在深度或实时神经形态系统中(Tian等人,2025年)。
为了克服这些限制,最近的研究开始将更高阶的特征和群体层面的信息纳入突触可塑性模型。值得注意的是,实证发现表明,即使在没有直接脉冲对因果关系的情况下,协调的脉冲活动或神经元同步性也在有效的突触修饰中起着关键作用(Becker等人,2025年;Tian等人,2025年)。这促使人们开发了基于脉冲同步性的可塑性模型(SSDP),它通过根据神经元群体之间的同步程度来调整权重更新(Tian等人,2025年),从而提高了学习稳定性并更好地反映了生物学上的可塑性特征。
在此基础上,我们提出了一组基于一致性的可塑性规则,包括Spike Agreement-Dependent Plasticity (SADP)及其基于相关性的变体Spike Correlation-Dependent Plasticity (SCDP)。这两种模型都将突触可塑性重新定义为脉冲序列一致性的函数,而非精确的脉冲时序。SADP使用Cohen的κ来衡量突触前后活动的校正后一致性,而SCDP使用原始的皮尔逊相关系数来捕捉脉冲的协同发射强度。这种区别使SADP在脉冲发射稀疏的情况下仍能保持稳定性,而SCDP则更能适应模拟设备的非线性特性,共同构成了一个基于一致性的通用学习框架。
SADP和SCDP通过消除成对的脉冲比较来减少计算负担,实现了适合事件驱动硬件实现的线性时间更新。从生物学角度来看,SADP符合当前对可塑性的理解,即它不仅受脉冲时序的影响,还受到膜动态、神经调节剂和群体活动模式的影响(Clopath等人,2010年;Foncelle等人,2018年;Pfister和Gerstner,2006年)。其与多种可塑性特征的兼容性使其成为神经形态系统中快速、高效、可解释且局部学习的理想候选者。
SADP代表了超越STDP和SSDP的概念性和实践性进展:它以生物学为基础,并在计算上可行,为下一代在实际环境中运行的脉冲神经网络奠定了基础。
我们的主要贡献在于概念上的创新:我们将突触学习重新定义为脉冲序列对齐的函数,实现了稳健且生物学上合理的学习机制,适用于嘈杂、由群体驱动的神经动态环境。与以往将新学习规则与复杂网络架构或任务特定修改相结合的方法不同,我们的方法不依赖于特定架构,并且与标准的脉冲神经元模型兼容。因此,这项工作不仅为脉冲驱动的学习提供了新的视角,还为其在神经形态学和生物学背景下的稳定性和适用性提供了数学上的严谨基础。在第2节中,我们将详细讨论STDP的历史以及向基于脉冲同步性的可塑性(SSDP)发展的最新研究方向。随后,在第3节中我们将详细介绍我们的SADP方法。
本研究的位置
需要强调的是,这项工作并不声称能够立即在硬件上实现或进行深度多层扩展。我们的目标是引入SADP和SCDP作为原理性的局部可塑性规则,这些规则能够提高学习速度和鲁棒性,同时为未来的硬件实现做好准备。目前的实验仅限于单层网络和基于软件的模拟,作为概念验证。
在本研究中,没有直接在神经形态学芯片上执行任何算法。我们的工作硬件部分包括从离子晶体管中提取增强/抑制响应,并将其纳入经过设备校准的SADP或SCDP内核中。设备校准指的是根据物理设备的实验测量导电性调制曲线直接参数化学习内核。这种校准确保了模拟的可塑性动态能够真实反映底层硬件的非线性和不对称行为,从而在算法学习规则和设备物理之间建立了原则性的桥梁。这应被视为设备校准的验证,而非实际部署。
与依赖于同步性的可塑性不同,后者通过集合时序来调整STDP,SADP和SCDP完全放弃了因果关系,而是分别采用Cohen的κ和皮尔逊相关系数等统计一致性指标来捕捉时间窗口内的协同激活。这种概念上的转变既保证了统计上的鲁棒性,又实现了设备特定内核非线性的直接整合,这是以前未曾探索过的组合。
主要贡献 本工作的关键贡献总结如下:
1.我们提出了一组无监督学习规则SADP和SCDP,它们根据突触前后脉冲序列之间的统计一致性来调整权重更新,分别使用Cohen的κ和皮尔逊相关系数。
2.我们为这些规则引入了一种灵活的内核化表述方式,允许通过样条插值高效实现特定于设备的权重更新曲线,使规则与新兴的基于晶体管的神经形态硬件高度兼容。
3.我们在无监督图像分类任务(MNIST和Fashion-MNIST)上对这些规则进行了实证验证,证明它们在多种编码方案和网络配置下比传统的STDP具有更好的性能和鲁棒性。