星形胶质细胞门控多时间尺度可塑性：深度脉冲神经网络的在线持续学习新机制

《Frontiers in Neuroscience》：Astrocyte-gated multi-timescale plasticity for online continual learning in deep spiking neural networks

【字体：大中小】 时间：2026年01月27日 来源：Frontiers in Neuroscience 3.2

编辑推荐：

　　这篇综述提出了一种受生物启发的星形胶质细胞门控多时间尺度可塑性（AGMP）框架，用于解决深度脉冲神经网络（SNNs）在线持续学习（CL）中的稳定性-可塑性困境。该框架通过引入慢速星形胶质细胞状态变量作为第四因子，动态门控突触可塑性，在保持恒定O(1)内存复杂度的同时，显著缓解灾难性遗忘，为神经形态计算提供了生物可解释的硬件友好路径。

¹引言

脉冲神经网络（SNNs）因其事件驱动的稀疏计算特性，成为能效比高的机器智能范式，特别适合处理神经形态硬件产生的动态感觉流。然而，深度SNNs的在线持续训练面临严峻挑战。标准的通过时间反向传播（BPTT）因需存储时间历史而产生巨大的内存瓶颈，而局部可塑性规则往往难以平衡新信息快速获取与旧知识保留之间的权衡，即稳定性-可塑性困境。

受生物系统中三方突触的启发，本文提出了星形胶质细胞门控多时间尺度可塑性（AGMP）。这是一个可扩展的在线学习框架，它通过广播教学信号和新颖的星形胶质细胞介导的门控机制来增强资格迹。这种慢速的星形胶质细胞变量整合神经元活动，动态调节可塑性，在稳定状态下抑制更新，同时在分布变化时启用适应。AGMP在神经形态基准测试中达到了与离线BPTT相竞争的准确率，同时保持恒定的O(1)时间内存复杂度。在严格的类增量持续学习场景中，AGMP无需重放缓冲区即可显著缓解灾难性遗忘。

²相关研究

深度SNN训练方面，替代梯度（SG）方法通过平滑Heaviside阶跃函数的导数，使得利用BPTT优化SNNs成为可能，但BPTT是离线的、内存密集的算法。在线学习与资格迹方面，电子传播（e-prop）等算法将梯度分解为突触局部资格迹和广播学习信号，实现了O(1)时间内存复杂度的在线学习，但主要解决在线学习而非持续学习问题。持续学习与稳定性-可塑性方面，弹性权重巩固（EWC）等方法需要计算Fisher信息矩阵，在纯在线流式设置中计算昂贵。星形胶质细胞在神经形态计算中的作用逐渐受到关注，计算模型开始探索星形胶质细胞用于监督学习，例如星形胶质细胞调节的STDP，但多局限于浅层架构或简化任务。

³提出的方法

^3.1脉冲神经元动力学

采用泄漏积分发放（LIF）模型及其自适应变体（ALIF）作为计算单元。神经元膜电位根据包含泄漏、突触前输入、偏置和阈值重置的公式演化。输出脉冲通过确定性阈值机制生成。ALIF神经元的阈值是动态的，包含基线阈值、适应衰减和脉冲后阈值增幅，有效模拟发放率适应，为网络提供更长的工作记忆。

^3.2基于资格迹的梯度下降

使用替代梯度方法解决脉冲生成函数的不可微问题。资格迹递归地维持突触前输入与突触后状态相关性的衰减记忆。学习信号采用自上而下的误差广播，对于隐藏层，使用固定随机矩阵直接投影全局误差向量，避免生物不可信的对称权重传输。

^3.3星形胶质细胞门控多时间尺度可塑性（AGMP）

AGMP引入了第四因子：一个缓慢的、星形胶质细胞介导的门控变量。

^3.3.1生物学动机与动力学

每个神经元关联一个标量星形胶质细胞状态，其在远慢于神经元和突触的时间尺度上演化。驱动函数表示局部活动负荷，整合了膜电位、突触输入和输出脉冲。高值的星形胶质细胞状态表明神经元在近期持续活跃或受到高度刺激。

^3.3.2上下文感知门控与更新规则

将星形胶质细胞状态转化为可塑性调节器，涉及层级的移动统计量归一化和S型函数门控。门控因子定义为归一化状态的S型函数，作为所有传入突触的突触后共享调节器，与调节局部体积的星形胶质细胞域生物学一致。功能上，这类似于Adam或RMSProp中的动态学习率，但由局部代谢活动而非梯度统计驱动。

最终的突触权重更新是资格迹、广播误差和星形胶质细胞门控因子的乘积，并包含权重衰减项。该规则在空间上（除广播误差外）和时间上都是局部的，无需存储历史，满足O(1)内存约束。此外，在偏置项上实现了轻量级稳态机制，防止发放率漂移。

在计算复杂度方面，AGMP提供了明显优势。对于具有N个神经元和S个突触的网络，在T个时间步上训练，AGMP需要O(N+S)的空间复杂度，是时间恒定的，而BPTT需要O(T·N)。两种方法都会产生O(T·S)计算操作，但AGMP的恒定内存占用使得能够在内存受限的边缘设备上训练更深的网络和更长的序列，而不会内存溢出。

⁴实验结果

^4.1实验设置

在神经形态和音频数据集上评估，包括N-Caltech101、DVS128 Gesture、SHD等。比较基线包括离线监督学习、在线/局部学习规则和持续学习策略。

^4.2标准基准测试性能

AGMP在标准基准测试中一致优于现有的在线学习规则，并与离线BPTT方法相竞争。特别是在具有显著噪声和类别不平衡的N-Caltech101数据集上，AGMP的测试准确率达到73.80%，显著优于资格迹方法。在时序处理基准SHD上，AGMP达到80.10%，优于最新的在线算法。AGMP在保持神经形态硬件所需的严格局部性的同时，缩小了在线学习和离线学习之间的准确率差距。

^4.3持续学习性能

在Split N-MNIST和更具挑战性的Split CIFAR-100上评估持续学习性能。AGMP表现出对灾难性遗忘的显著鲁棒性。在Split N-MNIST上，其平均准确率显著优于正则化方法，遗忘率有限。在Split CIFAR-100上，AGMP的优势更加明显，最终准确率接近非重放基线的两倍。虽然基于重放的方法GEM通过显式存储原始输入样本获得了更高的准确率，但AGMP提供了一个有吸引力的折衷方案：它在不涉及重放相关的隐私问题和内存开销的情况下，显著优于非重放基线，并缩小了与重放方法的差距。

^4.4效率与消融分析

在效率方面，AGMP相比标准BPTT减少了约40%的突触操作，因为稳态调控鼓励稀疏表征。消融研究证实了每个组件的贡献：移除星形胶质细胞门控在稳态任务上导致性能可忽略的下降，但在持续学习任务上造成灾难性性能崩溃，确认了门控在稳定性中的特定作用。移除资格迹在时序任务上导致大幅下降，验证了迹对于时序信用分配的必要性。敏感性分析表明，当星形胶质细胞时间常数显著大于资格迹时间常数时，可获得最佳稳定性，支持多时间尺度假设。

⁵结论

AGMP通过将三因子可塑性范式理论扩展至包含慢速生物启发的星形胶质细胞状态，协调了快速时序信用分配与缓慢的、诱导稳定的调控。该研究填补了计算神经科学与神经形态工程之间的重要空白，表明在ANN设计中常被忽视的非神经元细胞在解决稳定性-可塑性困境中起着关键作用。AGMP代表了向能够持续终身适应的自主、高能效智能迈出的重要一步。

热点排行

新闻专题