传感器运动驱动了主动神经元胞自动机中的注意力机制与可扩展性

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2026年03月09日 来源：Neural Networks 6.3

编辑推荐：

　　本研究提出基于神经细胞自动机（ANCA）的主动感知模型，受大脑皮层结构启发，通过动态传感器运动实现图像分类。实验表明，ANCA在MNIST等任务中保持90%以上零样本精度，系统可按需扩展或缩减规模，并在70%传感器失效时仍维持性能，为具身智能系统提供新思路。

Mia Kvalsund|Kai Olav Ellefsen|Kyrre Glette|Sidney Pontes-Filho|Mikkel Elle Lepper?d

挪威奥斯陆大学物理系

摘要

大脑的分布式架构激发了许多人工智能（AI）系统的灵感，尤其是其新皮质组织结构。然而，当前的人工智能方法在很大程度上忽略了生物智能的一个关键方面：主动感知——即感官器官的有意识运动以探索环境。为了研究传感器运动如何影响图像分类任务中的行为，我们引入了主动神经元胞自动机（ANCA），这是一种受新皮质启发的模型，具有可移动的传感器。在ANCA中，主动感知自然出现，它基于信念进行探索，并对显著信息表现出关注行为，而无需添加显式的注意力机制。我们证明了主动感知简化了分类任务。此外，主动感知使得ANCA可以在不丢失信息的情况下比图像尺寸更小，这使其具有高度的可扩展性。我们展示了在3类MNIST任务中，随着系统规模的增加或减少，ANCA的准确率仍能保持在90%以上。这种可扩展性使得ANCA在某些故障情况下仍能保持90%以上的准确率，即使有高达70%的传感器被“静默”（即停止工作）。总体而言，我们的工作为分布式架构如何与运动交互提供了见解，为具有感知能力的智能体中的自适应AI系统开辟了新的途径。

引言

新皮质在感知、决策、语言和记忆中起着核心作用，表现出显著的可塑性和对损伤的抵抗力。这自然地启发了许多AI系统的架构（Fukushima, 1980, George, Hawkins, 2009, Kohonen, 1990）。然而，极少有AI模型考虑了传感器运动的影响，忽略了主动感知是动物感知的一个特征（Gilchrist, 2011, Nelson, MacIver, 2006, Petersen, 2019, Wachowiak, 2011, Yang, Wolpert, Lengyel, 2016）。与静态分类图像的AI系统不同，主动感知允许关注传感器空间中的显著部分。随着AI社区对具身AI的兴趣增加，以及具身图灵测试的提出（Zador et al., 2023），主动感知作为更具身化的传感器处理方法变得越来越重要。

传感器运动在生物体感知和理解世界的过程中起着关键作用。例如，体感皮层不仅仅是处理传感器输入；它还向运动中枢传递信息（Petersen, 2019, Rathelot, Dum, Strick, 2017）。在啮齿动物的胡须桶状皮层中，特定的柱状结构具有帮助在探索性胡须摆动时移动胡须的运动通路（Petersen, 2019）。猴子中的类似发现（Rathelot et al., 2017）表明，体感皮层在运动中的作用比之前认为的更为频繁（Petersen, 2019）。同样，运动信息与感觉信息在感觉皮层中一起处理（Kandel et al., 2021, p. 464, 583）。此外，大多数感官都是主动的。常见的例子包括嗅觉（Wachowiak, 2011）和视觉扫视，即眼睛在兴趣点之间快速移动（Gilchrist, 2011）。这两个事实——运动控制在体感皮层中的整合以及大多数感知都是主动的——促使研究人员重新认识到传感器运动在感知和学习中的重要性（Ahissar, Assa, 2016, Rao, 2024）。基于这些见解，我们假设在人工系统中整合有意运动可能会增强其在传感器处理方面的能力。

类似的想法已经在进化机器人学中得到探索，特别是在主动分类感知中，其中智能体会进化出塑造自身感知输入的感运动策略。经典研究（Beer, 2003, Nolfi, 2002, Nolfi, Parisi, 1996, Tuci, Massera, Nolfi, 2010）表明，通过进化可以产生有效的运动策略，从而更有效地区分两个类别。这项工作早期证明了感知是一个依赖于动作的过程，从静态感觉输入转向了感运动耦合。我们的方法将这一原则扩展到了机器人学之外，表明在图像分类任务中，主动感知也可以出现在模块化的分布式架构中。

受新皮质启发的系统中，分布式架构很常见。一个著名的例子是卷积神经网络（CNNs），其前身（Fukushima, 1969, Fukushima, 1980）受到视觉皮层中眼优势柱的启发（Hubel and Wiesel, 1962）。同样，自组织映射（SOMs）（Kohonen, 1990）用于降维和聚类，其灵感也来自哺乳动物的体感皮层。一个较新的例子是分层时间记忆（HTM）模型（George and Hawkins, 2009），它使用典型的皮质柱模型进行各种分类任务和时间序列处理。这些同质的分布式系统有几个优点。首先，参数共享允许使用更少的参数进行优化，从而实现更节省资源的训练。同质的模块化系统通常还具有高冗余性和可扩展性，这提高了对部分损坏的鲁棒性。

特别是像神经元胞自动机（NCA）这样的分布式架构，或者一般的消息传递集合，受益于冗余性和去中心化（Mordvintsev, Randazzo, Niklasson, Levin, 2020, Mousavi, Nazari, Taká?, Motee, 2019, Pathak, Lu, Darrell, Isola, Efros, 2019）。NCA使用单一的神经核来处理图像或网格的每个邻域随时间的变化，类似于CNN的卷积层。与CNN不同，核在时间步长t的输出从未通过池化或卷积进行压缩，而是简单地添加到计算基底中，以便网络在时间步长

t + 1

再次接收（Medvet, Bartoli, De Lorenzo, Fidel, et al., 2020, Mordvintsev, Randazzo, Niklasson, Levin, 2020, Pontes-Filho, Walker, Najarro, Nichele, & Risi, Randazzo, Mordvintsev, Niklasson, Levin, Greydanus, 2020）。缺乏中心化意味着该架构没有固定的大小。因此，NCA可以在训练后改变模型的大小，而这在CNN中是具有挑战性的。由于其分布式架构和局部信息交换的特点，NCA非常适合创建受皮质柱启发的AI模型。

在这项工作中，我们受到啮齿动物胡须桶状皮层的启发，该皮层被认为同时具有传感器运动和分布式特性。桶状皮层的结构已经被广泛研究：一层称为桶或柱的神经模块与啮齿动物鼻子上的胡须一一对应（Kandel, Koester, Mack, Siegelbaum, 2021, Petersen, 2019, Woolsey, Van der Loos, 1970, p. 457）。这些桶处理来自胡须的输入并帮助控制它们，并且与相邻的桶之间连接稀疏（Petersen, 2019）。基于这种结构，桶状皮层可以被抽象为一个独立模块的消息传递集合。所提出系统的简单性为我们探索分布式系统中传感器运动的行为提供了理想的基础。考虑到运动可能发育不全的可能性，我们试图研究在真实数据上训练时传感器是否会移动，以及移动系统与非移动系统相比是否有任何优势或劣势。

为了回答这些问题，我们提出了主动神经元胞自动机（ANCA）：这是一种新型架构，它在NCA的基础上增加了对传感器场的动态控制，实现了在胡须桶状皮层中观察到的主动感知行为。我们展示了ANCA表现出新兴的主动注意力，因为传感器场有目的地移动并汇聚在显著点上。这种机制通过忽略任务空间中的无关部分简化了图像分类。此外，其分布式特性使得ANCA具有可扩展性，而且运动对于保持系统性能至关重要。此外，ANCA表现出对系统扰动的良好容错能力，这表明ANCA可能适用于具有分布式传感器的具身机器人。总体而言，我们的结果表明，注意力行为可以在分布式感运动系统中出现，这是它们能够有意移动的直接结果。与具有显式注意力模块的NCA（例如，Tesfaldet et al., 2022）不同，ANCA的注意力行为是在没有显式注意力模块的情况下出现的。虽然这对对象识别和决策很有用，但这一关键见解也有助于理解感知和注意力在移动系统中的联系。这为进一步研究具有运动能力的机器人中分布式AI系统的优势铺平了道路。

小节片段

神经元胞自动机

神经元胞自动机（NCA）是一类循环网络架构，最初作为可微分模型出现在Mordvintsev等人的工作中（2020）。它最初用于探索形态发生，但后来也被用于分类（Randazzo, Mordvintsev, Niklasson, Levin, Greydanus, 2020, Walker, Palm, Moreno, Faina, Stoy, Risi, 2022, Yang, Deutges, Navab, Sadafi, Marr, 2025）和控制任务（Pontes-Filho, Walker, Najarro, Nichele, & Risi,

该系统可以分类复杂数据

ANCA在标准的机器学习基准测试MNIST（Deng, 2012）、Fashion-MNIST（Xiao et al., 2017）和CIFAR-10（Krizhevsky et al., 2009）上进行了测试。由于CMA-ES优化导致的长时间训练，我们选择了4个类别：飞机、船只、马和鹿。选定的数据集提供了逐渐增加的复杂性水平，使我们能够系统地评估ANCA在不同场景下的性能。无论是简单对象还是复杂对象，

讨论

我们已经证明，为简单的NCA架构赋予有意运动会导致与动物在分类任务中的主动感知一致的行为。在机器学习背景下，这可以理解为一种涌现的注意力。正如神经AI领域经常做的那样，我们可以将ANCA的影响分为神经方面的影响和AI方面的影响。

从神经方面的影响开始， ANCA仅从其分布式、同质的架构及其运动能力就表现出涌现的注意力

结论

所有动物在移动过程中进行感知，而且是通过移动来感知的——具身机器人也是如此。考虑到运动在感知中的普遍作用，以及越来越多的证据表明感觉皮层和运动皮层之间存在协作，可以得出结论：感知和运动是内在联系的。然而，尽管神经科学有了这些新的理解，但受新皮质启发的AI模型往往没有纳入运动因素。

在这项工作中，我们介绍了主动神经元胞自动机（ANCA），

未引用的引用

缺失的引用表A1、表A2、表A3、表A4、表A5、表A6、表A7、表A8、图A3、图A4

CRediT作者贡献声明

Mia Kvalsund：写作——审阅与编辑、撰写原始草稿、可视化、验证、软件、方法论、调查、概念化。Kai Olav Ellefsen：写作——审阅与编辑、撰写原始草稿、监督、方法论、调查、概念化。Kyrre Glette：写作——审阅与编辑、撰写原始草稿、监督、方法论、调查、概念化。Sidney Pontes-Filho：写作——审阅与编辑、撰写原始草稿，

利益冲突声明

在这个项目中，使用了大型语言模型（LLM）ChatGPT来处理代码和文本。对于代码，ChatGPT被用来优化代码片段以提高速度并解决代码相关问题。任何用ChatGPT优化的代码都经过了广泛测试以确保其正确性。对于文本，ChatGPT被用来构思段落结构，并提出保持文本专业性和简洁性的表达方式。LLM没有生成代码或文本的实质性部分

致谢

本文的研究受益于挪威研究委员会在合同270053下支持的实验基础设施eX3。这项研究还得到了挪威研究委员会授予的300504号资助。我们还要感谢Trym Lindell和Stefano Nichele对项目的宝贵贡献。

联系信箱：

粤ICP备09063491号

摘要

引言