《NeuroImage》:The Erlangen Program in Lateral Occipital Cortex: Hierarchical Encoding of Emergent Features
编辑推荐:
本研究针对格式塔心理学中涌现特征(EF)的神经编码机制及其相对优越性量化这一核心问题,通过将Erlangen纲领(一种几何变换层级框架)概念化应用于视觉感知,探究了顶枕外侧皮层(LOC)在编码不同几何变换(欧几里得、仿射、射影、拓扑)中的关键作用。运用fMRI结合多变量模式分析(MVPA)及表征相似性分析(RSA),研究发现LOC不仅能够可靠区分这些几何类别,其神经表征间的差异性与Erlangen纲领预测的几何稳定性层级高度一致,且LOC中的表征结构呈现出与纲领相符的层级嵌套关系。这些结果首次为涌现特征的层级性神经编码提供了量化证据,将抽象的数学纲领与具体的脑机制联系起来,深化了对视觉系统如何通过计算几何不变性来优化感知效率的理解。
在视觉世界中,我们并非孤立地感知点、线或颜色,而是瞬间就抓住了它们组合而成的整体模式——比如从散乱的墨点中一眼认出熟人的脸庞,或是在杂乱的背景里迅速找到形状特别的钥匙。这种“整体大于部分之和”的现象,便是格式塔心理学的核心,而那些从元素关系中“涌现”出的整体属性,如对称性、连续性或方向性,被称为涌现特征(EF)。涌现特征的优越性体现在配置优势效应(CSE)中:人们在特定的整体构型背景下,能更快、更准确地识别和反应。然而,长久以来,一个根本问题悬而未决:大脑究竟如何编码这些涌现特征?更重要的是,不同的涌现特征之间是否存在一个可量化的“优越性”层级?例如,为什么我们感知一个物体的“洞”(拓扑特性)比感知其“角度朝向”(欧几里得特性)更快?
为了回答这些问题,一项发表在《NeuroImage》上的研究巧妙地借用了一个来自数学的“外援”——Erlangen纲领。该纲领由数学家Felix Klein于1872年提出,它通过“变换群下的不变性”来定义几何学,并将不同的几何(欧几里得、仿射、射影、拓扑)组织成一个层级结构,其中拓扑性质的稳定性最高(即在最宽松的“橡皮拉伸”变换下仍保持不变),而欧几里得性质的稳定性最低。研究团队提出一个大胆假设:大脑,特别是负责高级物体识别的顶枕外侧皮层(LOC),可能正是按照Erlangen纲领所描述的几何稳定性层级来编码涌现特征的。为了验证这一假设,他们设计了一项巧妙的“奇偶象限辨别任务”:在屏幕的四个象限中,三个呈现相同的干扰图形,一个呈现目标图形,两者之间的差异分别对应着欧几里得(角度朝向)、仿射(平行性)、射影(共线性)或拓扑(连通性/有无孔洞)这四种几何变换。研究人员记录了参与者在完成此任务时的功能磁共振成像(fMRI)数据,并运用了多变量模式分析(MVPA)和表征相似性分析(RSA)等先进计算神经科学方法,来深入挖掘LOC中的神经活动模式。
研究主要运用了以下关键技术方法:1)功能性磁共振成像(fMRI)结合事件相关设计,采集24名健康大学生在执行奇偶象限辨别任务时的大脑血氧水平依赖(BOLD)信号。2)基于体素的全脑搜索光分析,以无偏的方式定位对几何变换信息敏感的大脑区域。3)多变量模式分析(MVPA),利用支持向量机(SVM)分类器,在特定的感兴趣区(ROI),如LOC、早期视觉皮层(EVC)和顶内沟(IPS),对四种几何条件进行解码。4)表征相似性分析(RSA),通过构建神经表征不相似性矩阵(RDM),并将其与基于Erlangen纲领等理论模型预测的RDM进行相关性比较,以检验神经表征的结构。5)迁移学习范式,用于探究不同几何表征之间是否存在预测的层级嵌套关系。
研究结果:
3.1. 行为结果
反应时(RT)随着几何稳定性的增加而显著缩短:检测欧几里得、仿射、射影和拓扑变化的平均反应时分别为1765毫秒、1577毫秒、1181毫秒和767毫秒。准确率则随着几何稳定性的增加而提高。这行为上印证了不同几何变换(即对应不同涌现特征)存在知觉显著性的层级。
3.2. 搜索光结果与感兴趣区提取
全脑搜索光分析显示,几何信息编码主要集中于腹侧视觉皮层和顶叶角回。通过与功能定位扫描(区分完整与打乱物体)确定的EVC、LOC以及基于图谱定义的IPS取交集,得到了用于后续分析的最终感兴趣区。
3.3. 单变量分析结果
单变量分析表明,EVC、LOC和IPS均对几何变换类型有显著反应。具体而言,EVC对欧几里得变化最敏感,而LOC和IPS则对拓扑变化表现出更高的激活。不同任务轮次间的神经反应具有显著一致性,证实了感兴趣区信号的可重复性。
3.4. 多变量模式分类结果
在EVC、LOC和IPS三个脑区内,对四种几何条件的分类准确率均显著高于随机水平,证明这些区域都编码了几何信息。但区域间存在功能分化:EVC对欧几里得几何的分类表现最佳,而LOC和IPS则对拓扑几何的分类表现更优。这一结果提示,EVC更擅长处理局部细节特征,而LOC和IPS更擅长处理全局抽象特征。进一步的迁移学习分析表明,当分类器被训练区分两种几何(如拓扑vs射影)后,能够以符合Erlangen层级的方式,将其知识迁移到第三种几何(如仿射)的分类上。例如,一个学会区分“拓扑”(连续性改变)和“射影”(连续性不变)的分类器,会将“仿射”(连续性也不变)的样本归类为“射影”。这为神经表征中存在层级嵌套关系提供了直接证据。
3.5. 表征相似性分析结果
RSA是检验核心假设的关键。通过比较LOC的神经RDM与多个先验模型RDM,研究发现只有Erlangen模型和EA-Fused模型(将欧几里得与仿射融合的模型)达到了噪声上限,表明它们足以解释LOC中的神经表征结构。这意味着LOC中的神经活动模式差异,精确地反映了Erlangen纲领所定义的几何稳定性层级关系。值得注意的是,EA-Fused模型(不区分欧几里得和仿射)与完整Erlangen模型的表现无显著差异,暗示LOC可能将这两个较低层级的几何表征得较为相似。此外,基于图像低层特征的模型(如MSE、SSIM)与神经RDM无显著相关,基于深度学习感知特征的LPIPS模型虽有相关但未达噪声上限,排除了这些替代解释。最后,行为反应时的差异模式与Erlangen模型预测的几何距离高度相关,建立了从刺激、神经编码到行为输出的完整一致性链条。
结论与讨论:
本研究首次为“顶枕外侧皮层(LOC)是Erlangen纲领所定义的几何层级结构的神经基础”提供了强有力的实证证据。结果表明,LOC并非平等地处理所有视觉特征,而是按照从全局到局部、从稳定到多变的层级顺序来组织信息:它优先提取最稳定、最根本的拓扑特征(如连通性),然后处理射影特征(如共线性),接着是仿射特征(如平行性),最后才是最不稳定的欧几里得特征(如角度朝向)。这种处理策略与视觉系统优化感知效率的目标高度一致——优先关注在复杂多变环境中保持不变的全局结构,有助于快速形成稳定的知觉。
研究通过多变量分析和表征相似性分析等精细手段,超越了以往仅依赖单变量激活水平的研究,揭示了LOC在编码特征间“关系”而非简单“位置”信息方面的核心作用。这不仅深化了我们对格式塔知觉神经机制的理解,也将一个抽象的数学框架与具体的生物脑计算原理联系起来,为理解大脑如何构建对外部世界的不变性表征提供了一个全新的、量化的视角。这一发现可能对人工智能领域设计具有类似层级不变性计算能力的神经网络模型具有启发意义。研究也坦诚地指出了其局限性,例如刺激中几何变换与中层次视觉特征(如连接点统计)可能存在耦合,以及任务难度与特征显著性难以完全分离等,为未来研究指明了方向。总之,这项工作揭示了大脑视觉系统内在的“几何思维”,展示了它如何利用数学的优雅结构,将纷乱的感官输入转化为清晰、稳定且有意义的知觉。