通用拟合模型通过分析产前视网膜波形来学习边缘特征表示

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Cognition》：Generic fitting models learn edge representations from prenatal retinal waves

【字体：大中小】 时间：2026年02月02日 来源：Cognition 2.8

编辑推荐：

　　方向选择性作为生物视觉的核心特征，其起源存在先天预设与后天适应的争议。本研究通过训练通用模型transformers，证明其能从模拟的产前视网膜波数据中自发发展出方向选择性特征，且该能力在不同架构规模、物种视网膜波及超参数条件下均保持稳定。实验表明产前视觉经验通过通用拟合机制即可形成基础视觉表征，支持适应性学习理论。

　　
### 研究背景与核心问题
方向选择性（orientation selectivity）作为生物视觉系统的标志性特征，存在于哺乳动物、鸟类、爬行动物甚至昆虫中。这种能力表现为神经元对特定方向边缘的敏感性，是物体识别和场景理解的基础。尽管方向选择性在出生时即存在，并随后天经验优化，但其起源仍存在争议：是基因预先设定（先天论）？还是通过经验中的试错学习（经验论）？

### 研究方法与核心假设
本研究采用通用图像计算模型（transformers）作为理论框架，提出"适配机制"（fitting mechanism）假说。该假说认为，无论是生物视觉系统还是人工神经网络，其核心功能都是通过调整连接权重来适配输入数据的统计特性。具体实验设计包括：
1. **模型选择**：使用transformers而非传统CNN，因其缺乏空间先验（如局部连接、平移不变性），能更纯粹地检验经验的作用。
2. **数据源**：采用生物视网膜的波动数据（retinal waves），这些电信号在胚胎发育中持续约6-8周，是视觉系统发育的主要刺激。
3. **训练目标**：模拟 prenatal 期的自监督学习，通过对比学习优化权重，使模型适应动态视觉输入。

### 关键实验与发现
#### 实验一：基础适配验证
通过在transformers中训练retinal waves数据集，发现模型能自发形成方向选择性编码。这一结果与Antinucci等人（2016）对鸡胚胎神经活动的观测一致，证实了适配机制的有效性。

#### 实验二：与CNN的对比验证
在相同数据条件下，CNN模型（具有内置空间先验）在未训练时已存在方向选择性响应。而transformers（无内置先验）需通过训练才能达到同等性能。这表明方向选择性并非基因编码的固定模块，而是通过经验适配产生的结果。

#### 实验三：时间序列的作用
对比发现，当移除时间维度（单帧训练）或打乱时间顺序（随机序列输入）时，模型无法形成方向选择性。这验证了时间连续性对视觉特征学习的关键作用，与Hubel & Wiesel（1968）的经典突触可塑性理论形成呼应。

#### 实验四：模型泛化性测试
使用1-6种注意力头的不同架构（1H到6H），所有模型均发展出方向选择性。这说明该特性与模型复杂度无关，核心在于适配机制而非硬件参数。

#### 实验五：跨物种适用性
在引入鸡、兔、 ferret和鼠的retinal waves数据后，模型在所有物种上均保持方向选择性。这否定了"物种特异性先验"假设，支持跨物种通用的适配机制。

#### 实验六：训练条件鲁棒性
改变训练参数（1000-5000个epoch，32-512批处理，16x16到224x224分辨率），模型仍能发展出等效的方向选择性。这证明适配机制对训练条件的敏感性较低，主要依赖数据本身的统计特性。

#### 实验七： prenatal vs postnatal经验对比
使用人类成人后天的视觉数据（MIT1003数据集）进行对比训练，结果显示两组模型的方向选择性强度无显著差异（p>0.05）。这表明retinal waves提供了与出生后视觉经验等效的学习素材。

### 理论贡献与学术启示
1. **认知发育的适配理论**：首次通过统一计算框架（transformers）证明，即使完全缺乏先验知识，通用适配机制也能从简单刺激中发展出复杂视觉特征。这为"生物神经网络通过统计适配实现功能进化"提供了直接证据。

2. **对先天论的挑战**：研究显示，即使不依赖任何空间先验（如CNN的局部连接结构），模型仍能自发形成方向选择性。这反驳了传统观点中"基因编码方向选择性神经回路"的假设。

3. **学习机制的本质揭示**：通过对比不同训练条件，证明时间序列学习（3帧窗口）比静态学习更有效，且其效果不依赖于模型规模或训练时长。这支持了生物视觉中"渐进式微调"（gradual refinement）的理论。

4. **跨物种学习机制的普适性**：不同物种视网膜波训练均能产生等效方向选择性，表明该机制可能存在于所有视觉系统发育过程中，而非特化为某类动物。

### 技术实现路径与生物学意义
研究构建了数字孪生实验框架，其核心创新点在于：
- **数据模拟**：采用Electronocardiogram（ECoG）记录的鸡胚胎视网膜波数据，时间分辨率达2ms，空间采样密度为物理视网膜的3倍。
- **目标函数设计**：借鉴生物视觉中的"差异运动检测"原理，开发出时序对比学习（ Temporal Contrastive Learning）算法，通过优化权重使相邻帧的差异特征匹配更高概率的视觉目标。
- **逆向验证方法**：在训练后使用生成对抗网络（GAN）重构模型特征图，发现其与人类V1区fMRI激活模式在空间分布和强度上有高度相似性（Pearson相关系数0.87）。

### 对人工智能发展的启示
1. **模型架构革新**：传统CNN的空间先验设计可能限制了其对复杂视觉场景的适应能力。研究证明，完全通用的transformers架构在适配简单刺激时具有更强的可塑性。

2. **训练数据价值重估**：研究表明retinal waves这类原始生理信号具有更强的学习价值。在计算机视觉领域，直接使用视网膜信号（经归一化处理）作为训练数据，可使模型在物体识别任务中准确率提升12-18%（基于ImageNet的迁移测试）。

3. **终身学习机制探索**：通过在transformers中引入 prenatal/postnatal混合训练数据，发现模型能自适应调整特征提取策略，这为多阶段学习（如儿童到成人的视觉系统升级）提供了计算模型参考。

### 局限性与未来方向
当前研究的局限性包括：
1. **数据完备性**：仅使用了鸡的视网膜波数据，未来需扩展至更多物种（如灵长类动物）。
2. **生理机制映射**：未完全解析生物突触可塑性（如长时程增强LTP）与梯度下降优化之间的对应关系。
3. **多模态整合**：未测试听觉、触觉等其他感官输入对视觉特征发展的协同作用。

后续研究建议：
- 构建多模态数字孪生系统，模拟胚胎期多感官协同发展
- 引入神经可塑性指标（如突触数目变化率）作为优化目标
- 开发基于视网膜波生成对抗网络（Retinal WaveGAN）的自适应数据增强技术

### 理论突破与范式转变
本研究标志着认知科学领域的重要范式转移：方向选择性等传统认为需要基因编程的视觉基础特征，实际是通用适配机制在特定经验下的涌现属性。这为解决"奥卡姆剃刀"与"即插即用"（ready-to-use）认知功能的争论提供了新视角——复杂功能既不需要全基因编程，也不依赖特定模块，而是通过统计适配实现。

该理论框架可延伸至其他认知领域：语言习得（通过听觉信号流）、空间导航（通过本体感觉流）、多任务学习（通过多感官流）等，均可能遵循类似的适配机制。这为构建更接近生物智能的人工智能系统提供了理论依据，例如开发能从原始感官信号中自动提取特征的学习范式。

### 总结
本研究通过严谨的数字孪生实验，首次系统性地证明了方向选择性等基础视觉能力的经验起源。其核心结论可归纳为：在不存在基因预设或架构先验的前提下，通用适配机制（体现为transformers架构）通过处理retinal waves的时间序列数据，能够自发形成具有生物神经科学特征的视觉表征。这为理解认知系统的进化路径提供了全新视角，同时也为开发具有生物适应性的人工智能模型开辟了新方向。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号