综述:GENESIS:一个情景-语义交互的生成模型

【字体: 时间:2026年03月06日 来源:NEUROSCIENCE AND BIOBEHAVIORAL REVIEWS 7.9

编辑推荐:

  本文系统阐述了全新的计算框架GENESIS,它通过整合有限容量的皮质变分自编码器(Cortical-VAE)和海马变分自编码器(Hippocampal-VAE)以及一个基于检索增强生成(RAG)的情景记忆组件,首次为情景与语义记忆的核心现象提供了统一、主动的生成式解释。模型成功模拟了语义记忆的统计学习、泛化以及情景记忆的再认、系列回忆、主旨扭曲和建构性情景模拟等关键行为,揭示了容量限制如何塑造记忆的保真度和交互的动态性,为理解人类认知的生成基础开辟了新视野。

  
在认知神经科学领域,情景记忆与语义记忆——这两种陈述性记忆的主要形式——如何相互作用以支持学习、回忆和想象,是一个核心挑战。尽管互补学习系统(CLS)等理论取得了显著进展,但现有模型通常将两者视为独立网络,难以共同解释跨领域的核心经验现象,也缺乏对记忆作为一种主动、建构和资源受限过程的统一计算框架。
GENESIS模型的架构
为了解决这一挑战,研究者提出了生成式情景-语义整合系统(GENESIS)模型。该模型将记忆形式化为两个有限容量生成系统之间的交互:一个支持语义学习和泛化的皮质变分自编码器(Cortical-VAE),以及一个在检索增强生成(RAG)架构内支持情景编码和检索的海马变分自编码器(Hippocampal-VAE)。
当模型接收到一个输入项(例如,一个红色的数字6图像)时,首先由Cortical-VAE的编码器进行处理,生成一个包含两个类别嵌入(颜色和数字)和一个项目特异性潜在向量z的复合项嵌入。随后,该嵌入通过两条并行路径处理:一条可直接被Cortical-VAE的解码器重建,对应于皮质的感知重建;另一条则被路由到海马回路以形成情景记忆。为了形成记忆,项嵌入会进一步被有限容量的Hippocampal-VAE编码和解码,并与捕获体验时间的时间嵌入相结合,生成一个压缩的“键”(key)。这个键与对应的Cortical-VAE项嵌入(“值”,value)作为键值对存储在RAG式的情景记忆中,构成一个情景。情景回忆则通过标准的查询-键匹配机制在RAG内进行,检索到的值(即项嵌入)可由Cortical-VAE解码以重建感知表征。
语义记忆:统计学习、容量限制与泛化
Cortical-VAE被设计用于实现统计学习。研究表明,在有限的编码容量下,重建质量遵循率失真理论预测的曲线,高容量训练能准确重建图像,而低容量则导致性能下降和表征几何结构的改变——不同实例的表征会塌缩到一个紧凑区域,趋向于单一原型。更重要的是,模型在“留一法”协议中展现出强大的组合泛化能力。当训练时故意遗漏某个数字-颜色组合(如5-红色)的所有样本后,模型能够通过结合相应的条件嵌入,成功生成该未见类别的高质量图像,这验证了其捕捉语义规律并灵活重组知识的能力。
情景记忆:再认与系列回忆
GENESIS模型在经典的情景记忆任务中复现了关键行为发现。在再认记忆(“新旧判断”)任务中,模型基于查询-键相似度进行判断。模拟显示,随着记忆列表长度的增加,再认准确性下降,这与人类行为一致。同时,海马编码器的容量限制显著影响表现:容量越低,基线准确性和随列表增长而下降的速度都越低,反映了压缩键之间区分度的降低。
在系列回忆任务中,通过将时间嵌入整合到记忆键中,模型成功模拟了系列顺序效应、近因效应及其在延迟回忆中的衰减。当时间成分在键表征中占主导时,模型表现出强烈的序列顺序效应,回忆时倾向于按呈现顺序输出项目;而降低时间成分的权重则会导致该效应减弱,并出现基于语义相似性的侵入错误,这与人脑中观察到的语义干扰现象相符。模型还展示了在提示下进行系列回忆时,回忆路径如何受到时间和语义信息相对权重的影响。
主旨扭曲与建构性情景模拟
GENESIS模型还揭示了语义记忆如何影响情景处理。当情景在Cortical-VAE的低容量条件下编码时,重建的记忆会失去细节,变得彼此相似,并趋向于该类别的语义原型,这模拟了记忆中常见的主旨(gist-based)扭曲现象。
此外,模型支持建构性情景模拟,即重新组合已有经验元素以生成全新场景。通过从不同存储项中提取并组合潜在状态z、数字嵌入eS和颜色嵌入eC,模型能够生成从未在训练中出现的数字-颜色组合图像。重要的是,这种基于情景的重组所产生的刺激物,在结构上比纯粹的语义模拟(从分布中采样)更接近记忆中的原始刺激物,保留了更多情景细节。然而,如果用于重组的记忆本身是在低容量下编码的,那么重组产生的新刺激物也会失去细节,变得同质化。
总结与展望
GENESIS模型通过一个集成的生成架构,为语义和情景记忆及其交互提供了统一的计算解释。它强调了情景记忆的形成和回忆对语义系统的依赖,将情景内容视为需要解码的潜在表征而非原始感知输入,并利用查询-键-值匹配机制实现记忆搜索。该框架不仅再现了跨记忆领域的大量经验发现,还从率失真理论的角度,为容量限制如何塑造记忆保真度和可记忆性提供了规范性视角,推进了我们对人类认知生成基础的理解。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号