情绪与基于奖励的决策过程紧密相连(Elliott等人,2023年;Lerner等人,2015年)。一方面,情绪可以作为隐性的线索,在人们没有意识到的情况下影响评估和决策(De Vleminck等人,2023年;Rolls,2023年;Zhou等人,2023年)。另一方面,情绪也可以作为显性的反馈,提高人们对决策结果的意识和敏感度(Priolo等人,2021年;Xu等人,2024年)。新兴的证据表明,情绪信息与结果价值之间的情境关系在决策过程中对情感和动机信号的编码方式起着关键作用(Genevsky等人,2025年;Priolo等人,2024年)。这里的“情境”指的是情绪价值与奖励效用之间的关系,一致的情境意味着情感信号与结果价值之间的一致性,而不一致的情境则意味着两者之间的不匹配。从双过程的角度来看,一致的情境更可能引发自动的、自下而上的情感处理,因为情绪价值和奖励效用传递了一致的动机信号(Bennett等人,2023年;Chen等人,2025年)。相比之下,不一致的情境则需要更多的深思熟虑的、自上而下的控制机制来解决这种冲突。与这一观点一致的是,在教育环境中,情绪与奖励的一致性与更高的自动参与度和更好的学习成果相关,而不一致性则会增加认知负荷和自我控制的需求(Cui等人,2025年)。类似的机制似乎也适用于成瘾行为,包括物质使用、赌博和互联网成瘾,在这些行为中,嵌入在一致情境中的情绪显著线索会放大线索反应性并偏向于不适当的决策模式,从而增加复发的风险(LeCocq等人,2020年)。相反,当情绪价值与奖励效用冲突时,预期违反会增加,认知需求也会上升,这会将资源从自动评估过程中转移出来。这种转变重塑了情绪信息在评估和学习过程中的权重,减弱了其对行为的直接影响,并强调了情境不一致性在决策中的功能性作用。因此,引入这种不一致性,并结合自我控制机制的参与,可能有助于打破线索驱动的偏见,减轻成瘾和抑郁行为(Harlé等人,2013年;LeCocq等人,2020年)。尽管情绪、奖励及其相互作用已经被广泛研究,但它们在情境中的调节机制和神经基础仍然知之甚少。具体来说,目前尚不清楚情境信息在神经系统中是如何表示的,以及它如何与决策过程中更自动或更受控制的处理方式相关联。本研究旨在通过探讨与情境调节的情绪和奖励处理相关的神经特征,以及这种编码如何与行为适应相关联,来填补这一空白。通过解决这些问题,可能会提供关于如何利用情境信息来微调行为策略和指导学习及不适当行为的新机制见解。
为了实证研究这些过程,以往的研究通常使用爱荷华赌博任务(IGT;He等人,2023年;Orm等人,2024年;Zanini等人,2024年),以及其他一系列基于奖励的决策任务(Azocar等人,2024年;Demidenko等人,2024年;Effah等人,2024年;Mahlberg & Weidemann,2024年;Wang等人,2025年;Zhu等人,2023年)。在一项修改后的IGT中,研究人员使用带有正面或负面情绪的面孔作为线索,而不是传统的四副盲牌,发现参与者更倾向于选择与正面情绪相关的牌组,尽管在不一致的情境下正面情绪带来的奖励较低。这表明无论在何种情境下,正面情绪都会增强决策中的评估(Hinson等人,2006年)。另一项研究表明,在不一致的情境下,IGT的表现(即安全选择与风险选择之间的差异)比在一致情境下更低(Davies & Turnbull,2011年)。Watanabe等人(2013年)使用基于概率的奖励决策任务并结合强化学习的计算建模发现,当参与者受到恐惧面孔的提示时,他们的学习速度更快。在另一项基于概率的价值决策任务中,Evans等人(2011年)观察到,即使经济结果相同,参与者也更喜欢微笑的面孔。除了客观的行为测量指标(如表现、选择和学习速度)外,一项研究还发现,基于得失差异的相同结果的美感评分在快乐和悲伤的情境下有显著差异。总体而言,这些发现突显了情绪线索对结果评估的情境依赖性调节效应(Bandyopadhyay等人,2019年)。
当使用情绪面孔作为反馈时,A?te等人(2013年)发现,在一致情境下,参与者更倾向于选择与正面情绪相关的牌组以获得更高的奖励。相比之下,Priolo等人(2021年)发现,在不一致情境下,参与者更倾向于选择与正面情绪相关的牌组。除了经济领域外,情绪刺激也被用于涉及竞争和合作的社会情境中的反馈(Chen等人,2017年;Scharlemann等人,2001年)。例如,Scharlemann等人(2001年)发现,当参与者看到微笑的竞争对手时,他们更倾向于合作。在另一项任务中,Chen等人(2017年)观察到,当参与者在做出选择后收到经济和情绪反馈时,他们对损失的反应比对收益的反应更慢,而当看到合作者的愤怒表情时,他们对损失的反应比对收益的反应更快。这些研究共同强调了情境的一致性对情绪反馈引导的决策的影响。
尽管先前的研究已经探讨了情境因素在情绪和基于奖励的决策中的作用(Aite等人,2013年;Alacreu-Crespo等人,2020年;Davies & Turnbull,2011年;Hinson等人,2006年),但它们对决策策略的影响及其背后的机制仍需进一步探索。鉴于决策的动态性质,仅依赖汇总统计信息(如每副牌的奖励试验总数、累积收益、净分数和主观感受(Doshier等人,2024年;Salice等人,2024年)可能无法捕捉决策过程中的持续变化(Steingroever等人,2013年;Worthy等人,2013年)。在各种物种中,适应性行为依赖于专门的神经回路,这些回路整合了持续的结果反馈和奖励历史,以在动态环境中灵活调整选择(Amodeo等人,2017年;Mehrotra & Dube,2023年),这突显了在决策过程中考虑这些实时适应机制的必要性。
在决策中使用的各种策略中,一种常用的方法是“赢则继续/输则改变”(WSLS)策略,该策略旨在通过利用最近的反馈来最大化收益(Kim等人,2021年;Westerman等人,2025年;Yoshizawa等人,2023年)。这种策略包括在获得奖励后重复选择,在遇到非奖励后切换到另一种选择(Byrne & Silla,2023年;Chau等人,2015年;Worthy等人,2013年;Zhang等人,2023年)。换句话说,个体依赖于他们最近关于奖励或非奖励的经验来指导未来的行为(Fujimoto等人,2024年)。WSLS策略也可能反映了情境如何与内部决策过程相互作用,促进习惯性(自动的)和目标导向(深思熟虑的)学习(Sun & Wang,2020年;Sun等人,2023年;Sun等人,2020年)。Worthy等人(2013年)证明,与其他强化学习模型相比,WSLS在重复的价值基础任务(如IGT)中更有效地捕捉了决策策略。因此,在当前的设置中,像WSLS这样的行为策略可以作为隐藏状态的敏感度指标,特别是关于情绪和情境对基于奖励的决策的调节效应。
关于基于奖励的决策的神经特征,先前的EEG研究表明,与反馈相关的负性波(FRN)和P300(Lin & Jia,2023年;Ludyga等人,2025年;Pegg & Kujawa,2024年)对结果评估过程敏感。FRN是在前中央记录点出现的负向偏移,在反馈后250到350毫秒达到峰值(Fassbender等人,2023年;Sun等人,2020年),在损失后比在胜利后更强,据认为起源于内侧前额叶皮层或前扣带回皮层(ACC)(Gehring & Willoughby,2002年;Miltner等人,1997年)。P300是一个在中顶叶出现的正向波,其在刺激开始后300到600毫秒达到峰值,在胜利后比在损失后更强,并伴随着FRN(Li等人,2023年;Liu等人,2025年;Weber & Bellebaum,2024年)。早期研究证实,FRN和P300都对奖励处理的各个方面敏感,包括其幅度、价值或两者(Guo等人,2019年;Li等人,2023年;Liu等人,2025年;Wu & Zhou,2009年;Yeung & Sanfey,2004年)。此外,研究发现FRN和P300追踪了情绪价值对结果评估的影响(Chen等人,2017年;Wang等人,2017年;Yang等人,2020年)。除了FRN和P300之外,早期P2波在刺激开始后150到300毫秒达到峰值(Schuermann等人,2012年;Yu等人,2020年),可能反映了注意力资源的分配(Ashley等人,2004年;Carretie等人,2005年;Carretie等人,2011年;Wang等人,2021年;Yuan等人,2007年),区分了不同情绪(Lu等人,2016年;Wang等人,2021年)和基于奖励的决策中的结果(Kiat等人,2016年;Polezzi等人,2008年;Schuermann等人,2012年)。
在这项研究中,我们使用了两种修改后的IGT范式结合EEG来探讨情境信息如何调节情绪-奖励处理并指导行为策略。我们关注情境不一致性是否通过不同的机制选择性地调节情绪和奖励处理,以及当情绪作为线索与作为反馈时,情绪与奖励之间的情境关联是否一致地影响决策策略。在行为上,我们假设情境的一致性与不一致性会选择性地调节情绪和奖励处理,从而以不同的方式塑造随后的决策策略(Maxwell等人,2025年)。在神经上,与结果评估和情绪处理相关的FRN和P300预计会受到情境一致性的调节。此外,我们假设情绪线索和反馈会对行为策略产生不同的影响,线索主要影响选择形成,而反馈主要影响结果评估,这反映在处理的早期(例如P2波)和后期(例如FRN、P300波)阶段的不同神经特征中。