理性预期与协调博弈中的运动学信息

《Cognition》:Rational expectations and kinematic information in coordination games

【字体: 时间:2026年01月23日 来源:Cognition 2.8

编辑推荐:

  研究通过HI-LO博弈游戏,探讨人类如何根据合作伙伴抓取动作的早期阶段(10-40%)调整战略决策。发现参与者会根据动作线索(如最大握力开口变化)修正对理性选择(高收益)的预期,当线索显示合作伙伴选择低收益目标时,参与者及时调整并实现高效协调。这表明人类在战略协调中优先依赖动作感知而非抽象理性假设。

  
马蒂娜·方赫拉(Martina Fanghella)|卡米拉·F·科伦坡(Camilla F. Colombo)|法比奥·奥雷利奥·达萨罗(Fabio Aurelio D’Asaro)|玛丽亚·特蕾莎·帕斯卡雷利(Maria Teresa Pascarelli)|吉多·巴尔基耶西(Guido Barchiesi)|马可·拉布费蒂(Marco Rabuffetti)|毛里齐奥·费拉林(Maurizio Ferrarin)|弗朗切斯科·瓜拉(Francesco Guala)|科拉多·西尼加利亚(Corrado Sinigaglia)
米兰大学哲学系,20122米兰,意大利

摘要

成功的协调往往需要将战略推理与对他人行为的实时观察相结合,然而人类如何解决这些信息来源之间的冲突仍不清楚。本研究旨在通过探讨人们在观察来自合作伙伴行为的部分运动学信息时如何进行战略协调来填补这一空白。参与者与一个虚拟合作伙伴玩了一个HI-LO游戏,根据合作伙伴抓取大目标或小目标的初始动作长度(10-40%)来协调他们的收益选择。手部动作以示意图动画的形式呈现,不同的抓取动作对应不同的收益。参与者仅依靠手部形状变化的运动学线索来推断合作伙伴的选择。我们发现,尽管参与者通常倾向于选择更高的收益,这符合理性博弈论的预期,但当部分运动学线索表明其他情况时,他们会修正这些预期。当早期抓取动作的变化表明合作伙伴正在抓取与较低收益相关的大目标时,参与者会调整他们的偏好,从而实现高协调成功率。这些发现表明,人们更重视关于他人行为的运动学证据,而不是关于理性收益最大化的抽象假设。即使是非常早期的动作线索也能改变人们对理性代理人可能选择的看法,这突显了动作感知在战略协调中的核心作用。

引言

协调是人类社会性的基础。虽然许多物种都会合作和分工——从哺乳动物和昆虫到植物和细菌——但人类在社交策略上具有独特的灵活性。他们可以采用多种方法来实现相同的目标:塞尔玛(Selma)可以等待卡梅伦(Cameron)选择她的杯子,或者先行动;海莉(Hayley)可以做饭,而艾莎(Aysha)去拿酒,或者他们也可以采取不同的协调方式。
然而,这种灵活性也带来了一个谜题。尽管经过数十年的研究,我们仍然缺乏对人类如何如此有效地进行协调的充分理解。博弈论为研究这类互动提供了最强大的分析框架(冯·诺伊曼和摩根斯坦,1944年)。一个关键的见解是,协调问题涉及具有多个纳什均衡的战略决策——每个代理的选择都是对他人选择的最佳响应,且没有人能从单方面改变策略中获益(金,1996年;谢林,1960年)。这些最佳响应取决于对他人行为的预期,这些预期可能基于直接观察(看到你选择了大杯子),但往往是基于部分或相互矛盾的信息构建的。
实验博弈论的一个重要发现是,人们即使在没有可靠信息的情况下也能顺利协调(库珀和韦伯,2020年)。有时他们会跟随简单的环境线索:坐在餐厅桌子旁时,我们通常会喝面前的杯子里的酒,而不是另一个客人的杯子。物理上的接近性提供了一个显著的焦点,几乎不需要任何努力和认知处理。同样,如果海莉是专业厨师而艾莎是品酒师,他们基于专业知识的明显分工可能会产生更好的结果。
这种互动具有所谓的HI-LO游戏的结构。在这个游戏中,两个决策者面临一个有多个均衡结果的协调问题,其中一个结果明显优于其他结果,因为双方都更喜欢它。例如,在最简单的情况下,如果双方都选择HI,他们将获得收益x1、y1;如果双方都选择LO,他们将获得收益x2、y2(其中x1 > x2,y1 > y2)(见图2)。虽然选择HI并不是唯一的均衡策略——在特定的信念配置下选择LO也是合理的——但这样的信念在直觉上似乎很奇怪。每个代理只有在预期对方也会这样做时才会选择LO,但为什么会有人持有这样的预期呢?实验证实了这种直觉:大多数人在没有沟通的情况下玩这个游戏时会选择HI(巴查拉克,2006年;巴德斯利、梅塔、斯塔默和萨格登,2010年)。
这种模式背后的认知机制仍不清楚。一些博弈论者提出了收益支配原则(哈萨尼和塞尔滕,1988年),该原则规定代理应选择导致所有人都偏好的均衡行动。然而,这样的原则只是描述了观察到的行为,并没有解释它。其他理论家认为,代理将HI-LO视为集体决策而非个人决策(巴查拉克,2006年;科尔曼和戈尔德,2018年;萨格登,2000年)。由于HI-HI的结果对所有替代方案都更优,代理应该采取导致最佳集体结果的行动。第三种观点认为,代理会模拟彼此的行为,每个玩家都在寻求为自己实现最佳结果的最佳方式(瓜拉,2020年;莫顿,2005年)。
在这些理论对比的背后,人们对一组核心事实有相当一致的认识:当人们缺乏关于他人可能选择的信息时,他们倾向于选择HI,预期他人也会选择HI,并认为这些预期是合理的或正当的。然而,这种信息匮乏的情况在实践中相对少见。现实世界的互动通常发生在信息丰富的环境中,代理能够接收到关于他人的各种行为线索。在有利的情况下,这些线索是一致且明确的。在其他情况下,它们会发送相互矛盾的信号,代理必须解决这些信号。
在本实验中,我们研究了人类代理如何使用关于共同玩家动作的部分、不完整线索来快速做出HI-LO游戏所需的决策。我们的设计基于研究表明,人们可以通过运动学线索预测他人的行为结果(安苏伊尼、卡瓦洛、贝尔托内和贝基奥,2014年;贝基奥等人,2012年;贝基奥、库尔、安苏伊尼、贝尔托内和卡瓦洛,2018年;克里希南-巴尔曼、福布斯和汉密尔顿,2017年;斯卡利蒂等人,2023年)。安布罗西尼、科斯坦蒂尼和西尼加利亚(2011年)发现,观察者可以从手部预成型动作中可靠地推断出目标位置,即在手到达之前注视目标(另见安布罗西尼、西尼加利亚和科斯坦蒂尼,2012年;科斯坦蒂尼、安布罗西尼和西尼加利亚,2012a;科斯坦蒂尼、安布罗西尼和西尼加利亚,2012b;科斯坦蒂尼、安布罗西尼、卡德利基奥和西尼加利亚,2014年)。安苏伊尼等人(2016年)证明,手部预成型动作使得从动作观察的最早阶段就可以预测目标。最近的一项研究结合了运动学分析和机器学习,发现人们主要使用运动学线索(如最大握持开口,即伸手抓取时食指和拇指之间的最大距离)进行早期预测,而具体的目标预测结果则随着时间的推移而显现(方赫拉等人,2025年)。
在本研究中,参与者与一个假定的远程合作伙伴玩游戏,根据对合作伙伴动作的部分观察来选择他们偏好的收益。在一种配置中,合作伙伴抓取大球以获得更高收益,抓取小球以获得较低收益;在另一种配置中,这种映射是相反的。参与者不知道合作伙伴是虚拟的。我们使用了方赫拉等人(2025年)提供的经过验证的视频素材——抓取大球和小球的动作捕捉记录,动作通过连接位于重要解剖标志上的运动捕捉标记的红色线条来表示。动作片段被限制在四个时间点(从动作开始到分别达到10%、20%、30%或40%的抓取动作),以评估协调所需的信息处理能力。由于没有可见的目标物体,参与者仅依靠手部形状随时间的变化来猜测合作伙伴的动作。在这方面,需要注意的是,起始手部位置是拇指和食指相互重叠的。在抓取动作过程中,当目标较大时,两个手指之间的距离逐渐增加;而对于小目标,拇指和食指之间的距离在初始打开后几乎保持不变。
我们的目标是确定参与者是否根据运动学信息调整他们对合作伙伴动作的理性预期,特别是当运动学线索提供了足够的证据来改变他们认为合作伙伴会选择更高收益的预期时。如果参与者的选择主要基于合作伙伴总是选择更高收益的理性预期,那么早期的运动学信息应该对其决策影响很小。然而,如果参与者整合了运动学信息,他们的选择应该会在线索指明合作伙伴的动作结果时立即更新。当运动学证据表明较低收益的结果时,应该会修正他们之前认为合作伙伴主要追求更高收益的预期。这种模式也应该反映在反应时间上:当参与者需要修正之前的预期时,他们的反应应该会变慢。为了量化运动学证据如何随时间塑造这些理性预期,我们实现了一个简单的贝叶斯观察者模型,其中选择更高收益选项的先验偏见会根据关于目标大小的运动学信息递归更新。

章节片段

动作执行

运动学记录在LAMoBiR(“运动分析与康复生物工程实验室”)进行,该实验室隶属于IRCCS唐·卡洛·格诺基基金会(IRCCS Fondazione Don Carlo Gnocchi)。两名参与者(一名女性和一名男性)被要求用他们的右手(主导手)抓取两个大小不同的物体(例如,一个大气球和一个小球,直径分别为2厘米和10厘米)。在每次记录开始时,右手握成拳头,距离中间70厘米

动作执行

握持开口。我们发现时间(F(3,18) = 121.147,p < .001,2 = 0.953)和大小(F(1,6) = 79.584,p < .001,2 = 0.930)有主要影响,以及大小*时间的交互作用(F(3,18) = 95.868,p < .001,2 = 0.941)也具有统计学意义。事后使用Bonferroni校正的方法显示,在20%到40%的范围内,抓取大物体的握持开口更大(平均值±标准误差;45.6 ± 3.1 对 30.3 ± 1.1毫米在20%时,以及84.8 ± 4.2 对 33.2 ± 1.5毫米在30%时)。

讨论

本研究探讨了人类如何利用关于共同玩家动作的部分信息进行协调。参与者与一个虚拟共同玩家玩HI-LO游戏,根据观察共同玩家抓取大目标和小目标的动作来选择他们偏好的收益。共同玩家的手部动作以视频动画的形式呈现,其中手部通过连接位于解剖标志上的运动捕捉标记的红色线条来简化表示。

补充材料

支持本研究的数据、分析代码和研究材料可在开放科学框架(OSF)上找到:https://osf.io/7wcpx/?view_only=591a7fc81a924c8e804614b25775a8eb

CRediT作者贡献声明

马蒂娜·方赫拉(Martina Fanghella):写作——审阅与编辑,写作——初稿,可视化,方法论,调查,形式分析,数据管理,概念化。卡米拉·F·科伦坡(Camilla F. Colombo):写作——审阅与编辑,可视化,方法论,调查,形式分析,数据管理,概念化。法比奥·奥雷利奥·达萨罗(Fabio Aurelio D’Asaro):写作——审阅与编辑,方法论,形式分析。玛丽亚·特蕾莎·帕斯卡雷利(Maria Teresa Pascarelli):验证,调查。吉多·巴尔基耶西(Guido Barchiesi):验证,方法论。马可(Marco)

利益冲突声明

所有作者均无需要披露的利益冲突。

致谢

本文得到了米兰大学“皮耶罗·马丁内蒂”哲学系的支持,以及意大利教育、大学和研究部(MIUR)颁发的“2018-2022年卓越部门”和“2023-2027年卓越部门”项目(授予MF、MTP、GB、FG和CS),以及PRIN 2022项目“扩展手:用于抓取增强或恢复的机器人附加手指的生理和神经基础”(授予CS)(2022J72LFW_002)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号