协调是人类社会性的基础。虽然许多物种都会合作和分工——从哺乳动物和昆虫到植物和细菌——但人类在社交策略上具有独特的灵活性。他们可以采用多种方法来实现相同的目标:塞尔玛(Selma)可以等待卡梅伦(Cameron)选择她的杯子,或者先行动;海莉(Hayley)可以做饭,而艾莎(Aysha)去拿酒,或者他们也可以采取不同的协调方式。
然而,这种灵活性也带来了一个谜题。尽管经过数十年的研究,我们仍然缺乏对人类如何如此有效地进行协调的充分理解。博弈论为研究这类互动提供了最强大的分析框架(冯·诺伊曼和摩根斯坦,1944年)。一个关键的见解是,协调问题涉及具有多个纳什均衡的战略决策——每个代理的选择都是对他人选择的最佳响应,且没有人能从单方面改变策略中获益(金,1996年;谢林,1960年)。这些最佳响应取决于对他人行为的预期,这些预期可能基于直接观察(看到你选择了大杯子),但往往是基于部分或相互矛盾的信息构建的。
实验博弈论的一个重要发现是,人们即使在没有可靠信息的情况下也能顺利协调(库珀和韦伯,2020年)。有时他们会跟随简单的环境线索:坐在餐厅桌子旁时,我们通常会喝面前的杯子里的酒,而不是另一个客人的杯子。物理上的接近性提供了一个显著的焦点,几乎不需要任何努力和认知处理。同样,如果海莉是专业厨师而艾莎是品酒师,他们基于专业知识的明显分工可能会产生更好的结果。
这种互动具有所谓的HI-LO游戏的结构。在这个游戏中,两个决策者面临一个有多个均衡结果的协调问题,其中一个结果明显优于其他结果,因为双方都更喜欢它。例如,在最简单的情况下,如果双方都选择HI,他们将获得收益x1、y1;如果双方都选择LO,他们将获得收益x2、y2(其中x1 > x2,y1 > y2)(见图2)。虽然选择HI并不是唯一的均衡策略——在特定的信念配置下选择LO也是合理的——但这样的信念在直觉上似乎很奇怪。每个代理只有在预期对方也会这样做时才会选择LO,但为什么会有人持有这样的预期呢?实验证实了这种直觉:大多数人在没有沟通的情况下玩这个游戏时会选择HI(巴查拉克,2006年;巴德斯利、梅塔、斯塔默和萨格登,2010年)。
这种模式背后的认知机制仍不清楚。一些博弈论者提出了收益支配原则(哈萨尼和塞尔滕,1988年),该原则规定代理应选择导致所有人都偏好的均衡行动。然而,这样的原则只是描述了观察到的行为,并没有解释它。其他理论家认为,代理将HI-LO视为集体决策而非个人决策(巴查拉克,2006年;科尔曼和戈尔德,2018年;萨格登,2000年)。由于HI-HI的结果对所有替代方案都更优,代理应该采取导致最佳集体结果的行动。第三种观点认为,代理会模拟彼此的行为,每个玩家都在寻求为自己实现最佳结果的最佳方式(瓜拉,2020年;莫顿,2005年)。
在这些理论对比的背后,人们对一组核心事实有相当一致的认识:当人们缺乏关于他人可能选择的信息时,他们倾向于选择HI,预期他人也会选择HI,并认为这些预期是合理的或正当的。然而,这种信息匮乏的情况在实践中相对少见。现实世界的互动通常发生在信息丰富的环境中,代理能够接收到关于他人的各种行为线索。在有利的情况下,这些线索是一致且明确的。在其他情况下,它们会发送相互矛盾的信号,代理必须解决这些信号。
在本实验中,我们研究了人类代理如何使用关于共同玩家动作的部分、不完整线索来快速做出HI-LO游戏所需的决策。我们的设计基于研究表明,人们可以通过运动学线索预测他人的行为结果(安苏伊尼、卡瓦洛、贝尔托内和贝基奥,2014年;贝基奥等人,2012年;贝基奥、库尔、安苏伊尼、贝尔托内和卡瓦洛,2018年;克里希南-巴尔曼、福布斯和汉密尔顿,2017年;斯卡利蒂等人,2023年)。安布罗西尼、科斯坦蒂尼和西尼加利亚(2011年)发现,观察者可以从手部预成型动作中可靠地推断出目标位置,即在手到达之前注视目标(另见安布罗西尼、西尼加利亚和科斯坦蒂尼,2012年;科斯坦蒂尼、安布罗西尼和西尼加利亚,2012a;科斯坦蒂尼、安布罗西尼和西尼加利亚,2012b;科斯坦蒂尼、安布罗西尼、卡德利基奥和西尼加利亚,2014年)。安苏伊尼等人(2016年)证明,手部预成型动作使得从动作观察的最早阶段就可以预测目标。最近的一项研究结合了运动学分析和机器学习,发现人们主要使用运动学线索(如最大握持开口,即伸手抓取时食指和拇指之间的最大距离)进行早期预测,而具体的目标预测结果则随着时间的推移而显现(方赫拉等人,2025年)。
在本研究中,参与者与一个假定的远程合作伙伴玩游戏,根据对合作伙伴动作的部分观察来选择他们偏好的收益。在一种配置中,合作伙伴抓取大球以获得更高收益,抓取小球以获得较低收益;在另一种配置中,这种映射是相反的。参与者不知道合作伙伴是虚拟的。我们使用了方赫拉等人(2025年)提供的经过验证的视频素材——抓取大球和小球的动作捕捉记录,动作通过连接位于重要解剖标志上的运动捕捉标记的红色线条来表示。动作片段被限制在四个时间点(从动作开始到分别达到10%、20%、30%或40%的抓取动作),以评估协调所需的信息处理能力。由于没有可见的目标物体,参与者仅依靠手部形状随时间的变化来猜测合作伙伴的动作。在这方面,需要注意的是,起始手部位置是拇指和食指相互重叠的。在抓取动作过程中,当目标较大时,两个手指之间的距离逐渐增加;而对于小目标,拇指和食指之间的距离在初始打开后几乎保持不变。
我们的目标是确定参与者是否根据运动学信息调整他们对合作伙伴动作的理性预期,特别是当运动学线索提供了足够的证据来改变他们认为合作伙伴会选择更高收益的预期时。如果参与者的选择主要基于合作伙伴总是选择更高收益的理性预期,那么早期的运动学信息应该对其决策影响很小。然而,如果参与者整合了运动学信息,他们的选择应该会在线索指明合作伙伴的动作结果时立即更新。当运动学证据表明较低收益的结果时,应该会修正他们之前认为合作伙伴主要追求更高收益的预期。这种模式也应该反映在反应时间上:当参与者需要修正之前的预期时,他们的反应应该会变慢。为了量化运动学证据如何随时间塑造这些理性预期,我们实现了一个简单的贝叶斯观察者模型,其中选择更高收益选项的先验偏见会根据关于目标大小的运动学信息递归更新。