Borda聚合中的锦标赛方法与顺序请求方法:一项实验研究

《Journal of Behavioral and Experimental Economics》:Tournament vs. Order Elicitation in Borda Aggregation: An Experimental Investigation

【字体: 时间:2026年03月04日 来源:Journal of Behavioral and Experimental Economics 1.4

编辑推荐:

  Borda规则下比较完整排序与 pairwise比较的输入效果,发现 pairwise方法降低个体错误率30%,减少社会Kemeny距离8%。实验通过双盲设计,在61个六人社会中测试两种输入方式,验证了局部决策降低系统性偏差的理论预期。

  
盖伊·巴罗卡斯(Guy Barokas)| 陈乔恩(Chen Choen)| 罗伊·达里奥希(Roy Darioshi)
鲁平学术中心(Ruppin Academic Center)的跨学科决策研究中心(The Interdisciplinary Decision Research Center)

摘要

在几乎所有理论、实验和实际应用中,博尔达规则(Borda rule)的输入都是“排序”(完整且具有传递性的排名)。在保持博尔达规则不变的前提下,我们通过一项预先注册的在线实验(N=366人,61个固定六人小组,10个选项)比较了“排序”(Order)与“锦标赛”(Tournament,即所有成对选择)的效果。实验结果显示,“锦标赛”方法将个人错误率降低了约30%,并将小组基于成员真实排序的加权凯门尼距离(Weighted Kemeny Distance)降低了约8%。这些结果表明,对于中等规模的群体而言,成对选择作为博尔达规则的输入方式比完整排名更有效。在方法论上,我们引入了一种简单且可推广的程序来测试信息收集方式与社会规则之间的匹配度,以便对其他社会选择规则进行类似评估。

引言

典型的社会选择过程包含两个部分:一是收集选民的偏好,二是将这些偏好汇总成一个社会排序。受阿罗(Arrow)1963年开创性工作的启发,大多数文献都研究了汇总规则;相比之下,很少有研究探讨信息收集步骤与特定规则之间的相互作用。本文正是探讨了这一环节:我们固定社会规则,然后比较不同的信息收集方法。
博尔达规则是社会选择理论中的经典投票机制,以其数学上的优雅性和广泛的实用性而闻名(Mahajne和Volij,2022年)。该规则起源于18世纪的让-查尔斯·德·博尔达(Jean-Charles de Borda),它根据排名位置分配分数,并通过汇总所有选民的分数来选出获胜者。理论研究充分证明了博尔达规则的优良特性(Young,1974年;Maskin,2025年)。它在各种现实场景中得到广泛应用,包括专业协会选举、基里巴斯和瑙鲁的全国选举(Reilly,2002年)、斯洛文尼亚的少数民族选举(Fraenkel和Grofman,2014年),以及体育队伍排名、大学录取和算法推荐系统(Kastner等人,2019年)。
此外,计算社会选择理论还表明,锦标赛排名是对凯门尼最小分歧目标(Kemeny minimum disagreement)的一种近似方法(Coppersmith等人,2006年)。
这些文献中一个近乎普遍的假设——也在实践中得到体现——是选民提供的排名具有传递性。理论分析明确要求偏好汇总以传递性为基本条件(参见Barokas和Nitzan(2025年)的最新研究),实验设计通常围绕传递性个体排名展开(Forsythe等人,1996年),实际应用,包括选举和组织决策,也一致要求使用传递性投票。然而,对多个选项进行排序在认知上要求较高,容易引发错误(Iyengar和Lepper,2000年;Churchland等人,2008年)。具体来说,排序要求参与者同时记住许多相对位置;一个错误的排序会导致多个相关的排序错误。相比之下,成对比较一次只涉及一个比较,从而减少了这类错误的发生。因此,在经济学的许多其他子领域中,成对比较是收集和分析偏好的更常见方法(例如,Luce和Suppes,1965年;Tversky和Kahneman,1992年;Scholz等人,2010年;Manzini等人,2010年)。
重要的是,Nitzan和Rubinstein(1981年)表明,可以直接从成对判断构建博尔达规则,而无需假设个体选项之间的传递性。基于这一观察,我们测试了哪种输入方式——完整排名(Order)或所有成对选择(Tournament)——在博尔达规则下能产生更好的社会结果。这与之前的偏好收集比较研究不同(例如,Merino-Castelló,2003年;Bateman等人,2006年;Akaichi等人,2013年),这些研究孤立地评估了个体层面的测量结果,而没有在特定汇总规则下评估性能。
在在线的被试内设计中,我们固定博尔达规则,仅改变其输入方式(即信息收集方式)。每位参与者完成两种信息收集格式:
  • (i)
    排序信息收集任务——拖放n=10
  • (ii)
    锦标赛信息收集任务——为n=10
  • 这两种任务使用固定的六人小组内的不同材料集(这些小组在所有任务中保持不变,我们基于这些小组计算了博尔达排名)。我们在2×2的设计中完全平衡了信息收集方法与材料集的匹配()以及任务顺序(),从而产生了四种排列组合。
    在个体层面,我们比较了平均错误率和真实偏好与收集到的偏好之间的加权凯门尼距离(WKD)——后者定义为所有错误排序对之间的货币价值差异之和。在社会层面,我们测量了个体“真实”偏好与最终社会排序之间的平均WKD。
    为了预测结果,我们开发了一个简单的随机选择模型,其中每个收集到的判断都遵循Luce–McFadden逻辑回归规则,并且该规则具有一个可以在任务块内变化的内生精度参数。关键区别在于,排序是一个顺序构建任务:早期的错误不仅会导致许多后续的成对错误排序,还可能扭曲用于后续排名的内部“状态”,从而产生任务内的连锁反应。相比之下,锦标赛由局部的成对决策组成,因此错误通常局限于被查询的成对选项,彼此之间相对独立。因此,模型预测在锦标赛下,预期个体错误率和WKD会更低(),即使在平均成对准确率固定的情况下,博尔达规则下的社会优势也会更明显()。这是因为排序将许多成对关系捆绑在一个投票中,其错误会扩大博尔达得分的方差,使得在有限规模的群体中出现社会错误排序的可能性增加。根据第2节中的模型,我们提出了两个假设(H1–H2;见第2.5节):锦标赛提高了个体准确性(错误率和WKD),并且在博尔达规则下,与排序信息收集相比,社会的WKD更低。
    我们的结果支持这两个假设。锦标赛将个体错误率降低了约30%(p < 0.001),平均WKD降低了约36%(p < 0.001)。在社会层面,平均WKD降低了约8%(p = 0.033)。正如结论部分所讨论的,WKD降低8%可能会带来显著的福利收益。
    鉴于传递性要求在博尔达规则的理论和实践中都非常普遍,我们的发现建议重新审视这一惯例,并对于中等规模的决策集,倾向于使用成对收集方法。更一般地说,这个教训是方法论上的:信息收集方法的选择应与所选的汇总规则相匹配。
    本文的其余部分安排如下。第2节介绍数学模型和假设。第3节介绍实验方法,第4节展示结果,第5节进行总结。

    模型与假设

    我们的预测基于一个具有相关精度的随机选择模型。第2.1节建立模型,第2.2节介绍个体层面的测量和结果,第2.3节介绍社会层面的测量和结果,第2.4节提出实验的假设。

    实验方法

    我们遵循标准的投票游戏实现方法(Forsythe等人,1996年;Tyszler和Schram,2016年;Grani?,2017年),比较了两种信息收集格式——排序(Order)和锦标赛(Tournament),同时保持汇总规则为博尔达规则不变。每位参与者完成了来自Dean和Neligh(2023年)以及Andersson等人(2021年)的不相交刺激集的两种格式,这些刺激集引发了严格有序的货币收益(即每个集合都对应一个唯一的客观真实排名)。格式与集合的匹配以及两种格式的顺序...

    结果

    我们分析了366名参与者,他们被分为61个六人小组(每种信息收集方法122个小组)。随机化确保了组的可比性。

    未引用的参考文献

    Marden,1995

    CRediT作者贡献声明

    盖伊·巴罗卡斯(Guy Barokas):撰写 – 审稿与编辑,撰写 – 原稿,可视化,验证,监督,软件开发,资源准备,方法论设计,调查,资金获取,正式分析,数据整理,概念化。陈乔恩(Chen Choen):验证,资金获取。罗伊·达里奥希(Roy Darioshi):验证。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号