算法化管理实践、信任与零工工作者的持续参与:一项关于平台工作的混合方法研究

《TECHNOLOGY IN SOCIETY》:Algorithmic Management Practices, Trust, and Gig-Worker Continuance: A Mixed-Methods Study of Platform Work

【字体: 时间:2026年05月11日 来源:TECHNOLOGY IN SOCIETY 12.5

编辑推荐:

  索海布·穆斯塔法 | 萨里·曼苏尔 行政管理科学学院,TELUQ大学,5800 圣丹尼斯街,蒙特利尔,QC,H2S3L5,加拿大 摘要:零工经济对算法管理系统的依赖要求我们理解不同的管理实践如何影响员工的留存。本研究探讨了五种算法实践(薪酬、目标设定、监控、绩效评估和调

  索海布·穆斯塔法 | 萨里·曼苏尔
行政管理科学学院,TELUQ大学,5800 圣丹尼斯街,蒙特利尔,QC,H2S3L5,加拿大

摘要:零工经济对算法管理系统的依赖要求我们理解不同的管理实践如何影响员工的留存。本研究探讨了五种算法实践(薪酬、目标设定、监控、绩效评估和调度)如何通过员工对平台的信任来影响他们继续从事零工工作的意愿。基于社会交换理论和算法管理理论,本研究采用了解释性-顺序设计方法,分析了来自中国、巴基斯坦、土耳其和澳大利亚的790名零工工作者的调查数据,并对每个国家10名参与者进行了深入访谈。定量结果表明,绩效评估和调度显著增强了员工的信任感,而薪酬则没有直接效果。信任在目标设定、监控与控制、绩效评估和调度对员工持续参与平台工作的意愿之间起到了中介作用;进一步的中介分析表明,这种影响是互补的或部分中介的,而不仅仅是信任这一因素。定性研究发现也支持了这些结论,强调目标设定的透明性和灵活的调度时间是建立信任的关键因素,同时指出薪酬的不透明性会削弱信任,但不会直接影响员工的留存意愿。从理论上讲,这些发现表明算法管理是一系列具有不同信任形成和持续影响意义的做法;从实践角度来看,平台应优先考虑可解释的绩效指标、透明的目标设定系统、保持灵活性的调度机制以及负责任的薪酬程序,以支持公平和可持续的零工经济模式。

1. 引言
零工经济是一种通过数字平台实现的短期、灵活的劳动力模式,在过去十年中呈指数级增长。麦肯锡预测,到2025年,在线人才平台(零工经济的核心组成部分)可能为全球GDP贡献2.7万亿美元,突显了该行业的变革潜力[1]。然而,最近的证据也指出了平台经济的持续扩张以及其在测量和治理方面的不足:国际劳工组织(ILO)截至2025年10月统计了全球至少653个活跃的数字劳动力平台(涵盖线上和基于位置的类别),并强调传统的劳动力统计数据仍然未能充分反映平台工作的实际规模[2]。许多平台(如Uber、Didi、inDrive、BiTaksi、Meituan、Getir和Fiverr)使用算法管理系统来处理关键任务,如设定薪酬、制定工作时间表、跟踪绩效和监控员工。这些系统有助于提高运营效率[3]。这些系统使平台能够协调分散的劳动力队伍,但也引发了透明度、公平性和员工自主权等问题,这些问题对于建立员工对平台的信任至关重要,进而影响他们持续参与工作的意愿[4]。

零工经济的迅速扩张通过将算法系统嵌入任务分配、绩效评估和调度等核心管理职能,从根本上改变了劳动关系。现有研究越来越多地从算法管理的角度审视这些系统,强调了它们在提高效率方面的潜力以及对员工自主权、公平性和控制方面的影响[5]、[6]。越来越多的文献表明,员工对透明度和程序公平性的认知在塑造他们对这些系统的反应中起着关键作用[7]、[8]。值得注意的是,算法系统的全球标准化并不等同于员工感知到的透明度,因为员工通常无法接触到背后的决策逻辑,这限制了他们解释或挑战结果的能力,这一现象在先前的研究中被广泛称为“算法不透明性”[7]、[8]。最近的研究还表明,算法系统在透明度、责任性、偏见和用户能动性等方面可能带来治理挑战,从而强调了研究可解释和公平的算法实践如何影响人们对平台中介环境的信任的必要性[9]、[10]、[11]、[12]。尽管取得了这些进展,但文献中仍存在三个关键空白:首先,倾向于将算法管理视为一个整体概念,而非一系列不同的实践;其次,对信任作为连接算法实践与行为结果的中介机制的理论化不足;第三,对于这些机制在不同工作环境和制度背景下是否一致运作的关注不够。

尽管如此,以往的研究大多将算法管理视为一个整体概念,或者单独研究其各个组成部分,从而忽视了不同算法实践可能对员工认知和行为的差异性影响[6]、[7]、[8]、[13]、[14]。更重要的是,这些实践如何转化为行为结果的机制尚未得到充分的理论阐释。特别是信任这一概念,在技术中介环境中被广泛认为是核心因素,但在将算法实践与员工留存结果联系起来的中介机制中尚未得到充分整合[6]、[7]、[8]、[14]。这一局限性具有理论意义,因为算法管理从根本上通过数据驱动的决策过程重构了雇佣关系。在这种环境中,传统的信任线索被削弱,员工必须依赖系统层面的信号(如一致性、可解释性和感知的公平性)来评估平台[3]。因此,信任不仅是一个结果,还是在不确定性和信息不对称条件下促进持续参与的关键心理机制。

此外,现有研究对多个算法实践在同一系统中同时运行的方式关注不足。平台并不是孤立地使用算法功能,而是将薪酬系统、绩效评估、监控机制和调度逻辑整合到一个统一的治理结构中。因此,理解这些实践如何共同和差异性地影响信任对于推进理论和实践都是必要的。为了解决这些问题,本研究采用了一种分解和以机制为中心的方法,考察了五种不同的算法管理实践(薪酬、目标设定、监控与控制、绩效评估和调度),并研究了它们如何影响员工对平台的信任,以及通过信任影响他们继续从事零工工作的意愿。研究表明,算法管理并不产生统一的影响,而是通过不同的心理路径发挥作用,从而更细致和基于机制地理解了平台中介环境中的信任形成过程。这样一来,本研究超越了以往强调总体效应或孤立实践的研究,提供了一个综合的解释,说明了多种算法机制如何共同影响员工的信任和留存决策。

在算法管理的文化与监管环境差异性方面,存在一个重要的研究空白。算法实践的体验并不统一,其解释和影响受到制度逻辑、劳动法规和文化规范的影响。例如,在澳大利亚等监管严格的劳动力市场中,更强的法律保护、透明度要求和争议解决机制可能减轻对算法控制的感知风险,从而稳定信任的形成。相反,在中国或巴基斯坦等快速数字化的经济体中,平台治理的演变往往快于监管监督,员工可能更依赖算法本身所嵌入的程序公平性[15]、[16]。同样,集体主义与个体主义的文化取向也可能影响员工对算法权威的理解,集体主义背景可能对中央化算法控制具有更高的容忍度,但对公平性违规更为敏感[17]。迄今为止,大多数实证研究集中在零工经济平台等特定行业[18]、[19],而忽略了不同文化背景下的潜在差异。此外,大多数研究都是定量的,缺乏定性的深入分析,这限制了结果的普遍性。这突显了需要开展涵盖多种行业和文化背景的混合方法研究,以获得更具代表性的发现。

通过整合来自中国、巴基斯坦、土耳其和澳大利亚四国的数据,本研究认识到算法管理嵌入在多样化的制度、监管和文化环境中。然而,多国研究的目的是为了考察不同国家之间的结构差异,而不是为了确定国家间的结构等价性。相反,该研究使用了一个汇总的多国样本来检验不同平台工作环境中的关系,并评估测量模型在不同国家组之间的适用性。为了支持这一目标,研究人员使用MICOM程序评估了测量不变性,确认四个国家样本中对核心构念的解释是一致的(见附录2)。建立测量不变性可以减少观察到的信任形成差异是测量不一致性的可能性。因此,本研究采用了跨情境的测量可比性逻辑,而不是完全的比较国家设计。尽管研究包括了多种零工类型以增强实证广度,但零工类型被视为一个控制变量,而不是用来解释行业特定差异的基础。这种方法使研究能够聚焦于核心理论问题:不同的算法管理实践如何影响信任和持续参与意愿。

基于这些理论和实证空白,本研究提出了以下研究问题,以系统地探讨不同的算法实践如何影响信任和后续的持续参与意愿:
RQ.1. 算法管理实践(薪酬、目标设定、监控与控制、绩效评估和调度)如何影响对平台的信任?
RQ.2. 对平台的信任在多大程度上中介了算法管理实践与员工持续参与零工工作的意愿之间的关系?

本研究基于社会交换理论[20]和算法管理理论[3],采用了解释性-顺序设计方法来回答上述问题。我们结合了已建立的薪酬、目标设定、监控与控制、绩效评估、对平台的信任以及持续参与零工工作的意愿的量表,以提供定量的可靠性和定性的深度。本研究的贡献不仅在于将算法管理分解为多个维度,还在于实证证明了这些实践对信任形成的影响是不同且不可替代的。通过同时建模五种实践,研究确定了明确的影响层次,其中绩效评估和调度是影响信任的主要驱动因素,而薪酬则没有显著效果。这一模式挑战了算法治理同质性的隐含假设,并通过具体说明哪些算法机制对维持员工参与最为重要,进一步推进了现有研究[21]。结果还显示,信任在目标设定、监控与控制、绩效评估和调度与员工持续参与意愿之间的关系中起到了中介作用,而薪酬路径的影响不显著。进一步的中介分析表明,这些中介关系是互补的或部分中介的,而非排他的,表明信任是核心因素,但不是唯一解释持续参与的因素。

本研究为平台运营商和产品/算法团队(如负责治理选择的人员,例如可解释的绩效指标和可预测的调度)、专注于基于信任的互动和可争议性的设计者、寻求制定劳动平台算法责任标准的监管者和政策制定者,以及研究劳动心理学与算法治理交叉领域的学者提供了实际意义。

2. 理论基础
本研究基于两个互补的理论视角:社会交换理论(SET)和算法管理理论(AMT)。我们不是将这两个视角简单拼凑在一起,而是先分别阐释每个理论,然后再进行正式整合。这种方法提高了概念的清晰度,使每种理论都能充分阐述其解释贡献,然后再评估它们的综合解释能力。具体来说,SET解释了零工员工如何根据互惠性、公平性和信任来解读平台互动;而AMT则阐明了算法系统如何通过自动化控制、评估和协调机制来构建这些互动。

2.1. 社会交换理论(SET)
SET为理解个体如何根据感知到的成本、收益和互惠义务来评估关系提供了基础[20]、[22]、[23]。在组织背景下,SET被广泛用于解释公平性、信任和相互义务如何影响员工的态度和行为结果。在基于平台的零工工作中,当传统的雇佣关系被技术中介的互动所取代时,SET仍然非常重要,因为员工继续评估平台是否满足隐含的交换期望。

在本研究中,SET解释了零工员工如何将算法管理实践解读为关系意图的信号。透明目标设定、公平的绩效评估和可预测的调度等实践被视为互惠公平的指标,从而促进了对平台的信任。相反,不透明或不一致的实践则被视为对交换规范的违反,削弱了信任并降低了员工的承诺度。因此,信任成为员工评估平台是否履行交换关系中的义务的核心评估机制。

在零工工作环境中,由于多重心和组织附着力较弱的特点,交换关系超出了平台特定的互动范围,扩展到了更广泛的职业参与中。因此,通过算法实践形成的信任不仅影响平台层面的行为,还影响工人继续参与零工工作的意愿,将其作为谋生策略。2.2. 算法管理理论(AMT)AMT解释了数字平台如何通过数据驱动的系统协调和控制劳动力,这些系统自动化了传统的管理职能,如任务分配、监控、评估和报酬[5]、[7]。与以人为中心的管理不同,算法系统通过嵌入式规则、实时数据处理和不透明的决策逻辑运作,从根本上重塑了数字劳动环境中的工作性质和控制方式。AMT强调,算法系统在提高效率的同时,也产生了与透明度、自主性和公平性相关的新矛盾。例如,虽然算法监控可以优化绩效,但也可能引发被监控感和失控感的感知。同样,自动化的绩效评级和报酬系统看似客观,但实际上可能被视为不透明或无可争议的。在本研究中,AMT提供了一个结构框架,将算法管理实践概念化为不同的操作机制,包括报酬、目标设定、监控、绩效评级和调度。每种实践都体现了不同的控制、透明度和可预测性配置,这影响了工人对平台治理的体验。通过将这些算法管理要素分解开来,本研究符合最近要求超越单一概念化的趋势,探讨特定算法实践对工人结果的不同影响[6]、[14]、[24]。图1提供了本研究的概念框架。下载:下载高分辨率图片(422KB)下载:下载全尺寸图片图1. 概念框架虽然之前的研究经常通过引入调节变量(如感知的自主性、算法透明度和公平性感知)来扩展算法管理模型,但这些研究主要侧重于识别边界条件,而不是剖析算法实践如何影响工人结果的潜在机制[5]、[6]、[7]、[8]、[14]。例如,以往的研究考察了透明度和自主性如何影响工人对算法控制的反应,通常将这些因素视为条件性调节因素而非核心解释路径[3]、[24]。2.3. 结合SET和AMT尽管SET和AMT提供了不同的解释视角,但本研究提出了一个理论上的整合框架,在该框架中,这两种视角既顺序运行又互补。具体来说,AMT解释了算法系统的结构和技术特性,而SET则解释了工人如何从认知和关系的角度解读这些特性。这种整合提出了一个两阶段机制:首先,算法管理实践产生诸如透明度、一致性和可控性等可观察的系统属性(AMT);其次,工人通过互惠性和公平性的视角来解读这些属性(SET),从而形成对平台是否履行其关系义务的判断。信任作为这一过程的核心评估结果出现,将算法结构与行为意图联系起来。通过结合AMT的结构重点和SET的关系逻辑,该框架解释了为什么算法实践会对信任产生不同的影响。增强程序清晰度和感知公平性的实践会加强互惠期望和信任,而不透明的实践则无法激发基于交换的评估。这种整合的视角提供了一种连贯且基于机制的解释,说明了算法管理如何影响零工员工的留存。3. 假设开发由于我们的因变量是持续参与(即在长期体验后的持续参与),因此所关注的信任构建必然是采纳后的信任,而不是最初的采纳信念。在采纳后环境中,工人会评估平台的算法治理是否在反复互动中保持可靠、公平和可预测,这些更新的评估决定了他们是否会继续使用该平台作为谋生途径。这种逻辑与期望-确认视角关于持续性的观点一致,即持续的体验会随着时间的推移修正信念并加强(或削弱)持续参与的意愿[25]、[26]。据此,以下假设阐述了不同的算法实践如何塑造工人对平台的认知-制度信任,进而预测持续参与。为了确保概念的清晰性并避免算法管理维度之间的重叠,每个构建都按照其最初的操作化方式被视为功能上独立的[34]。具体来说,目标设定(GS)定义了绩效目标和评估标准;监控和控制(MC)捕捉活动的实时跟踪和调节;绩效评级(PR)反映了结果的评估;调度(SCH)管理任务分配和时间结构;报酬(COM)决定了奖励机制。这种划分确保每个假设都能单独识别特定算法实践影响信任的独特机制。3.1. 算法目标设定(GS)GS指的是使用平台算法来设定和传达绩效目标(例如,任务量、接受阈值、服务水平指标),并指定评估目标达成标准。它反映了工人认为算法分配的目标是明确的、可实现的,并且与他们的能力相符的感知[27]。根据将算法目标设定视为绩效目标和评估标准概念化的观点[34],GS主要作为一个结构化机制运作,减少对预期输出的不确定性,而不是作为反馈机制。从SET的角度来看,明确定义且可实现的目标信号了程序公平性和期望的一致性,这是互惠交换关系的基础[23]。当工人认为绩效目标是透明的、稳定的,并且与客观标准相一致时,他们更有可能将平台视为可靠和可预测的。AMT进一步指出,目标设定的清晰性通过明确任务分配和评估的规则,增强了感知的程序正义[5]。重要的是,与监控或评级机制不同,GS并不直接提供评估反馈,而是定义了评估绩效的标准。这种区分至关重要,因为将目标设定与反馈机制混淆会模糊GS作为结构治理工具的独特作用,而不是动态评估过程的功能。因此,当算法分配的目标被感知为明确、可实现并且一致应用时,它们减少了不确定性并增强了工人对平台治理逻辑的信心,从而促进了信任……因此,我们提出:H1算法目标设定与零工员工对平台的信任正相关。3.2. 算法监控和控制(MC)MC指的是使用算法实时跟踪、监督和调节零工员工的活动。它包括GPS跟踪、活动日志和自动化反馈系统等监控机制,这些机制影响工人的行为和自主性[27]。透明度对于建立与零工员工的信任至关重要,MC可以增强工作过程的跟踪。清楚了解自己的绩效将被如何衡量和监控,减少了工人的不确定性,并促进了公平感。MC通过SET和AMT解释的机制增强了零工员工对平台的信任。例如,基于SET[20],我们认为开放的算法机制产生了可预测的资源交换,员工相信自己会因为付出努力而得到公平的报酬(例如,支付、奖金),这通过相互义务和减少关于平台期望的不确定性建立了信任。AMT关注程序正义[3]:实时反馈和客观指标减少了“黑箱”效应,使工人将监控视为公平和支持自己的行为,而不是操纵行为。与其概念定义一致,算法监控和控制(MC)具体指的是对工人活动的持续跟踪和调节,而不是提供评估反馈或目标设定功能[34]。其主要作用在于通过使工作过程可见和可测量,减少平台与工人之间的信息不对称性。从SET的角度来看,透明的监控机制在被视为公平和非任意时可以增强信任,因为它们表明结果基于可观察的努力而不是隐藏的决策规则[20]、[23]。然而,与目标设定不同,MC引入了双重效应:虽然可见性可以减少不确定性,但过度监控可能会削弱感知的自主性并引发控制不对称的感知。AMT强调,监控系统通过其透明度、侵入性和可预测性程度影响工人的感知[5]。当监控被视为一致且基于规则而不是随意的时,它可以促进程序公平性和可靠性,从而支持信任的建立。因此,我们提出以下假设:H2算法监控和控制与零工员工对平台的信任正相关。3.3. 算法绩效评级(PR)PR指的是使用算法根据预定义的指标(如客户评分、任务完成率或遵守时间表)来评估零工员工的绩效。它包括这些评分的计算方式、传达方式以及如何用于影响工人的机会或处罚[27]。数据驱动的绩效评级提供了一种统一且公正的机制来评估零工员工的产出。这种客观性有可能在工人中建立极大的信任,因为他们感到自己的评估基于客观标准,而不是任意的权威。根据研究,绩效指标与管理系统的信任水平相关——在员工眼中,客观的绩效指标不太容易受到偏见的影响[28]。PR通过符合SET的核心原则和AMT,增强了零工员工对平台的信任。SET广泛认为信任源于被视为公平和公正的互惠交换[20]。当算法评级是透明且基于绩效的时,工人将其视为对其努力的公平认可,满足了关系义务,并促进了互惠。例如,系统通过给予高绩效者的实际“奖励”(如优先任务或奖金)来表示公平,并强化了工人相信平台致力于公平对待的信念。AMT强调透明度和可预测性减少了不确定性[3]。超级透明的和可操作的绩效衡量方式(如显示实时客户评级的按钮)将算法逻辑变得透明化,使工人能够将自己的行为与平台的期望对齐。这种透明度创造了反透明度,使工人能够将评级视为客观和可操作的,而不是任意的。此外,使用适应性设计(如根据交付延迟等外部因素调整分数)可以提高程序公平性,并传达了对工人能动性和所面临挑战的尊重。基于算法机制的PR通常有向工人传达的规格和衡量标准。许多平台在这方面变得更加透明,帮助零工员工了解自己的绩效是如何被评估的,从而可能在平台中建立信任。研究表明,知道评估标准的工人更有可能信任该系统[29]并对评估结果有信心[29]。虽然这些评级可以作为绩效的客观指标,但也可能导致公平性和准确性问题[30]。研究表明,当绩效评级被视为透明且基于明确的标准时,它们可以增强对组织和所用算法的信任[31]。PR通常包含一个反馈循环,为工人提供关于其绩效的反馈,帮助他们理解如何更好地完成工作,提高了他们对工作的能动性和控制感。文献表明,建设性的反馈是建立信任的关键之一,因为反馈表明平台关心工人的成长和成功[32]。PR可以提升试图获得任何 level of 认可或奖励的零工员工的信心。这种认可可以增强他们对平台的信任,因为他们感到自己的投入得到了适当的认可和补偿。研究表明,通过PR积极地强化员工可能会对信任和参与度产生重要影响[33]。算法系统为工人评估制定了统一的标准。这种一致性在工人看到自己不受与其他人不同的标准对待后,可能会产生公平感。定期评估使人们对管理实践产生信任,因为他们知道可以期待什么[34]。基于这种理解,我们提出以下假设:H3算法绩效评级与零工员工对平台的信任正相关。3.4. 算法调度(SCH)SCH指的是根据需求模式、工人可用性和位置等因素,使用算法为零工员工分配任务、班次或工作时间。它包括工人认为调度过程有多灵活、多可预测和多公平[27]。对于零工员工来说,算法调度允许工作模式和时间表有可预测的模式,减少了围绕他们生活的许多不确定性。知道他们何时会被安排工作,使员工能够相应地安排个人生活。工作计划的可预测性与对管理系统的更高信任度相关,因为这让人对自己的工作环境有一种控制感[35]。基于自动化管理工作理论(AMT),我们认为,科学的工作计划(SCH)通过透明度和可预测性增强了零工对平台的信任。明确的排班逻辑(例如,实时查看在不同指标上的表现)有助于减少“黑箱”效应,使工人能够了解如何将自己的努力与平台的目标对齐,而自适应排班(例如根据可用性调整)则在自主性和支持之间取得平衡,从而强化了程序公平性[3]。根据公平分配理论(SET),劳动的公平分配和及时奖励有助于满足相互义务,这是工人内心感受到的互惠和公平,进而增强了组织认同感[20]。研究表明,算法调度可以通过使工人的可用性与需求相匹配来提高生产力[24]。然而,这种调度方式的有效性取决于工人认为他们的排班是否公平以及他们是否对其有一定的控制权。当算法调度被视为公平的时候,它可以增强对组织的信任,并提升平台的使用率[36]。这些算法化的调度方法通常是基于数据来管理零工的工作分配的,这使调度过程更加客观,也可能减少许多人对主观人工调度方式的不公平感。公平的工作分配被认为是建立工人和管理层之间信任的关键因素[37]。当调度通过算法进行管理时,决定工作分配的标准和过程对工人来说是透明的。这种透明性可以培养信任感,因为工人可以看到决策是如何做出的,以及为什么他们在特定时间被选中承担某个任务或角色。正如研究证明的那样,组织环境中的决策透明性可以促进信任[38]。通过科学的工作计划,零工拥有更多的自主权,可以控制自己的工作时间。策略性地让工人对自己排班有一定发言权和控制权已被证明可以提升工作满意度和对平台的信任[17]。尽管科学的工作计划允许工人在某些时候选择高峰时段,但它并不需要在工作与生活之间取得平衡。实现这种平衡对于维护工人的福祉、满意度以及最终对平台的信任至关重要。研究发现,当工人相信在调度中考虑到了他们的个人需求时,他们对组织的信任度会更高[39]。这种先进的作业调度方法有助于减少工作分配中的冲突和重叠,使零工能够更顺畅地工作,减少挫败感。当调度冲突减少时,工人对平台有效管理其工作的信任度也会增加。在组织环境中,有研究表明有效的冲突解决机制能够建立信任[40]。基于此,我们提出:H4 算法调度与零工对平台的信任度呈正相关。

3.5. 算法报酬(COM)
算法报酬指的是使用算法根据任务完成情况、行驶距离、花费的时间或供需动态等因素来确定零工的报酬或收入[27]。它涉及平台算法所规定的报酬结构的透明度、公平性和可预测性。算法报酬通过促进透明度和互惠性增强了零工对平台的信任。自动化管理工作理论(AMT)解释说,即使是透明的报酬逻辑(例如实时追踪收入)也能减轻不确定性,即工人贡献与回报之间的摩擦,从而强化他们的程序公平感[3]。公平分配理论(SET)认为,一致的、基于绩效的回报是满足相互义务的必要条件——意味着工人在资源交换中感受到公平,从而在关系互惠层面上增强了信任[20]。算法通常负责报酬的确定,这往往依赖于绩效指标,虽然这可以激励生产力,但如果被视为不公平,也可能导致被剥削的感觉[41]。算法报酬与信任之间的关系很复杂;例如,透明且基于绩效的算法报酬形式可以建立信任,而不透明或惩罚性的形式则会削弱信任[42]。此外,当工人认为他们会根据自己的贡献获得报酬时,他们会发展出对公司的一种归属感和承诺,这会增加他们使用算法平台的意愿[43]。然而,如果工人觉得他们的报酬完全由算法决定而没有人为监督,可能会导致不信任和不愿参与平台[44]。以数据为导向的计酬和奖金指标通过算法管理报酬系统直接支持零工对公平性的认知。当报酬与客观标准挂钩时,工人对平台的信任度更高[45]。算法报酬是一个一致的功能,它将相似的任务和角色匹配在一起。因此,所有工人都会感到受到平等对待,因为报酬被视为标准化的而非任意的。获得一致报酬的做法减少了偏袒或偏见的感觉,因此已经记录了可靠的管理系统[46]。如果绩效指标与报酬结构直接相关,零工可能有更大的动力在角色中表现出色。所有这些基于绩效的报酬方式都可以帮助建立对平台的信任,因为工人感觉他们的工作得到了考虑和相应的奖励。有证据表明,基于绩效的激励可以增强工人的信任和参与度[47]。一些算法报酬系统甚至有反馈机制,向工人传达他们的表现情况,并提供关于报酬如何与之相关联的信息。由此产生的反馈可以鼓励工人提高表现,从而增强他们的控制感和自主性。当工人收到建设性的反馈时,他们对平台和报酬系统的信任度会增加[48]。在某些算法报酬模型中,零工甚至可以对报酬结构有发言权(例如,在多种报酬方案中选择或自行设定费率)。在报酬制定过程中提供明确的输入可以建立对平台的信任,因为工人感到自己参与了工资的相关决策。据说,参与式的报酬设计方法可能会增加工人的信任[49]。基于此,我们提出:H5 算法报酬与零工对平台的信任度呈正相关。

3.6. 信任与持续使用的意愿
对平台的信任代表了采用后的一个关键评估,它直接影响了工人的行为意向。在公平分配理论(SET)的框架内,信任作为一种稳定机制,减少了持续交换关系中的感知风险和不确定性[20]、[23]。当工人信任平台时,尽管零工工作中存在收入波动性和任务不可预测性等内在不确定性,他们也更愿意继续参与[25]、[26]。在算法中介的环境中,由于人际互动有限,对系统的信任替代了人际信任,成为持续参与的主要决定因素。与此逻辑一致,最近来自中国自主出租车采用情况的混合方法研究表明,对人工智能中介移动系统的信任,以及感知到的安全性和风险评估,在塑造用户继续使用自动化服务平台的意愿方面起着核心作用[50]。因此,目前的假设强调信任作为持续使用意愿的关键驱动因素,而不是关注信任的形成过程[56]。所以我们提出:H6 对平台的信任与零工在零工工作中的持续使用意愿呈正相关。

3.7. 作为中介的对平台的信任
本研究中的平台信任被概念化为一种认知-制度信任,反映了零工对平台算法系统的理性评估,包括其可靠性、程序公平性和透明度。与基于情感的人际信任不同,后者源于情感纽带,本研究关注的是对非个人化、技术中介的治理结构的信任,特别是嵌入在数字平台中的算法决策系统。这种信任基于工人期望平台将一致、公平且可预测地运作的预期,从而减少了交换关系中的不确定性[21]、[51]。在算法管理的背景下,这种信任主要由可解释性、问责制和基于规则的一致性的感知所塑造,这与以往强调数字平台中的技术型和制度型信任的研究结果一致[8]、[52]。它反映了工人相信平台会以其最佳利益行事,提供公平对待,并履行承诺的信念,从而影响他们使用和依赖平台的意愿。当工人使用平台时,他们更有可能以积极的方式使用其功能——包括算法报酬(COM)、里程补偿(MC)和科学的工作计划(SCH)[53]。重要的是,这项研究专门关注技术中介(算法)信任,而不是人际信任,因为零工主要与自动化系统互动,而不是人类管理者。这种区分很关键,因为算法管理将信任的重点从个人转移到了系统,信任是通过数据驱动的客观性、透明性和程序正义的感知来形成的[24]、[54]。因此,这种信任捕捉了工人对平台及其算法治理机制的制度逻辑的信心,而不是对组织或其代表的感情依恋。研究一致指出,信任影响员工对算法系统的感知和互动方式(Cabiddu等人,2022年)。当信任建立起来时,员工更有可能接受算法管理实践并参与平台。相反,缺乏信任可能导致对算法平台的抵制和怀疑,最终影响其采用和有效性(Liu,2024年)。因此,组织必须通过透明做法、清晰沟通以及员工在算法系统设计和实施中的参与来优先建立信任(Tan等人,2021年)。这种对信任的关注可以提升员工满意度,并培养积极的组织文化。算法报酬可以增强信任,因为工人认为他们的报酬是公平和透明的。这意味着当零工相信他们的报酬是由客观指标决定的时,他们会感到更加受到重视和满意,因此更愿意成为该平台的忠实用户。研究表明,信任可以调节报酬满意度对员工留存率的影响[55]。然而,良好的沟通、公平和适当的目标也能提高对平台的信任。当信任调节目标清晰度与员工承诺之间的关系时,研究表明,当目标明确且他们信任平台时,工人更容易受到目标的影响[56]。此外,在这种情况下,信任起到了关键的中介作用。如果工人相信算法确定的目标是合理的且符合他们的最佳利益,他们通常会乐于在平台上合作(Cabiddu等人,2022年)。另一方面,如果工人认为目标设定过程是随机的或有偏见的,那么他们可能会选择脱离平台(Chan等人,2023年)。因此,建立对良好系统的信任对于促进平台的积极使用结果至关重要。里程补偿(MC)可能会引起焦虑,但如果以透明和公平的方式进行,也可能建立信任。只有当他们相信自己受到监督且表现不会受到惩罚时,他们才会积极使用平台。根据迄今为止的研究[57],信任调节了监控实践与员工表现之间的关系,以及他们留在平台上的意愿。当员工认为算法监控是透明和公平的时,它有助于建立员工与组织之间的信任[52]。相反,不透明的监控实践可能会引发对算法平台的不信任和抵制[58]。这种二分法突显了信任作为算法监控与使用算法平台意愿之间的中介因素的作用。如果绩效补偿(PR)被视为客观和公平的,那么它可以建立信任。当零工相信他们的表现是根据可见的指标来评估的,这会激发他们努力工作的动力,并保持对平台的忠诚。根据研究,信任在绩效评估与留任意图之间的关系中起着中介作用,这揭示了仅仅进行绩效评估实践的重要性[59]。然而,绩效评估可能会在员工中引发焦虑和不信任,因为他们可能觉得自己受到了不公平的評價[60]。绩效评价会影响信任,而信任是核心;如果对算法平台缺乏信任,员工可能会犹豫是否继续使用该平台[61]。灵活的工作模式(SCH)能够为员工提供工作时间的可预测性和控制感。当员工相信排班是公平制定的,并且考虑到了他们的偏好时,他们会对平台更加满意和忠诚。排班实践与员工参与度之间的关系据说受到信任的调节,这影响了员工继续在平台上工作的意图[62]。这些讨论和证据促使我们提出以下假设:

H7:对平台的信任调节了算法目标设定与灵活工作模式中基于平台的持续参与意图之间的关联。
H8:对平台的信任调节了算法监控与控制与灵活工作模式中基于平台的持续参与意图之间的关联。
H9:对平台的信任调节了算法绩效评价与灵活工作模式中基于平台的持续参与意图之间的关联。
H10:对平台的信任调节了算法排班与灵活工作模式中基于平台的持续参与意图之间的关联。
H11:对平台的信任调节了算法薪酬与灵活工作模式中基于平台的持续参与意图之间的关联。

4. 方法论
我们采用了一种基于后实证主义范式的解释性-序列混合方法设计[63],[64],该范式承认尽管存在客观关系,但这些关系只能被不完全地观察到,因此需要通过方法论上的三角验证来加以补充。这种范式支持定量方法和定性方法的整合,其中调查数据提供了可推广的理论测试证据,而定性访谈则提供了关于潜在机制的背景深度和解释性见解[65],[66],[67]。虽然通常推荐使用纵向(时间滞后)设计来测试中介关系,但本研究采用了横断面的解释性-序列混合方法,这在理论上和方法上都比较适合研究目标。具体来说,本研究旨在将算法管理分解为五个不同的维度(薪酬、目标设定、监控、绩效评价和排班),并考察它们对信任和员工留任的不同影响。这种细致的概念化需要一种能够同时捕捉灵活工作者实时体验到的多种算法实践的设计。

此外,最近的方法论研究表明,当有坚实的理论基础、适当的统计技术(例如PLS-SEM中的自助法)和互补的定性验证支持时,可以在横断面设计中稳健地测试中介效应[68]。在本研究中,使用了10,000次自助重抽样,并结合了调查六个月后进行的深度访谈的定性三角验证,从而提供了时间和解释上的深度,部分解决了因果关系的问题。因此,研究分为两个独立但相互关联的阶段进行:

第一阶段:定量调查
我们使用了一种基于网络的结构性问卷作为监测工具,收集了来自中国、巴基斯坦、澳大利亚和土耳其四个不同国家的790名灵活工作者的数据。基于现有的量表,我们考察了平台支持方面(目标设定、监控与控制、绩效评价、排班、薪酬流程)与员工对算法管理系统的信任之间的十一个假设路径,这些路径又与员工继续与平台合作的意图相关联。我们使用PLS-SEM来评估模型拟合度、路径系数以及直接效应和中介效应的大小。

第二阶段:定性访谈
基于定量调查的结果,我们对每个国家有目的性地选取了10名参与者(总共40名),进行了半结构化访谈。为了确保方法论的一致性,定性阶段被明确设计为定量调查结果的解释性扩展,而不是作为一个独立的探索性组成部分。按照解释性-序列混合方法的原则,PLS-SEM分析的结果直接指导了访谈的重点和结构。具体来说,定性阶段旨在揭示在第一阶段观察到的统计学上显著和不显著关系背后的机制。这种方法能够从理论角度解释为什么以及算法实践如何塑造信任,而不仅仅是识别这些关系是否存在。因此,这两个阶段在分析上是相互关联的,定性发现提供了机制层面的见解,这些见解将定量分析中识别的普遍模式进行情境化和扩展,从而增强了研究的解释深度和内部有效性[63],[65]。访谈探讨了算法管理实践的实际体验以及信任变化的过程。随后进行了主题分析[69],以揭示第一阶段观察到的数字模式在灵活工作中是如何以及为什么具体体现的。

通过这种方式将定性深度添加到定量广度中,我们旨在优化内部有效性(通过强有力的假设检验)和外部有效性(通过在问题中融入丰富的实践者视角)[70]。这种策略使我们能够通过工作者自己的声音来理解统计结果,并生成既具有普遍性又具有情境性的发现[65]。

4.1 第一阶段:定量调查
4.1.1 样本和程序
2024年最后一个季度,我们发放了一份结构化的在线问卷,从中国、巴基斯坦、土耳其和澳大利亚的灵活工作者那里收集数据。受访者是通过像Uber、Didi、inDrive、BiTaksi、Meituan、Getir、Fiverr等平台招募的,采用目的性抽样方法;这样做是为了确保受访者至少有六个月的经验,熟悉算法管理系统,并且在过去三个月内平均每周工作至少20小时。问卷采用了经过验证的量表(来自[27]的算法管理实践、信任[71]、继续工作的意愿[72]),采用7点李克特量表(1=强烈不同意,7=强烈同意)来衡量这些构念。完整的问卷工具附在附录1中。为了实现这些资格标准,在问卷开头加入了明确的筛选问题(见附录1),以确保只有具有足够经验、工作强度和接触算法管理系统经验的受访者才能被纳入分析。

通过平台社区(例如司机论坛、自由职业者群组)、致力于灵活工作者的社交媒体群组以及研究团队的专业网络来识别和联系参与者。最初的联系信息解释了研究目的和资格标准(至少六个月的平台经验),随后是一个筛选问题以确保受访者熟悉算法管理系统。这种目的性方法确保受访者拥有足够的经验知识来有意义地评估算法实践,这与先前的研究一致,这些研究强调了基于经验的数字系统评估。然后,将由双语专家将英文问卷翻译成土耳其语、乌尔都语和中文,并再进行回译成英文,以确保语义等效性和减少响应偏差,从而保证跨文化有效性[73]。调查使用Google Forms和Questionnaire Star进行,受访者被要求提供电话号码的最后四位数字以避免重复提交。为了感谢他们的参与,他们获得了价值5美元的礼品券,这符合激励性研究的伦理指南[74],[75]。

在全面部署之前,进行了一项小规模测试(每个国家20名受访者),确认所有项目都清晰可靠(所有构念的Cronbach’s α > 0.70)。数据经过清理,排除了不完整的回答以及与直线回答或异常值(±3个标准差)相匹配的回答,最终得到790个可用回答,总响应率为66.89%(中国:270(69.77%);巴基斯坦:230(71%);土耳其:140(58%);澳大利亚:150(68.8%))。为了进一步评估跨情境的测量可比性,使用了MICOM程序检查了测量不变性,详细结果报告在附录2中。这些结果表明,各国的构念解释是一致的,从而降低了汇总模型结果受测量误差影响的风险。然而,MICOM并未确立各国结构路径系数的等同性,本研究也不声称要测试国家层面的结构差异[76]。数据以匿名方式存储在加密服务器上,所有参与者都明确同意数据的使用,以遵守伦理规范。

选择中国、巴基斯坦、土耳其和澳大利亚作为研究对象,是出于理论上的考虑,这些国家在制度环境、监管框架和文化取向方面存在差异,这些差异与算法管理相关。这些国家代表了不同的经济和监管背景,从高度规范的劳动力市场(例如澳大利亚)到数字化迅速发展的经济体(例如中国和巴基斯坦),其中平台治理与新兴的制度框架同步发展。此外,个体主义-集体主义等文化维度的差异为检验信任形成机制在不同情境下的稳定性提供了有意义的依据。这种决定性的方法在提供学术严谨性的同时,也具有实际可行性,从而能够细致地了解算法管理实践如何在不同文化背景下塑造灵活工作者的信任和长期参与度。这里所说的“继续工作的意愿”是指基于平台的持续参与意图,而不仅仅是对灵活工作的职业承诺或平台忠诚度的纯粹衡量。调查问题要求受访者评估他们继续与平台合作的意愿,鉴于算法管理和信任是通过特定平台系统体验的,这是合适的。同时,由于灵活工作者通常参与多个平台生态系统,这一构念被理解为基于受访者当前或主要平台经验的持续参与。因此,手稿避免将这一结果视为纯粹的职业层面构念,而是将其称为基于平台的持续参与意图。

4.1.2 分析方法
本研究使用了偏最小二乘结构方程建模(PLS-SEM)。由于其能力包括处理具有多个自变量和中介变量的复杂预测模型,PLS-SEM非常适合确定自变量与因变量之间的线性关系[68]。该方法强调最大化因变量(继续工作的意愿)的解释方差,这与本研究的目标一致,即识别影响灵活工作者持续参与度的强预测因素。选择PLS-SEM是因为它适用于以预测为导向的研究,并且能够处理具有多个自变量和中介关系的复杂模型,而不是基于样本大小的考虑。鉴于本研究旨在最大化继续工作意愿的解释方差并考察通过信任实现的多种间接效应,PLS-SEM特别适用[68]。

重要的是,与基于协方差的SEM不同,PLS-SEM不要求严格的多元正态性假设,并且由于其依赖于自助法进行统计推断,因此对非正态数据分布具有很强的鲁棒性[68]。为了评估数据的分布特性,我们使用偏度和峰度统计量进行了正态性测试。结果表明,偏度值介于-1.21到1.34之间,峰度值介于-1.18到1.56之间,都在可接受的范围内(偏度的±2范围内,峰度的±7范围内),表明没有严重的正态性偏离。然而,考虑到数据集的多国性质以及跨文化调查数据中可能存在潜在的非正态性,PLS-SEM仍然是一个稳健且适当的分析方法[68]。此外,该方法对小样本量的鲁棒性以及能够对层次化构念进行建模(形成性测量与反思性测量之间的差异)的能力,使我们有信心即使在四个国家的数据集中存在潜在的异质性,该方法也能可靠[76]。样本量(790个有效响应)明显超过了10倍规则(每个预测变量10个案例),这足以确保检验提出的假设的统计功效[68]。

4.1.3 共同方法偏差(CMB)
在自我报告研究中,CMB是一个潜在的问题,当响应的方差来源于测量方法而不是构念本身时就会出现[78]。为了减轻CMB,本研究在数据收集和统计测试过程中实施了程序控制,遵循了PLS-SEM研究的最佳实践[68]。为了减少评估焦虑和社会期望的响应,确保了参与者的匿名性和保密性[78]。另外,如前一节所述,我们还应用了最佳程序实践来最小化CMB威胁,例如:修改了经过验证的量表以提高清晰度,并进行了小规模测试以确保可理解性;使用7点李克特量表来捕捉细微的响应并减少顺从偏差[68];由双语专家将问卷翻译成土耳其语、乌尔都语和中文,并进行回译以确保语义等效性和减少文化响应偏差[73];提供礼品券以保持响应质量,同时避免强制行为。调查的横截面设计采用了区分方法,将独立变量(算法实践)、中介变量(信任)和因变量(继续工作的意愿)分别放置在不同的部分中,以减少启动效应[78]。为了统计上评估共同方法偏差(CMB),根据当代方法学建议[68]、[79]进行了多项补充性测试。首先,Harman的单因素测试显示,第一个未旋转的因素解释了总方差的36.38%,远低于50%的临界阈值,表明没有单一的潜在因素主导了数据(见附录5)。虽然这个测试本身不够充分,但它提供了初步的诊断基线。其次,根据Kock(2015)的方法,检查了完全共线性方差膨胀因子(VIFs)。所有潜在结构的VIF值都低于保守的3.3阈值(例如,TRUS VIF = 1.015;MC VIF = 2.646),这表明共同方法偏差不太可能扭曲结构关系(表2)[79]。此外,没有观察到过高的构念相关性(>0.90),排除了由多重共线性引起的CMB[68]。重要的是,样本中观察到的性别不平衡(59.87%为男性,25.95%为女性,14.18%未披露)反映了零工经济平台(特别是在共享出行和配送领域)的典型人口构成,并不本质上表明存在共同方法偏差。CMB涉及测量误差,而不是样本构成。尽管如此,为了确保研究的稳健性,性别被作为一个控制变量纳入结构模型中,额外的稳健性检查确认关键关系在不同性别组之间保持稳定。因此,程序性保护和稳健的统计测试的结合确认了CMB不会影响研究结果的有效性,确保了其稳健性。

表2. 构念的可靠性和有效性
变量 项目载荷 T统计量 VIF* VIF** α CR(rho_a) CR(rho_c) AVE
算法补偿 COM1 0.837*** 72.208 2.06 3.01 0.875 0.876 0.914
COM2 0.86*** 94.034 2.224 0.846 3.01 0.867 0.970
算法目标设定 GS1 0.853*** 88.282 2.386 2.86 0.901 0.902 0.717
GS2 0.838*** 75.207 2.237 0.86 85.511 2.462
算法目标设定 GS3 0.847*** 80.469 2.343 0.847 0.837 0.782
继续担任零工的工作意愿 INC1 0.881*** 103.57 2.109 3.06 0.84 0.84 0.904 0.758
INC2 0.858*** 80.685 1.873 0.872 97.233 2.072
算法监控和控制 MC1 0.853*** 84.527 2.174 2.646 0.88 0.881 0.918 0.736
算法监控和控制 MC2 0.864*** 88.815 2.309 0.86 87.365 2.234
算法监控和控制 MC3 0.852*** 80.997 2.168 0.852 0.864 0.754

4.1.4. 描述性结果
研究样本包括来自澳大利亚(18.99%)、中国(34.18%)、土耳其(17.72%)和巴基斯坦(29.11%)的790名零工工作者,以确保跨文化多样性。大多数(81.90%)将零工作为主要工作,其中51.52%每周工作超过30小时,突显了零工工作为收入来源的行为。根据参与者进一步被分为四个角色(共享出行(33.67%)、食物配送(27.72%)、自由职业(22.28%)和其他零工(16.33%),平台的作用也随之显现。在教育水平上,40.13%的受访者拥有大学文凭/证书,31.52%拥有学士学位,14.81%拥有硕士学位,表明劳动力具有中等教育水平。这一特征突显了样本在多大程度上代表了依赖算法平台谋生的零工工作者(表1)。

表1. 人口统计特征(N=790)
人口统计 类别 频率(n) 百分比(%)
性别 男性 473 59.87
女性 205 25.95
不愿披露 112 14.18
零工类型 食物配送 219 27.72
共享出行 266 33.67
自由职业 176 22.28
其他零工 129 16.33
教育水平 高中及以下 107 13.54
大学文凭或证书 317 40.13
学士学位 249 31.52
硕士学位 117 14.81
全职工作 是 647 81.90
否 143 18.10

4.1.5. 收敛有效性
应用Fornell-Larker标准通过因子载荷、Cronbach’s alpha(α)和平均提取方差(AVE)来建立所有构念的收敛有效性,如表2所示。因此,所有因子载荷均超过了0.837的限制,超过了0.70的阈值[68],除了TRUS2,为了更好的拟合将其移除。Cronbach’s alpha和CR值分别在0.837到0.911和0.902到0.933之间,都超过了0.70的阈值。AVE值(0.717–0.758)超过了0.50的临界区间,再次证实每个构念解释了其指标方差的50%以上。TRUS表现出良好的可靠性(α = 0.91,CR = 0.933,AVE = 0.736),INC也是如此(α = 0.84,CR = 0.904,AVE = 0.758)。未检测到多重共线性(所有项目的VIF < 5)。这些结果为测量模型的内部一致性和收敛有效性提供了证据(图2)。

4.1.6. 判别有效性
使用Fornell–Larcker标准和Heterotrait–Monotrait(HTMT)比率来评估判别有效性(见表3)。Fornell–Larcker标准得到满足,因为每个构念的AVE的平方根超过了它与其他构念的相关性,表明在构念层面具有可接受的判别有效性。

表3. 判别有效性
Fornell-Larcker标准
空单元 均值 STD
COM 2.99 150.989
GS 3.01 570.853
INCMC 3.01 580.853
PR 3.00 9930.759
SCH 2.98 981.020
TRUS 3.02 851.028
COM 0.83 985.011
HTMT 0.83 9070.885
INC 0.86 8850.796
MC 0.86 8730.790
PR 0.86 8610.842
SCH 0.83 8610.842

4.1.7. 结构模型
下一步是测试提出模型中概述的假设/关系。根据Hair Jr.、Hult、Ringle、Sarstedt、Danks和Ray[68]的建议,在Smart PLS 4.1中使用10,000个自助样本执行了PLS-SEM模型,以评估直接效应和调节效应。使用R2值和路径系数(表5)来评估结构模型的解释能力[68],因为它们有助于理解模型的解释能力。

表5. SEM路径结果
假设 路径 β统计量(|O/STDEV|) P值 置信区间(校正偏差) 2.50% 97.50%
直接路径 H1 GS→TRUS 0.132*** 3.74 <0.001 0.064
H2 MC→TRUS 0.094** 2.57 0.01 0.021
H3 PR→TRUS 0.427*** 11.93 <0.001 0.357
H4 SCH→TRUS 0.184*** 5.45 <0.001 0.117
H5 COM→TRUS 0.076 NS 1.76 -0.01 0.16
H6 TRUS→INC 0.716*** 39.59 <0.001 0.679
特定间接效应 H7 GS→TRUS→INC 0.095*** 3.72 <0.001 0.046
H8 MC→TRUS→INC 0.067** 2.55 0.011 0.015
H9 PR→TRUS→INC 0.306*** 11.78 <0.001 0.256
H10 SCH→TRUS→INC 0.132*** 5.32 <0.001 0.083
H11 COM→TRUS→INC 0.054 NS 1.75 -0.007 0.116

控制变量 工作小时数 0.129** 2.37 0.018 0.009 0.222
零工类型 0.035 NS 0.44 10.66 -0.146
教育水平 0.011 NS 0.177 0.86 -0.109
国家 0.071 NS 1.07 0.28 -0.197
全职工作 0.01 NS 0.156 0.87 -0.117
系数确定性和盲法结果 R2 51.7% 调整后的R2 51.3%
Q2 (=1-SSE/SSO) 0.387
模型拟合统计 SRMR 0.032 d_ULS 0.424 2.017
d_G 0.283 0.372
卡方 129 3.062 155 9.857
NFI 0.92 10.904

结构模型分析显示,算法管理实践与对平台的信任相关,进而与零工工作者继续工作的意愿相关。模型还显示出良好的解释能力(R2=0.517),表明预测变量可以解释继续工作意愿(INC)方差的51.7%。此外,Q2=0.387的盲法结果超过了PLS-SEM中的有意义阈值(0.35),证明了模型的适度预测相关性。两级模型的拟合指数(SRMR=0.07(饱和模型)和NFI=0.904)与既定阈值一致[81],确认了数据的充分拟合。

为了进一步检验结构模型是否比算法管理的总体表示具有额外的价值,我们估计了一个补充的高阶构念模型,在该模型中,COM、GS、MC、PR和SCH被建模为整体算法管理的维度。高阶构念模型解释了信任方差的62.1%,而一阶构念模型解释了64.3%的信任方差。这2.2个百分点的差异表明一阶模型具有适度的额外解释价值。更重要的是,一阶规范揭示了实践之间的理论相关性:PR和SCH是信任的最强预测因子,GS和MC的效果较弱但显著,COM没有显著的直接影响。因此,这五个实践应被视为在经验上可区分但相互关联的算法管理维度,而不是完全独立的管理机制。

为了进一步解决潜在的概念重叠问题,我们对交叉载荷进行了事后检验,发现所有指标在其各自的构念上的载荷都高于其他构念(附录3),支持了指标层面的判别有效性[68]。此外,通过将算法管理建模为包含不同功能实践的多维构念(例如,补偿与绩效评估),保持了构念的理论独特性,这与最近呼吁分散算法治理机制的呼吁一致[24]。

4.2. 第二阶段-定性访谈
我们在第一阶段的结果指导下进行了第二阶段的目的性抽样[65]。在最初的790名调查受访者中,我们随机邀请了60名零工工作者,每个国家(中国、巴基斯坦、澳大利亚、土耳其)各15名,以最大化他们在平台使用时长、年龄组以及对平台信任程度上的差异[63]。邀请函强调了研究的学术意义,承诺保密,并提供了小额报酬(5美元),最终收到了66.6%的回复率(共40人;每个国家10人)。半结构化访谈(持续30-40分钟)于2025年5月15日至6月10日期间进行(在定量调查六个月后)。访谈使用受访者首选的语言(英语、乌尔都语、土耳其语或中文)。在获得同意的情况下,访谈过程被录制下来并转录,必要时通过回译程序将其翻译成英语,以确保准确性和一致性[82]。我们提出了以下五个开放式问题,旨在揭示我们结构方程模型(SEM)路径背后的机制:

1. 平台的自动化系统(或算法)是如何设定你的每日或每周目标(例如,任务数量、收入阈值)并安排你的任务(例如,选择班次或被分配任务)的?这如何影响你对平台公平性的看法、对系统的信任以及你继续工作的意愿?
2. 你能描述一次感觉被平台自动化系统监控的情况吗(例如,通过位置追踪或时间限制)?这种体验如何影响你感觉自己是受平台支持还是被控制的?
3. 你使用平台的评级或反馈机制有什么体验(例如,星星评分、等级评定)?你能分享一些评分显得透明或不公平的例子吗?这些经历如何影响你对平台的信心?
4. 请描述你如何理解平台的自动化薪酬计算和支付规则。这些支付流程如何影响你对平台可靠性的信念?
5. 回顾你在该平台上的经历,你对平台的算法和运营方式的信任发生了哪些变化?这些变化又如何影响了你的职业规划或未来的职业目标?

尽管这些问题没有单独提出,但关于权力、控制和工作者能动性的议题贯穿于多个访谈环节(例如,监控、评级和补偿),使参与者能够表达与可争议性和算法权威相关的经历。

由于部分数据来自巴基斯坦、中国和土耳其的受访者,我们通过严格的回译流程确保了调查问卷和访谈指南的英语、中文、土耳其语和乌尔都语版本之间的语言等效性[83]。首先由三位独立的专业翻译将调查问卷和访谈指南从英语翻译成中文、土耳其语和乌尔都语。随后,三位精通英语、中文、土耳其语和乌尔都语且具有零工经济研究经验的双语研究人员审阅并比较了这些翻译版本与原始英文文本,解决了差异并精炼了表述,以保留概念意义。最后,翻译人员将协调一致的版本重新翻译回英语,研究团队逐行对比以确保语义和习语的准确性。在这个过程中,我们将定量SEM结果与定性主题洞察相结合,增强了研究结论的整体可靠性和可信度。

我们使用NVivo 12软件整理了所有转录文本,利用其审计追踪、编码、查询和团队协作功能。按照Braun和Clarke提出的六阶段主题分析协议[69],两名研究人员独立对所有转录文本进行编码,以确保严谨性和减少偏见,并通过共识讨论解决差异,将决策记录在反思性备忘录中。

定性分析从开放式编码开始,两名研究人员深入研究40份访谈转录文本,为反映工作者经历算法管理的文本片段应用归纳性标签。例如,“我从来不知道为什么我的每周目标会从20个任务突然增加到28个任务”被编码为“目标透明度”,表示对目标调整的不确定性;而“我希望在交通延误时能够添加备注”的评论则被编码为“延迟注释”,表示工作者对情境性输入的愿望。对于“批量处理多个订单以更可靠地达到奖金门槛”的策略性行为,则被编码为“任务批量处理”,体现了适应策略。NVivo的多编码功能允许在单个段落中使用多个标签,从而全面捕捉复杂的情感,如透明度的目标因严格监控而加剧的情况。在所有转录文本中,这一过程产生了52个独立的初始代码,涵盖了工作者的感知和行为范围。

完成开放式编码后,我们进行了轴向编码,将最初的52个标签提升为与SEM框架相一致的更广泛的理论类别。在协作研讨会中,研究团队探讨了各个代码的自然聚类情况。例如,“我不知道为什么我的每周目标会变化”和“我希望系统能解释百分比增加”的表述被归类为“目标透明度”,下设“目标调整逻辑”和“沟通渠道”等子类别,以及“百分比增加解释”和“自主选择控制”等属性。同样,“严格的GPS警告”和“无法记录延误”的评论被归类为“算法监控与自主性”,反映了工作者对“情境监控”和“自主性维护”的担忧,这些担忧由“GPS追踪阈值”和“延迟注释”等特征驱动。

接下来,我们将与反馈相关的见解整理为“反馈机制清晰度”,受访者要求“每次评分都有详细说明”和“低评分背后的明确理由”被归类为“评级解释”和“反馈细致度”,强调“评论性反馈”和“理由的透明度”。在“补偿与争议处理”部分,我们将“等待奖金修正的天数”和“没有自助争议渠道”的评论归类为“支付准确性”和“解决及时性”,突出了“即时争议选项”和“自助纠正”的必要性。

需要注意的是,这些定性描述提供了关于可争议性和工作者话语权的间接证据,而不是对正式话语机制的直接测试。受访者主要描述了他们是否能够获得解释、注释情境限制、请求支付修正或在算法决策后访问争议解决渠道。因此,定性发现被解读为感知到的澄清和纠正机会的证据,而不是平台提供强有力的参与式话语权或正式算法争议权利的证据。

工作者自身的策略,如“选择高小费区域”或“采取策略性休息”,被归类为“工作者适应策略”,下设“任务选择”和“时间安排优化”等子类别以及“策略性休息”和“区域偏好设置”等属性。关于“谁受益最多”的反思被归类为“感知利益相关者利益”,平衡了“平台效率与工作者福利”和“客户满意度”,以及“成本节省的感知”和“风险分配的清晰度”等决定因素。最后,从“最初感到希望”到“因故障产生怀疑”再到“通过每周总结重新建立信任”的叙述被归类为“动态信任轨迹”,包括“初始乐观”、“对问题的反应”和“信任重建”,并通过“每周总结”和“替代零工选择”等元素加以强调。

在40份访谈中,这五个主题反复出现,且在编码的最终阶段没有出现新的主要主题,表明主题已经饱和。然而,并非每位受访者都提到了每个主题;相反,这些主题反映了整个访谈语料库中的重复模式,共同阐明了定量模型的内容。这种结构化的主题框架反映了零工工作者的重复生活经历,并提供了对第一阶段测试的SEM路径的机制层面解释。更重要的是,这些主题是与两个研究问题直接相关的:目标透明度、算法监控与自主性、反馈机制清晰度和补偿与争议处理解释了特定算法实践如何影响信任;而动态信任轨迹则解释了信任如何将这些经历带入工作者的持续参与决策中。

第三位资深研究人员使用Cohen的κ系数评估了20%随机转录文本的编码者间一致性,得分为0.89——远高于0.80的基准值,强调了我们主题分析的一致性和可信度[69]。表6提供了详细的主题总结(主题、子类别和属性),表7则提供了将SEM发现和定性引语进行对比的交叉验证矩阵。

表6. 关键主题和子类别
| 主题 | 子类别 | 属性/决定因素 |
|---------|-------------|-----------------|
| 目标透明度 | 目标调整逻辑;沟通渠道 | 百分比增加解释;自主选择控制 |
| | | |
| | | |
| | | |
| 算法监控与自主性 | 情境监控;自主性维护 | GPS追踪阈值;延迟注释功能 |
| | | |
| | | |
| 反馈机制清晰度 | 评级解释;反馈细致度 | 评论性反馈;理由的透明度 |
| | | |
| | | |
| 补偿与争议处理 | 支付准确性;解决及时性 | 即时争议选项;自助纠正 |
| | | |
| | | |
| | | |
| 动态信任轨迹 | 初始乐观;对问题的反应;信任重建 | 每周总结;替代零工选择 |

表7. 定量结果与定性回应的交叉验证
| 假设 | 路径 | β | 结果 |
|------------------|------------------|------------------|------------------|
| 支持主题 | H1: GS → TRUS | 直接 | β = 0.132, p < .001 |
| | | |
| | | |
| 目标透明度 | “受访者1(Q1):Shansong上的调度工具根据我的过去表现来设定我的每周目标,但我从未看到各项因素的权重。简要的调整理由会很有帮助。” |
| | | |
| | | |
| | | |
| | | |
| 算法监控与自主性 | “受访者2(Q1):Ele.me上的自动化引擎根据我的历史数据设定我的每周目标,但我看不出为什么增加了10%。详细的反馈会有所帮助。” |
| | | |
| | | |
| | | |
| | | |
| 反馈机制清晰度 | “受访者1(Q3):在Shansong上,由于交付延迟,我得到了一个低评分;我没有上下文或解释,因此无法改进。情境性反馈将有助于改进。” |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| 补偿与争议处理 | “受访者4(Q2):在重庆的一次工作时,我被GPS追踪并标记需要暂停——没有任何解释的机会。这感觉像是惩罚而不是支持。” |
| | | |
| | | |
| | | |
| | | |
| | | |
| 动态信任轨迹 | “受访者1(Q7):起初我对平台的数据驱动方法持中立态度。在未得到解释的评分下降后,我的信任动摇了;然后绩效总结重建了我的信心。” |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |
| | | |

表7. 定量结果与定性回应的交叉验证颜色渐变有助于区分层次结构,显示每个主要主题如何细分为子类别和详细属性。总体而言,该图表强调了对零工平台的信任不是由单一因素驱动的,而是由透明度、监控公平性、反馈清晰度、补偿系统的可靠性以及工作者随时间积累的经验等多种因素共同作用的结果。

下载:下载高分辨率图片(1MB)
下载:下载全尺寸图片

图5. 阶层词云展示了算法管理实践如何塑造对零工工作的信任。一个独特的定性见解是,对算法管理的信任不是静态的;相反,工作者描述了在与平台自动化决策的多次互动中信任路径的动态变化。与“动态信任路径”主题(表6)一致,受访者普遍描述了一个三阶段模式:(i) 当算法治理被视为高效且似乎公正时最初的乐观态度;(ii) 在出现明显问题(例如,无法解释的指标变化、没有背景信息的严格GPS标志、不透明的低评分、延迟或错误的奖金)后的信任破坏;(iii) 当平台使系统重新变得可读和可纠正时的信任重建(例如,“通过每周总结恢复了信心”)。

这种模式表明,信任的恢复不是通过一般的安抚,而是通过具体的设计和治理措施来实现的,这些措施能够恢复人们对自动化控制的可靠性的感知并减少无助感。我们将这种恢复过程视为算法失败后的信任修复形式。信任修复研究认为,恢复依赖于(a) 能够减少对失败原因模糊性的可信解释,(b) 表示能够控制重复发生的行动,以及(c) 展示责任感和响应性的治理线索[84],[85]。在算法管理中,这些线索体现在我们的数据中工作者反复要求的具体平台杠杆上:信息正义——一致的解释(例如,目标调整的理由;评分下降的原因),程序正义——一致的可争议性和发言权(例如,通过自助机制注释延误或质疑结果的能力),以及支持自主性的控制(特别是在调度和监控方面),这些措施使工作者能够将算法要求与实际限制相匹配。值得注意的是,工作者提到的“每周总结”作为一种低摩擦的信任修复机制,因为它提供了事后的透明度和可审计的决策叙述,这在一定程度上可以抵消日常算法治理的“黑箱”特性。

综上所述,信任路径的证据以一种对平台直接可行的方式扩展了我们的机制论点:信任不仅通过做出正确的决策得到加强,还通过确保在算法失败时(正如工作者所期望的那样),平台提供快速、具体的解释以及有意义的工人反馈和纠正途径来得到加强。这一理论化与我们的核心模型(信任作为从实践到保留的中介通道)一致,同时阐明了在零工工作中算法失效后信任何时以及如何恢复。

5. 讨论
本研究旨在通过探讨不同的算法管理实践如何塑造对平台的信任(RQ1),以及信任如何反过来调节这些实践对零工工人继续参与意愿的影响(RQ2)来解决两个研究问题。这次讨论不是重复统计结果,而是通过SET和AMT的综合视角来解释发现。这种整合使人们能够更细致地理解为什么算法实践不会产生统一的效果,而是生成不同的信任形成路径。这种解释-序列混合方法设计研究通过解决特定实践(例如COM、SCH、PR)对零工工作中的信任和保留的不同影响的重要空白,并引入信任作为中介这一在先前研究中未充分使用的心理机制[7],[24],从而推进了算法管理的研究。具体而言,其价值在于证明了当同时考察多种算法实践时,它们的效果是不可互换的:绩效评分和调度主导了信任的形成,而补偿对信任的影响并不显著。这一模式在理论上具有重要意义,因为它意味着对算法工作系统的信任主要受程序可解释性和时间可控性的驱动,而不仅仅是经济激励。实际上,它将呼吁“更多透明度”的一般性观点转变为优先考虑最可靠地建立信任和保留的设计模块。

在回答RQ1时,研究发现算法管理不是一个同质的系统,而是一系列对信任具有不同影响的不同实践。绩效评分被认为是信任的最强预测因子,其次是调度,而监控和目标设定 apenas 有中等影响,补偿则没有显著影响。这一模式表明,信任主要由提供结果评估的可解释性和可预测性的实践塑造,而不是仅仅结构和化努力或奖励的实践。从AMT的角度来看,绩效评分和调度提供了更清晰的系统逻辑和一致性信号,减少了“黑箱”感知。从SET的角度来看,这些实践通过将努力与可识别和可预测的结果对齐来增强互惠感。

GS对信任的积极影响(H1)与SET的观点一致,SET认为期望和感知的公平性增强了交换关系中的互惠信任[20]。这一发现直接回答了RQ1,表明当工作者认为平台定义的目标明确、可实现且一致应用时,GS有助于建立信任。第二阶段的研究通过解释工作者如何在实践中解读目标设定系统来扩展这一统计结果。受访者强调,当平台解释目标变化的原因、目标计算方式以及工作者在需求变化条件下是否能够实际达到目标时,算法生成的目标有助于建立信任。因此,GS通过提供事后的透明度和可审计的决策叙述来减轻模糊性,从而部分抵消了日常算法治理的“黑箱”特征。

MC对信任的积极但相对较弱的影响(H2)也回答了RQ1,揭示了算法监控的双重作用:既是一种控制机制,也可能是问责的潜在来源。这一发现与算法管理研究一致,这些研究表明,当工作者认为监控具有侵入性或不透明时,监控会加剧监督并威胁自主性[14],[18]。然而,第二阶段的证据表明,工作者并不是完全拒绝监控;相反,他们区分了公平验证工作的监控和在没有背景理解的条件下惩罚他们的监控。例如,当这些工具有助于解决纠纷、验证已完成的工作或保护他们免受不公平客户投诉时,工作者认为GPS跟踪、任务日志和活动记录是有助于信任的。相反,当算法系统忽视交通拥堵、等待时间、平台错误或其他背景限制时,监控会削弱信任。因此,定性证据解释了为什么MC产生了较弱但仍然显著的效果:只有当监控是透明的、适度的,并与公平的问责制相关联时,它才能支持信任。

PR对信任的积极影响(H3)为RQ1提供了最清晰的答案,也是本研究最重要的发现之一。与之前关于绩效评估和算法透明度的工作一致,当评估标准可见、一致且被视为客观时,工作者更有可能信任平台系统[28],[29],[31]。定量结果显示PR是信任的最强预测因子,第二阶段解释了这种效果产生的原因。受访者反复指出,当平台提供低分的明确原因、背景评论、实时反馈和纠正机会时,绩效评分有助于建立信任。从这个意义上说,PR不仅仅是因为评估绩效而增强信任;相反,当评估过程是可理解的、可操作的且可争议的时,它才增强信任。这一发现扩展了早期强调算法评分在塑造工人行为中的作用的研究[30],表明评分系统只有在工作者能够理解评分的产生方式以及如何改进或挑战评分时,才能成为建立信任的机制。因此,PR似乎是最敏感于信任的算法实践,因为它直接影响工作者的声誉、未来任务的获取以及程序正义感。

SCH对信任的积极影响(H4)进一步回答了RQ1,表明当工作者认为任务分配和时间安排是可预测的、灵活的且公平的时,算法调度会增强信任。这一发现与研究表明调度可预测性增加了工作者的控制感并减少了在算法管理工作中不确定性的一致性[35],[36]。第二阶段通过显示工作者将调度相关的信任与自愿控制、提前通知、灵活性以及将平台工作与个人可用性对齐联系起来,进一步增强了这一解释力度。当调度系统尊重他们偏好的工作时间并以透明的、非任意的方式分配任务时,工作者更愿意信任平台。然而,当调度被视为僵化、不可预测或对工作者的可用性不敏感时,它会削弱信任并增加对算法强制性的感知。因此,定性结果澄清了SCH不仅通过自动化建立信任,还通过保持自主性的可预测性来建立信任。

COM对信任的无关紧要的影响(H5)在理论上是有意义的,不应被解释为一个不重要的发现。它直接回答了RQ1,表明尽管补偿对零工工人具有经济重要性,但算法补偿并不会自动产生信任。这一发现与之前的研究部分矛盾,那些研究认为透明和基于绩效的补偿系统可能增强公平感知并加强信任[42],[45],[47]。第二阶段通过显示工作者不仅根据支付金额评估补偿,还根据支付准确性、隐藏扣款、奖金遗漏、延迟纠正和争议解决过程来评估补偿,从而解释了这一明显的矛盾。换句话说,只有当工作者能够理解、验证和质疑收入计算方式时,补偿才与信任相关。当支付逻辑仍然不透明时,工作者可能会出于经济原因继续工作,而不一定信任平台。这一发现通过挑战货币交换直接转化为平台中介工作中关系信任的假设,为文献做出了贡献。相反,算法补偿似乎需要在可解释性和可争议性方面才能作为建立信任的机制发挥作用。

PR对继续参与意愿的强烈积极影响(H6)直接回答了RQ2,证实了信任是连接算法管理实践与工人继续参与意愿的核心机制。这一发现与SET一致,SET将信任视为一种稳定机制,可以减少不确定性并加强交换关系中的持续参与[20],[23]。它也与持续参与的观点一致,这些观点认为工作者与系统的反复互动会随着时间的推移塑造他们持续参与的意愿[25],[26]。第二阶段进一步解释了信任为何对持续参与有如此强大的影响。受访者将信任描述为一种条件,在这种条件下,尽管存在收入波动、压力和有限的人际互动,算法决策仍被认为足够可接受以继续参与平台工作。当工作者相信平台规则是可以理解的、公平的且可纠正的时,他们更愿意继续工作。相反,当算法决策显得任意或无法挑战时,工作者会考虑更换平台、减少工作时间或将零工工作视为临时性的任务。因此,信任不仅在统计上预测了持续参与;它作为本研究考察的主要关系机制,通过这种机制,工作者判断继续与基于算法的管理合作是否公平、可理解且值得。

H7至H10的中介发现进一步回答了RQ2,表明信任解释了一条重要的关系路径,通过这条路径,GS、MC、PR和SCH转化为了平台支持的持续参与意愿。具体来说,当工作者认为目标是透明和可实现的时,GS通过信任增强持续参与;当监控被解释为公平的问责制而不是强制性的监督时,MC通过信任支持持续参与;当评估是可解释的、可操作的且可纠正的时,PR通过信任加强持续参与;当调度系统保持可预测性和保护工人自主性时,SCH通过信任促进持续参与。这些发现通过证明不同的算法实践并不会通过相同的途径影响员工的留存([7]、[14]、[24]),扩展了先前的算法管理研究。相反,每种实践激活了不同的信任形成机制。因此,定性发现防止了第二阶段的研究显得多余:它们展示了为什么会出现显著的中介效应,以及工人在信任能够支持持续参与之前,每种算法实践需要满足哪些条件。补偿(COM)通过信任的中介效应不显著(H11)也有助于回答第二个研究问题(RQ2),表明补偿并不一定通过基于信任的机制来留住员工。虽然补偿可能通过直接的经济依赖性或工具性需求影响员工的持续参与,但当前的研究表明,除非员工认为薪酬制度是透明、准确且可争议的,否则它并不能通过信任产生显著影响。第二阶段提供了关键解释:员工可能留在平台上是因为他们需要收入,但这并不意味着他们信任平台的薪酬算法。这种区分很重要,因为它将经济依赖性与关系信任区分开来。此外,这些发现还扩展了关于平台薪酬的先前研究,表明薪酬制度在产生信任驱动的留存之前,需要程序透明度和争议解决能力。

总体而言,第二阶段的研究结果明确回答了两个研究问题,超越了单纯的统计确认,揭示了零工员工如何解读算法管理的机制。对于第一个研究问题(RQ1),定性证据表明,算法实践通过不同的机制影响信任:通用策略(GS)通过目标透明度、混合控制(MC)通过情境敏感的责任制、绩效奖励(PR)通过反馈清晰度和争议可能性、拆分控制(SCH)通过可预测性和自主性保护,以及补偿(COM)通过付款可解释性和争议解决来影响信任。对于第二个研究问题(RQ2),定性证据解释了为什么信任作为核心中介机制:当这种控制被感知为公平、可理解且可纠正时,员工能够容忍、接受并继续参与算法控制。同时,互补/部分中介结果提醒我们不要将信任视为算法实践塑造员工持续参与的唯一途径。通过这种方式,第二阶段的研究通过表明对算法管理的信任不是一个静态结果,而是一个由期望、中断、解释和修复的循环动态形成的过程,增强了研究的创新性。这种机制层面的解释阐明了为什么某些算法实践会产生比其他实践更强的信任效应,以及为什么尽管补偿具有经济重要性,但并不能自动产生基于信任的持续参与。

5.1 理论意义
这项基于实证支持的定量结果和深入定性洞察的混合方法研究,为算法管理和零工经济文献提供了四个关键贡献,旨在填补先前研究中的关键研究空白。首先,这项研究通过表明算法管理最好被视为一组相关但可区分的实践来推进算法管理理论,当理论目标是解释员工信任形成时。以往的研究经常将算法管理视为一种广泛的治理机制,这可能会掩盖员工对特定算法功能体验的差异([7])。因此,本研究将COM、GS、MC、PR和SCH建模为一阶结构,并同时估计了一个补充的高阶结构模型进行比较。高阶结构模型(HOC)解释了62.1%的信任方差,而低阶结构模型(FOC)解释了64.3%的信任方差。这种适度的增加表明一阶规范具有额外的解释价值,但更重要的是效应的模式差异:PR和SCH是最强的信任生成实践,GS和MC的效果较弱但显著,而COM对信任没有显著直接影响。因此,该研究并不声称这五种实践是完全独立的;相反,它表明它们是算法管理的相互关联的维度,产生不同的信任含义。这种更细致的解释通过从算法治理的总体视角转向对信任形成的实践敏感的描述,增强了算法管理理论(AMT)。

其次,虽然大多数先前的研究关注算法实践的直接效应([18],但本研究通过将信任定位为连接实践与员工留存的核心心理机制,做出了贡献。例如,绩效评价的间接效应暗示了信任在将公平感知转化为持续活动中的中介作用。这将社会交换理论(SET)嵌入算法管理理论中,使得在零工经济中的工作成为一种三方交换(员工-平台-算法),其中信任中介了互惠性([20])。这直接回应了Meijerink和Bondarouk [14] 关于研究平衡控制与信任等关系效应的算法实践的呼吁。

第三,该研究通过展示各种实践(如调度)如何创造有意义的自主性,以及监控如何在被视为保护性时具有控制效应,从而解释了算法管理中的这种二元性,同时确保信任不会受到损害。这种二元性与算法管理理论(AMT)强调的人类与算法的协作一致([3]),并解决了Siegel、K?nig和Lazar [61] 提出的监控相关焦虑可能阻碍平台使用的问题。本研究通过展示支持自主性的实践(例如,提供灵活性)能够建立信任,进一步推动了算法设计的平衡框架。

第四,尽管该研究结合了四个国家的数据,但信任和程序公平的普遍重要性表明这些机制超越了文化障碍。这挑战了Wiener、Cram和Benlian [58] 的观点,即算法管理效应是情境性的,他们认为透明度和公平性是全球建立信任的基础。这将为跨多种文化的算法治理的平等主义模型提供一个基准。

第五,定性发现通过解释两个研究问题背后的机制,而不仅仅是确认定量路径,做出了独特的理论贡献。对于第一个研究问题(RQ1),第二阶段表明员工通过特定的与信任相关的线索来解读每种算法实践:通用策略(GS)通过目标透明度、混合控制(MC)通过情境敏感的责任制、绩效奖励(PR)通过反馈清晰度和争议可能性、拆分控制(SCH)通过可预测性和自主性保护,以及补偿(COM)通过付款可解释性和争议解决能力。这一发现扩展了算法管理理论(AMT),表明员工并不是简单地将算法管理视为自动化控制;相反,他们评估每种实践是否使他们能够理解、预期和挑战算法决策。对于第二个研究问题(RQ2),定性发现表明信任不仅是一个部分的统计中介因素,而且是一个动态的解释过程,通过这个过程员工评估继续参与是否值得,同时认识到工具性考虑也可能影响持续参与。员工的描述揭示了信任是通过期望、中断、解释和修复的循环不断发展的。这种定性见解通过表明平台工作中的互惠性不仅仅是通过人际关系交换形成的,而是通过员工反复评估算法系统是否随时间保持公平、可解释和可纠正来扩展社会交换理论(SET)。因此,第二阶段通过将中介模型从统计关系转变为基于机制的信任形成和持续参与的解释,增强了研究的理论创新性。

通过桥梁作用,将社会交换理论(SET)和算法管理理论(AMT)相结合,并将一阶定量建模与基于机制的定性证据整合起来,该研究将关于算法经济的讨论从单纯的算法控制转向了算法公平性、可解释性和可修复性。这为设计优先考虑员工信任的零工经济平台系统提供了更加强有力的理论基础,因为信任是一个关键但尚未充分探索的条件。

5.2 实际意义
我们的发现为希望改善零工员工留存并建立可持续平台生态系统的利益相关者提供了可操作的见解。对于平台运营商来说,这些发现表明迫切需要重新设计算法系统,以更好地服务于透明度和公平性。HOC-FOC的比较进一步强化了这一点:虽然算法管理实践总体上预测了信任,但一阶模型表明平台不应在所有功能上应用通用的“算法透明度”策略;相反,每种实践都需要量身定制的设计干预。

研究发现为希望改善零工员工留存并建立可持续平台生态系统的利益相关者提供了可操作的见解。从目标设定的角度来看,平台应重新设计算法目标设定系统,使员工不仅能够理解分配的目标,还能理解这些目标变化的原因。由于通用策略(GS)对信任有积极且显著的影响,平台运营商应避免将算法目标呈现为固定且不可解释的性能阈值。相反,仪表板应提供关于目标逻辑的清晰信息,例如接受率、任务完成期望、响应时间要求或服务质量目标的计算方式。平台还应区分可控和不可控的目标失败。例如,不应因为交通拥堵、平台方面的延迟或客户不可用而以相同的方式惩罚员工未能达到交付时间目标的情况。在实际操作中,平台可以引入目标解释面板、目标变更通知、进度跟踪器和针对不现实或情境不敏感目标的申诉选项。这些设计干预将算法目标设定从模糊的来源转变为建立信任的治理机制,使平台期望变得透明、可达成和程序公平。

重要的是,结果表明问题不在于算法反馈的存在,因为大多数平台已经提供了实时通知和评分,而在于这些系统的可解释性和争议可能性。具体而言,绩效评价系统应超越简单的分数可见性,朝着可解释的评估架构发展,使员工能够清楚地了解评分是如何构建的、不同因素是如何加权的,以及差异如何被挑战。这种从提供反馈到优化反馈可理解性的转变至关重要,因为我们的发现表明,绩效评价是驱动信任的最强因素,并不是因为它们存在,而是因为当它们被视为透明和公平时可以减少不确定性。

同样,调度系统应设计成增强预测稳定性和员工的能动性,而不仅仅是优化平台效率。调度对信任的强大影响表明,员工重视能够预测和影响他们的工作模式的能力。因此,平台应纳入诸如调班预览、轮班灵活性和防止最后一刻算法变更的功能,这些直接涉及本研究中确定的信任构建作用。

相比之下,补偿的不显著效应突显了当前平台策略中的一个关键错位。平台不应增加金钱激励,而应专注于使补偿系统可审计和可理解,包括透明的薪酬计算分解和对扣除或调整的清晰解释。研究发现表明,感知到的不透明性,而不是低工资,是妨碍对补偿系统信任的主要障碍。

最后,监控系统应从监控工具转变为程序保护机制。当监控用于验证员工的索赔(例如,由于外部条件导致的延迟)并支持公平的争议解决时,它可以增强信任而不是削弱信任。总体而言,这些发现表明,对零工平台的信任不是由技术复杂性本身驱动的,而是由算法设计中嵌入的公平性、可解释性和可控性所驱动的。政策制定者必须规范这些算法实践,以保护数字平台员工。法律也可以解决平台使用算法时的道德风险——要求算法透明,要求平台披露绩效评价或薪酬决策的制定方式,并确保有保护员工自主性的政策到位,例如限制后期调度变更或明确的申诉渠道,帮助平台运营符合长期确立的劳动权利标准。这些措施平衡了零工工作中权力不对称的问题,确保算法系统按照伦理标准进行监管。

尽管本研究没有估计特定国家的结构模型,但测量不变性的结果表明,这些结构在四个国家样本中得到了相似的解读。这支持了信任建设设计原则在多种平台工作背景下的实际相关性,同时也提醒平台根据当地劳动规范、监管期望和员工支持系统调整实施细节。平台可以超越产品定制,根据当地劳动规范调整其算法系统(例如,在集体主义市场中强调集体目标设定,在个体主义环境中提供更大的个人灵活性)。但基本原则,包括透明度和程序公平性,应该在任何情况下得到遵守。

最后,员工留存策略必须将信任作为一个关键指标。平台可以实施以信任为中心的激励措施,例如为值得信赖的员工提供“可靠性徽章”,解锁诸如优先获得轮班或小费等福利。组织支持还可以通过积极措施来减少过度工作,例如在工作时间过长时发出算法警告,以及提供健康资源。

5.3 局限性
虽然这项研究增强了人们对算法管理在零工员工留存中作用的理解,但仍有一些局限性需要注意,以便将其发现置于具体情境中并指导未来的研究。该研究使用横截面数据限制了因果推断。该模型表明,信任在算法实践与员工留存率之间起着中介作用,但两者之间的因果关系(是留存率影响了信任,还是信任影响了留存率)尚无法确定。需要采用纵向研究设计,持续跟踪员工的演变过程,以建立因果关系并捕捉在较长算法使用周期内信任的变化。另一个局限性在于不同算法管理实践之间的实证相关性。尽管测量模型通过Fornell–Larcker检验、HTMT推断、交叉载荷分析以及额外的HOC–FOC比较验证了其区分效度,但仍有一些HTMT值相对较高。这表明员工可能将各种算法实践视为更广泛平台治理系统中的相互关联的部分。因此,该研究的贡献应被视为识别了一组相关算法管理实践中的个体差异性,而非证明这五种实践是完全独立的机制。未来的研究可以进一步探讨算法管理是否最好被描述为跨不同平台类型的多维度、层次化或配置化的结构。此外,关于可争议性和员工话语权的定性证据较为间接,因为受访者描述的主要是澄清、纠正和争议解决的经历,而非正式的参与式话语机制。未来的研究应直接考察员工在平台治理设计中的话语权、申诉权利及参与度。

虽然样本包括来自澳大利亚、中国、土耳其和巴基斯坦的四国零工劳动者,但分析是在汇总层面进行的,以在一个异质性样本中检验所提出的机制。在汇总之前已经确认了测量的稳定性,表明这些结构在不同国家群体中的解释是一致的。然而,测量的可比性不应被解释为国家层面结构等同性的证据,也不代表各国之间的关系强度完全相同。因此,本研究支持测量模型的跨国可比性,但并未提供针对各国具体算法管理动态的全面比较测试。制度、文化和监管条件仍可能影响算法实践、信任与员工留存率之间的关系强度或方向。未来的研究可以通过多组PLS-SEM分析、国家特定的结构模型或调节中介分析来进一步探讨监管保护、文化导向、劳动力市场依赖性或平台治理成熟度等因素是否对信任形成和员工留存过程产生影响。

该模型没有考虑外部变量(如宏观经济条件[例如失业率]或员工的财务依赖性),这些变量可能会降低员工继续留在平台的意愿。例如,在经济波动较大的地区(如巴基斯坦),如果选择较少,员工可能会接受较低水平的信任度,这一变量在模型中被忽略了。最后,未来的研究可以通过分析零工劳动者在社交媒体平台(如X)上的实时讨论和评论,来考察他们对算法管理、平台信任、公平性和零工工作持续性的看法,并识别围绕这些议题的讨论主题。

**作者贡献声明:**
- Sari Mansour:撰写 – 审阅与编辑、监督、资源提供、项目管理、资金获取、概念构思
- Sohaib Mustafa:撰写 – 审阅与编辑、初稿撰写、数据可视化、验证、方法论制定、调查设计、数据分析、概念构思

**利益冲突声明:**
作者声明没有需要披露的利益冲突。

**数据可用性:**
支持本研究结论的数据可向相应作者提出合理请求后获得。

**机构审查委员会声明:**
本研究遵循《赫尔辛基宣言》的规定,并获得了“XYZ”大学机构审查委员会的批准。

**伦理批准:**
本研究设计已获得加拿大魁北克省蒙特利尔TELUQ大学行政科学学院伦理委员会的批准(地址:5800 St Denis, Montreal, QC, H2S3L5)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号