近年来,由于数字技术、连接设备和物联网的进步,大量数据的实时生成、存储和分析得到了推动。企业越来越认识到实时数据的价值,例如金融市场数据、物联网传感器流和位置数据,并利用这些数据来应对市场波动、预测市场需求和提供个性化服务[1]、[2]。这种向数据驱动决策的转变促进了实时数据市场的迅速扩张。许多数据供应商涌现出来,不断收集各种数据集并向企业提供这些数据[3]、[4]。例如,Datarade(全球最大的数据市场)将数据买家与2000多个数据供应商连接起来;由亚马逊网络服务(AWS)运营的AWS Data Exchange为用户提供了一个订阅第三方数据的平台;NASDAQ Data Link专门提供各种金融、经济和替代数据。
在这样一个动态的市场中,数据销售模式的选择对数据供应商的成功至关重要。不同的数据供应商采用不同的销售策略,如图1所示。AWS Data Exchange上的买家可以订阅包含历史数据和实时数据的数据集,并在整个订阅期间定期更新。相比之下,NASDAQ Data Link不仅提供订阅服务,还提供免费数据样本。Datarade上的数据供应商采用多种销售模式。除了前两种模式外,一些数据供应商还允许买家在订阅服务之外单独购买历史数据。数据供应商采用的不同的销售模式反映了他们的战略选择。
买家在两个关键维度上表现出异质性。首先,他们对数据集的估值不同,高类型和低类型买家根据他们的具体需求和业务环境赋予不同的价值[6]、[7]。其次,买家在专业知识和经验方面也有所不同,可以分为知情买家和不知情买家[8]、[9]。知情买家具有明确的业务目标、专业知识以及处理类似数据集的先前经验,使他们能够准确评估数据集的价值。相反,许多买家由于缺乏必要的知识和实际经验而对数据集的价值评估不准确,从而影响了他们的支付意愿。
知情买家的存在使数据供应商处于信息劣势,促使他们更加关注不知情的买家。数据供应商可以通过提供免费数据样本来缓解不知情买家的估值不确定性。数据的可分割性使其能够按时间、属性和实体免费分割。这使得数据供应商可以选择性地提供部分历史数据作为免费样本。此外,历史数据和实时数据在结构和质量上是连续的,因此买家可以从历史样本中推断出实时数据的价值。
此外,提供免费数据样本来增加用户流量、注册量和参与度,为数据供应商带来额外收入。这些收入主要来自广告收入的增加和客户获取成本的降低。首先,就广告收入而言,更大的免费样本量迫使买家在平台上花费更多时间进行在线预览、探索性分析或等待下载。这种在界面上的停留时间延长了广告曝光的机会[10]、[11]。其次,提供免费数据样本来帮助降低客户获取成本。几乎所有数据供应商(例如NASDAQ Data Link)都要求用户在访问免费数据样本之前注册。一些供应商(例如Datarade)还要求用户提供他们的数据需求和预期用途的详细描述。更大的免费样本激励更多用户自愿提供这些信息,从而节省了外部营销和客户获取的高昂费用。
与提供免费数据样本的数据供应商不同,提供历史数据一次性购买的服务使不知情的买家能够通过购买历史数据来消除估值不确定性。这是因为历史数据和实时数据在时间维度上存在差异,而它们的数据结构和质量保持一致。因此,不知情的买家可以在购买和使用后通过评估历史数据来准确评估实时数据的价值。
我们研究的目的是探讨买家异质性的这两个方面如何影响数据供应商的销售模式选择,并为最佳模式选择提供决策支持。具体来说,我们旨在解决以下关键问题:
(1) 对于实时数据市场中的数据供应商来说,哪种销售模式最有利?
(2) 不同的销售模式如何影响消费者剩余和社会福利?
通过提供免费样本或一次性购买选项,能否实现双赢的结果?
为了解决这些问题,我们开发了一个分析模型,在该模型中,垄断数据供应商向潜在买家出售数据集。我们假设数据供应商可以从三种选项中选择:订阅模式、基于订阅的免费样本模式或基于订阅的一次性购买模式。在订阅模式下,数据供应商提供包括历史数据和频繁更新的实时数据的订阅服务。在基于订阅的免费样本模式下,买家在购买订阅服务之前会收到免费数据样本。在基于订阅的一次性购买模式下,买家可以选择在订阅服务之外购买历史数据。我们为每种数据销售模式推导出最优解,然后确定最佳的数据销售模式。我们进一步研究了在最佳数据销售模式下的消费者剩余和社会福利。
我们的分析得出了几个值得注意的结果。首先,在决定采用哪种数据销售模式时,数据供应商面临特定的权衡。一方面,提供免费数据样本(或一次性购买)向不知情的买家发出信号,从而减少他们的不确定性,产生信号效应。另一方面,提供免费数据样本(或一次性购买)可能会侵蚀数据集的部分价值,导致侵蚀效应。当高类型买家对数据集的估值较低时,侵蚀效应占主导地位,使得订阅模式对数据供应商来说是最有利可图的。随着高类型买家对数据集的估值增加,信号效应开始占主导地位,市场中知情买家的比例在确定数据供应商的最佳销售模式时变得至关重要。如果知情买家的比例较低,基于订阅的一次性购买模式是最优的;如果比例适中,基于订阅的免费样本模式成为最优选择;如果比例较高,则订阅模式是最优的。
其次,人们可能会直观地认为,随着高类型买家对数据集的估值增加,消费者剩余也会相应增加。然而,我们的研究发现,当高类型买家对数据集的估值和知情买家的比例都处于中等水平时,消费者剩余可以达到最大。这是因为基于订阅的免费样本模式和基于订阅的一次性购买模式都减少了不知情买家的估值不确定性,使数据供应商能够捕获更大的剩余。关于社会福利,它最初(略微)减少,然后随着知情买家比例的增加而增加。
第三,数据供应商的最佳数据销售模式并不总是对买家或社会福利最有利。在基于订阅的一次性购买模式下,数据供应商的更高利润是以牺牲消费者剩余为代价的。与订阅模式相比,基于订阅的免费样本模式可以为数据供应商和买家带来双赢的结果。
本文的其余部分结构如下。第2节回顾相关文献。第3节介绍了三种数据销售模式。第4节展示了每种销售模式下的最优解。第5节确定了最佳销售模式并研究了消费者剩余和社会福利。第6节扩展了基本模型。最后,第7节总结了本文。所有证明都在附录中提供。