在非随机分配偏差数据上的多重处理效果评估

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Data & Knowledge Engineering》：Multi-treatment uplift evaluation on non-random assignment biased data

【字体：大中小】 时间：2026年02月11日 来源：Data & Knowledge Engineering 2.6

编辑推荐：

　　多治疗场景下非随机分配偏差对提升模型的影响研究。提出新型评估协议生成合成数据，系统评估主流方法（如S-Learner、Meta-Learners等）的鲁棒性，发现偏差率、处理维度及效应对比度显著影响模型性能。实验表明随机森林和梯度提升树在偏差下表现更优，但需改进标准化方法。

Nathan Le Boudec | Nicolas Voisine | Bruno Crémilleux

Orange Research, Lannion, F-22300, 法国

摘要

“Uplift”量化了某种行为（如市场营销或医疗治疗）对个体行为的影响。Uplift预测基于一个假设，即目标组和对照组是等同的。然而，在现实世界中，客户往往根据其先前的行为被选中参与这些行为，这引入了非随机分配偏差，从而扭曲了Uplift的估计结果。在多处理情况下，这个问题更为突出，例如在推荐系统中，一个个体可能面临多种处理选项。据我们所知，多处理环境中的偏差效应尚未被研究过。在本文中，我们提出了一种新的协议，用于在非随机分配偏差的情况下评估多处理效果。利用该协议，我们评估了文献中主要的多处理效果评估方法的性能。我们的研究结果表明，这些方法在应对偏差方面的鲁棒性存在显著差异，为有偏差环境下的实际应用提供了宝贵的见解和指导。

引言

“Uplift”建模是一种预测方法，旨在估计多种处理方式对个体行为的影响[1]、[2]。文献中使用的“处理”一词泛指任何被测量其影响的行动，无论属于哪个领域[2]。它可以被定义为一种机器学习任务或因果推断问题[3]。在本文中，我们采用了机器学习方法。这种建模在个性化医疗和广告等领域特别有用。在营销推荐系统中，Uplift估计对于确定哪种处理方式会对客户产生最积极的影响至关重要。除了预测一个人是否会响应某种处理外，Uplift还估计了一种处理方式相对于其他处理方式的效果。通过这种方式，Uplift模型有助于将营销资源最优地分配给那些处理效果最显著的个体。

文献最初关注的是单处理情况：仅测量一种处理方式与对照组（即不接受处理）之间的影响。Uplift方法的例子包括元学习器[4]或随机森林[5]。本文讨论的是更复杂的情况：多处理情况。目标是对比并量化几种处理方式相对于对照处理方式的影响。

Uplift方法基于这样一个假设：不同的处理组和对照组是同质的，即不同组之间的个体之间没有偏差。实际上，数据通常是观察性的。在推荐系统中，是否向某个客户提供某种处理（例如营销优惠）可能取决于该客户的特征。换句话说，客户被选中的概率可能取决于他们的过往行为或其他特征。这可能会扭曲Uplift的估计结果，从而限制推荐系统的有效性。

存在多种偏差。例如，不接听销售电话会在接听电话的个体和未接听电话的个体之间引入偏差。本文旨在研究“非随机分配”情况下主要Uplift方法的表现[6]。这种偏差在推荐系统中非常常见，当接受处理的概率取决于个体的特征时就会发生。关于Uplift背景下的偏差研究很少[7]，据我们所知，我们的工作是首次专注于多处理方法的研究。

我们的目标是研究Uplift方法在面对偏差时的表现，以及推荐系统实际遇到的问题。这种环境的特征是数据不平衡、处理方式众多，且Uplift值较小。为此，我们提出了三个研究问题：Uplift方法的性能如何随着偏差率的增加而变化；处理方式的数量如何影响性能；以及Uplift值是否较小（在下文中，我们将这一特征称为“对比度”）。为了解答这些问题，我们设计了一个实验协议，能够量化多处理情况下偏差的影响。我们解释了该协议所需的属性。为了准确估计Uplift效果，我们展示了使用合成数据的必要性，并描述了如何生成此类数据。实验结果表明，Uplift方法在存在偏差的情况下表现不同。我们从这些结果中得出了一些教训，这些教训将有助于设计适用于多处理偏差情况的新技术，同时也有助于我们开发抗偏差的技术。

本文的结构如下：第2节提供了基本定义，并讨论了如何评估Uplift。第3节概述了Uplift方法的最新进展及相关工作，包括多处理Uplift方法、基准测试以及处理方式数量的影响。第4节描述了我们的协议和相应的数据生成方法。第5节通过实验结果进一步了解了偏差的影响。

节选内容

Uplift

Uplift[1]、[2]是对个体在接受处理与未接受处理情况下效果的一种估计。设

Y

表示处理的效果（例如，在市场营销中，可以是“点击”或“未点击”），

T

表示处理变量。我们用

Y_{i} (T = 1)

表示个体在接受处理

x_{i}

时的结果，

T i

表示个体在接受处理

Y_{i} (T = 0)

时的结果。条件平均处理效应（CATE）是指处理对个体的因果效应，其定义为

多处理Uplift方法概述

我们将主要Uplift方法分为两大类：元学习器和直接方法。

问题

NRA偏差是Uplift估计中的一个主要问题[6]，特别是在推荐系统等复杂环境中个性化处理时尤为明显。当接受处理的概率取决于个体特征时，就会出现这种偏差。形式上，当

P (X | T = i) \neq P (X | T = j)

时，就定义了这种偏差。尽管文献中对这一问题的关注有限[7]，但在多处理情况下尚未有相关研究。

关于Uplift方法的实验比较研究也很少

偏差的影响（研究问题1）

图1和图2分别展示了所有模型在二维数据（图形的左侧部分）和三维数据（图形的右侧部分）条件下，随着NRA偏差率的变化而产生的RMSE和预期结果。

我们可以清楚地看到，这种偏差会影响所有模型的整体性能，并且两种数据类型的模型性能相似。对于所有方法而言，随着偏差的增加，性能通常会下降，S-Learner方法除外

结论与展望

在本文中，我们研究了偏差对最先进的多处理Uplift模型性能的影响。据我们所知，这是首次研究多处理Uplift模型中偏差效应的研究。我们设计了一个实验协议，用于生成合成Uplift数据，并纳入和量化偏差。此外，我们还提出了一种新的标准化方法来解释预期结果，以便进行更公平的比较

CRediT作者贡献声明

Nathan Le Boudec：撰写——原始草案、可视化、软件实现、形式分析、概念化。Nicolas Voisine：撰写——原始草案、监督、方法论、形式分析、概念化。Bruno Crémilleux：撰写——原始草案、验证、方法论、概念化。

利益冲突声明

作者声明以下可能被视为潜在利益冲突的财务利益/个人关系：Nathan Le Boudec表示获得了Orange Innovation Lannion的财务支持。Nicolas Voisine表示获得了Orange Innovation Lannion的财务支持。Bruno Crémilleux表示获得了Caen Normandy大学的财务支持。如果还有其他作者，他们声明没有已知的财务利益冲突

Nathan Le Boudec出生于2000年，毕业于法国Compiègne技术大学的计算机科学专业。他目前正在Orange公司与Caen Normandie大学合作攻读CIFRE博士学位。他的研究方向是机器学习，特别关注Uplift建模技术。

联系信箱：

粤ICP备09063491号

摘要

引言