推荐系统是针对从电子商务市场到数字媒体服务等广泛领域个性化用户体验的重要工具[1]、[2]。这些系统通过根据用户的偏好和行为推荐相关内容,帮助用户浏览海量信息。然而,推荐系统中的一个主要挑战是训练数据中存在的偏见[3]。一种常见的偏见是流行度偏见,即频繁交互的物品在用户-物品交互中被过度推荐。这种过度推荐导致系统主要向用户推荐热门物品,往往忽略了可能更相关或更有趣的冷门物品[4]。这种偏见不仅限制了推荐的多样性,还削弱了系统满足所有用户多样化需求的能力,尤其是那些具有独特或多样偏好的用户。
流行度偏见在推荐系统中的严重影响已在多个行业中得到广泛观察,通常会导致明显的商业和伦理后果。例如,Spotify 2023年的透明度报告显示[1],个性化播放列表中超过60%的推荐曲目来自流量最高的5%的艺术家,无意中边缘化了新兴音乐家,并使音乐类型多样性减少了32%[4]。这种同质化效应直接与用户流失率相关——麦肯锡对电子商务平台的分析表明,接触到重复推荐的用户比收到多样化建议的用户放弃率高出23%[5]。这些现实案例突显了迫切需要去偏解决方案。
近年来,将大型语言模型(LLMs)集成到推荐系统中受到了关注,LLMs在处理和理解非结构化数据(如用户评论和物品描述)方面展示了其潜力[6]。然而,尽管前景广阔,基于LLM的推荐系统仍面临若干挑战。在冷启动场景下,由于历史交互数据有限,LLMs难以做出准确预测[7]。在热启动场景下,尽管存在大量交互数据,但这些数据仍受流行度偏见的影响,基于LLM的推荐器仍可能放大这些偏见。此外,这些模型通常缺乏合作知识。合作知识是指从用户-物品交互中提取的潜在模式,它捕捉了用户的集体偏好和行为,对于生成个性化且与上下文相关的推荐至关重要[8]。例如,如果大量用户一致高度评价某一类型的电影(如动作片),系统可以识别出动作片在该群体中很受欢迎,即使并非每个用户都明确表达了对这类电影的偏好。
此外,推荐系统的同质性也是一个关键问题,尤其是在大型模型的背景下。当推荐结果缺乏多样性时,这种现象尤为明显,这通常是由于顶级物品之间的高相似性和偏见放大造成的。如图1所示,代表性的基于LLM的方法TallRec[9]和传统的协同过滤方法SASRec[10]在电子商务的三个标准数据集(游戏、玩具和体育)中表现出不同程度的同质性[11]。具体来说,图1(a)和(b)显示,TallRec倾向于生成文本相似度较高、类别熵较低的推荐——表明同质性较高,而SASRec则提供了更多样化的推荐。这种同质性问题可能导致相似物品或类别的过度推荐,降低了根据用户不同兴趣定制推荐结果的多样性。我们提出的方法中引入的因果推理有助于减少流行度偏见的影响,并结合多样化的合作知识,从而生成更加个性化和多样化的推荐。
尽管LLMs在语义理解和跨领域知识转移方面表现出色,但其应用面临两个根本限制。首先,LLMs会放大训练数据中存在的偏见,特别是流行度偏见,因为它们倾向于强化那些被过度推荐的物品的模式。这导致推荐结果同质化,忽视了小众偏好,降低了用户满意度和平台的公平性。其次,LLMs难以整合来自用户-物品交互的合作知识,尤其是在历史交互数据存在偏见的热启动场景中。传统的去偏方法(如逆概率评分或基于正则化的方法)往往与语义推理分离操作,导致公平性和推荐质量之间的权衡不佳。现有的混合框架要么缺乏因果推理来分离偏见效应,要么无法将去偏后的合作知识与LLM的token空间对齐。这些差距需要一种统一的方法,将因果去偏与LLM驱动的语义理解相结合,以实现鲁棒、个性化和公平的推荐。
为了解决上述问题,我们提出了一种新方法:基于因果增强的LLM的去偏推荐系统(CLD-Rec)。该框架结合了因果推理和LLMs,以消除训练数据中的偏见并增强用于生成推荐的合作知识。CLD-Rec分为两个阶段。第一阶段应用因果推理技术来识别和消除用户-物品交互中的偏见(如流行度偏见),而第二阶段利用LLMs的强大语言理解能力生成基于去偏合作知识的推荐。通过结合因果推理和基于LLM的语言处理,CLD-Rec克服了传统推荐系统仅依赖协同过滤或文本数据的局限性。
因此,我们在本文中探讨的研究问题如下:
RQ1:因果推理技术如何有效分离和减轻基于LLM的推荐系统中的流行度偏见?
RQ2:如何将去偏后的合作知识与LLM的token空间对齐,以增强语义推荐生成?
RQ3:结合因果推理和LLMs的两阶段框架在多样化应用场景中能在多大程度上实现推荐系统的准确性和公平性之间的最佳平衡?
我们的方法代表了推荐系统发展的重大进展,不仅可以生成个性化和准确的推荐,还能确保公平性和多样性。具体来说,CLD-Rec带来了以下贡献:
- •
1. 因果去偏:我们引入了一种因果推理方法来识别和减轻推荐系统中的偏见,特别是流行度偏见。这使得用户偏好的表示更加准确,确保推荐结果反映真实用户兴趣,而不是被过度推荐的热门物品所扭曲。
- •
2. 合作知识的整合:通过将因果推理与协同过滤相结合,我们将用户-物品交互中获得的丰富知识与LLMs的语义理解能力结合起来。这增强了推荐过程,特别是在协同上下文对生成有意义建议至关重要的热启动场景中。
- •
3. 个性化推荐的混合框架:CLD-Rec的两阶段框架提供了一种新颖的方法,无缝整合了因果去偏和基于LLM的推荐生成,从而在推荐准确性和公平性方面都取得了改进,特别是在用户偏好多样化的复杂领域中。
总结来说,CLD-Rec是一种开创性的方法,它弥合了因果推理和LLMs之间的差距。它提供了一个更加鲁棒、个性化和公平的推荐系统,能够减轻固有偏见,提高用户满意度。通过减少这些偏见,CLD-Rec确保用户接触到更广泛的产品,促进了更加多样化和包容性的电子商务市场。