通过超边学习高阶用户-物品关系以优化推荐系统

《Neurocomputing》:Learning high-order user-item relation via hyperedge for recommender system

【字体: 时间:2026年02月10日 来源:Neurocomputing 6.5

编辑推荐:

  本文提出基于超图的推荐方法HOUR,通过超图卷积网络捕捉用户与项目的高阶交互关系,并在四个真实数据集上验证其优于现有方法。

  
Jingwen Wang|Yuguang Yan|Ruichu Cai|Michael K. Ng|Zhifeng Hao
中国广州广东工业大学计算机科学学院

摘要

推荐系统旨在根据用户的潜在偏好找到可能对他们感兴趣的候选项目。现有方法主要利用用户-项目交互数据来学习用户与项目之间的成对关系,或者结合用户来自社交网络的社会关系来建模多个用户之间的高阶关系。然而,不仅用户之间存在复杂的关系,项目之间也存在复杂的关系,而这些用户和项目之间的高阶关系对于推荐至关重要。例如,人们购买产品的原因可能多种多样,这些原因可以通过涉及多个项目的关系来捕捉。在现有研究中,这种高阶用户-项目关系几乎没有被探讨过。在本文中,我们试图从交互数据中提取涉及用户和项目的高阶关系,并构建超边来表示这些关系。具体来说,我们通过对交互矩阵进行矩阵分解来识别用户和项目之间的潜在因素作为超边。之后,我们基于超图扩展开发了一个超图卷积网络,以学习用户、项目以及它们在高阶表示空间中的嵌入。通过这种方式,可以利用涉及多个用户和项目的高阶关系来学习用户和项目的综合表示,从而用于推荐。在几个真实世界数据集上的实验结果证明了我们提出方法的有效性。

引言

个性化推荐系统致力于根据用户的偏好找到他们可能购买的产品。到目前为止,推荐系统已广泛应用于许多在线服务中,如电子商务(例如Amazon、Alibaba)[1]、在线视频网站(例如Youtube、Netflix)[2]和社交网络应用程序(例如Facebook),这些服务帮助用户发现感兴趣的项目。推荐系统的核心挑战是根据历史交互数据估计用户采用某个项目的可能性。在各种技术中,协同过滤(CF)已成为推荐的基础方法,它基于这样的假设:行为相似的用户会对项目有相似的偏好[3]、[4]。CF中的一个常见范式是根据观察到的用户-项目交互数据将用户和项目投影到一个低维的潜在表示空间中,然后根据学习到的表示来预测用户偏好[5]、[6]。
随着图神经网络(GNN)的快速发展,由于它们在建模关系数据的结构信息方面具有强大的能力[7],一些研究应用GNN来捕捉用户与项目之间的成对关系以学习它们的表示[8],其中基于交互数据构建了一个二分图。为了进一步利用用户之间的关系进行推荐,还引入了来自社交网络的社会关系来描述用户之间的成对关系[9],并在GNN中使用基于社交网络的用户图来借助这些关系学习更好的用户表示。然而,GNN的局限性在于它只考虑了涉及两个用户的关系,而忽略了多个用户之间普遍存在的高阶关系。为了解决这个问题,采用了超图来建模用户之间的高阶关系,因为超边能够连接多个顶点[10]。例如,在[11]中,同时利用了交互历史和社交网络来构建超图,以建模用户-项目之间的成对关系和用户之间的高阶关系。
然而,在推荐系统中,不仅用户之间存在复杂的关系,项目之间也存在复杂的关系,这些关系对推荐有益。图1展示了一个例子来说明这一点。在图中,用户A和B购买了许多相同的产品(如键盘、笔记本电脑、显示器),因为他们都是信息技术从业者。如果我们只考虑他们的共同购买历史而不考虑产品之间的关系,那么向用户B推荐游戏控制器、向用户A推荐DVD播放器是合理的。但实际上,用户A对玩视频游戏感兴趣,因为她购买了游戏控制器,而用户B对看电影感兴趣,因为他购买了DVD播放器。用户购买产品的根本原因(例如在信息技术领域工作、玩视频游戏、看电影)可以通过涉及多个产品的关系来表征。基于此,用户A很可能购买游戏机,而用户B可能会购买音箱。因此,考虑多个用户和项目之间的关系是至关重要的。
受到上述讨论的启发,我们试图学习涉及多个用户和项目的高阶用户-项目关系,这些关系可以自然地用超边来表示。与图中的成对连接相比,超图中的超边可以连接多个顶点来表征复杂的关系。为此,我们提出了一种从交互数据中提取高阶用户-项目关系的方法,称为高阶用户-项目关系学习(HOUR)。我们首先通过矩阵分解识别用户和项目之间的潜在语义因素作为超边来捕捉高阶关系,然后构建超图来描述这些关系。之后,我们设计了一个超图卷积网络,基于交互数据和提取的超图结构来学习用户、项目以及它们的高阶关系的表示。具体来说,我们扩展超图以获得多个图用于信息聚合,在这个过程中,用户、项目和关系被视为顶点,它们之间的直接连接得到了很好的保留。通过这种方式,可以聚合用户、项目和关系的信息,以便在不需要中间连接器的情况下学习它们的表示。我们基于贝叶斯个性化排名损失和交互历史上的重构损失来训练模型。
本文的主要贡献总结如下:
  • 我们提出了一种名为HOUR的方法,从交互数据中提取高阶用户-项目关系用于推荐。具体来说,我们识别潜在的语义因素作为超边来捕捉用户和项目之间的关系,然后构建超图来描述这些关系。
  • 我们扩展超图以获得多个图用于信息聚合,并基于超图卷积网络学习用户、项目以及它们在高阶表示空间中的综合表示。
  • 我们在四个真实世界数据集上进行了广泛的实验,以证明我们提出方法的有效性。实验结果表明,我们的模型在性能上超过了现有的最佳基线。
  • 本文的其余部分组织如下。我们在第2节讨论相关工作,然后在第3节介绍超图和推荐系统的初步知识。第4节提供了我们提出方法的技术细节,第5节展示了实验结果和讨论。最后,第6节总结了整篇论文。

    节选

    基于图的推荐

    最近,图卷积网络(GCN)[12]、[13]已成为最先进的图学习模型,它们不仅可以利用顶点特征,还可以利用图结构。GCN的基本学习策略是通过迭代聚合其邻居的特征表示来获得顶点的特征表示[14]。
    通过这种方式,图中的高阶结构信息也可以得到有效利用。HeroGCN [15]设计了一个图互信息最大化模块

    初步知识

    在本节中,我们介绍了超图的定义和推荐任务。表1列出了本文中常用的符号和描述。

    方法论

    图2展示了我们提出的方法HOUR的概述。我们首先构建一个超图来表征来自交互数据的高阶用户-项目关系。之后,我们扩展超图并开发一个超图神经网络,以学习用户、项目以及它们在高阶表示空间中的嵌入。

    数据集

    我们在从真实世界应用中收集的四个不同规模的数据集上进行了实验。这四个数据集的统计信息在表2中呈现。Douban:一个由用户对电影的评分组成的数据集,来自豆瓣网站。Beidian:这个数据集由Lin等人[49]发布,来自北电网站。Yelp:一个来自Yelp平台的评分交互数据集,广泛用于评估推荐系统。Beibei

    结论

    在本文中,我们提出从用户-项目交互历史数据中同时学习涉及用户和项目的高阶关系。我们使用连接多个用户和项目的超边来表征这些高阶关系,并开发了一个超图卷积网络来学习用户、项目以及它们在联合空间中的表示。在几个真实世界数据集上进行了广泛的实验以证明

    CRediT作者贡献声明

    Jingwen Wang:撰写——原始草稿、验证、方法论。Yuguang Yan:撰写——审阅与编辑、监督、方法论。Ruichu Cai:监督、资金获取。Michael K. Ng:监督、资金获取。Zhifeng Hao:监督、项目管理、资金获取。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

    致谢

    这项研究部分得到了国家科学技术重大项目(2021ZD0111501)、国家优秀青年科学基金(62122022)、广州市基础与应用基础研究基金(2023A04J1700)、国家自然科学基金(U24A20233、62476163、62206061)、广东省基础与应用基础研究基金(2023B1515120020、2024A1515011901)的支持。Michael Ng的工作部分得到了香港研究资助委员会CRF C7004-21GF的支持。
    Jingwen Wang于2019年在中国华南理工大学获得软件工程学士学位。她目前正在中国广东工业大学计算机科学学院攻读博士学位。她的研究兴趣包括图学习、因果机器学习和推荐。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号