基于层次对比频率增强的多项式图协同过滤推荐算法

《Neurocomputing》:Hierarchical contrastive frequency-enhanced polynomial graph collaborative filtering for recommendation

【字体: 时间:2026年02月21日 来源:Neurocomputing 6.5

编辑推荐:

  提出PFCLRec框架,通过多项式滤波分离低频/高频信号并抑制噪声,结合分层对比学习增强跨视图稳定信号,优化表示空间对齐与均匀性,有效解决异构噪声和局部结构识别问题,实验验证其优于现有方法。

  
刘虎|韩春晖|周伟|文俊豪
重庆大学大数据与软件工程学院,中国重庆沙正街174号,400044

摘要

图协同过滤(GCF)通过交互图建模捕捉用户-物品偏好,因其图数据性能而受到广泛关注。最近的研究从频谱域的角度分析和处理不同的信号成分,以探索其成功的原因。然而,仍有两个关键挑战尚未解决:(1)在具有异构噪声分布的数据集上信号去噪的不灵活性;(2)由于全局傅里叶变换,频谱图网络中的空间定位意识有限,这阻碍了聚合过程中的局部结构区分。为了解决这些问题,我们提出了PFCLRec,这是一个结合了多项式滤波器和分层对比学习的新框架,用于频域信号增强。PFCLRec利用频谱层次差异构建对比视图,强调跨视图稳定信号,同时抑制瞬态和局部噪声。此外,它还协调了图卷积操作与表示空间优化之间的相互价值,指导空间信息聚合和表示精细化。在七个真实世界数据集上的广泛实验表明,PFCLRec优于现有方法。我们的源代码和数据可在以下链接获取:https://github.com/lhybq/PFCLRec

引言

随着推荐系统在各种平台上的兴起和繁荣,作为推荐系统基石之一的协同过滤在学术界和工业界得到了广泛应用。协同过滤的核心动机和关键思想是发现相似用户和物品之间的关联以进行推荐。矩阵分解[1]作为最早的协同过滤方法之一,取得了显著的成功。然而,人们普遍认为其核心模型仅依赖于线性运算符,缺乏强大的表达能力。后续研究将各种非线性运算引入协同过滤,包括多层神经网络[2]、[3]和基于注意力的模型[4]。然而,这些方法忽略了用户-物品二分图中的高阶信息,导致性能不佳。因此,其他基于图的模型[5]、[6]、[7]应运而生,它们有效地捕获了高阶邻域信息,成为协同过滤的主流方法。
目前,基于图的协同过滤研究主要遵循两个方向。一个方向是设计图节点嵌入的更新和传播机制,以学习用户和物品嵌入,从而利用高阶信息并通过小批量优化训练模型。另一个方向是直接使用奇异值分解或特征值分解,基于前K个奇异值或特征值[8]、[9]来生成嵌入。在这两个研究方向中,图协同过滤模型通常采用低通或带阻滤波器来引入低频或高频成分。然而,关于如何有效利用这些不同频率成分的讨论仍然不足。此外,许多现有的传播方法依赖于单项式基,例如LightGCN[5],但单项式基在函数近似方面存在一定的局限性。一方面,它们与权重函数的正交性较差,可能导致优化困难[10];另一方面,作为低通滤波器,它们忽略了高频信号,并且对中频信号处理不佳。
为了克服上述挑战,相关研究[8]、[11]从信号特征的角度分析了图协同过滤,发现交互数据中的低频和高频信号表现出强烈的线性相关性,而中频信号缺乏明显的线性相关性。因此,图滤波器需要分别对这些两种类型的信号进行建模,使用带阻滤波器和简单的线性模型来避免过拟合,并用非线性模型增强模型的表达能力。此外,提出了以雅可比多项式为一般形式的正交多项式基来近似图卷积。通过精心设计滤波器,将低频和高频成分与中频成分分开,并通过线性变换处理低频和高频成分。相比之下,复杂的中间频成分通过非线性变换进行处理。
动机使用雅可比多项式导出的正交多项式基对图卷积进行近似,为处理协同信号提供了新的频谱视角,具有明显的优势。首先,利用多项式的递归性质消除了像LightGCN这样的空间图卷积方法中固有的节点表示更新复杂性,显著简化了模型架构。此外,基于多项式的图卷积近似避免了GDE[8]、[9]等工作中所需的显式特征值分解,提高了大型数据集的可扩展性。
尽管取得了这些进展,但仍存在重大挑战。像JGCF和GDE这样的先前方法依赖于图傅里叶变换(GFT),该变换本质上是全局的。虽然在分离平滑/粗糙信号方面有效,但它们难以捕捉局部结构特征(即节点与其局部邻居之间的细粒度空间关系)。此外,现有的频谱滤波器通常是固定的,无法适应异构噪声分布。我们认为,真正的用户偏好应在不同的频率视图下保持稳定,而噪声通常是瞬态的且具有特定带宽。因此,需要一个框架来弥合全局信号处理和局部几何表示之间的差距,同时有效过滤瞬态噪声。
我们的方法为了解决上述限制,我们提出了一种用于推荐的图卷积信号增强和表示优化模型,名为PFCLRec。PFCLRec弥合了全局信号处理和局部几何表示之间的差距。通过将空间约束(对齐和均匀性目标)与频谱多项式滤波相结合,我们的模型恢复了在全球频谱滤波过程中经常丢失的局部区分能力。具体来说,通过分析交互信号的光谱特征,我们构建了一个分层对比学习框架。这种设计不仅减轻了多项式滤波器在信号捕获方面的不足,还充当了一个隐式的自适应去噪器。通过最大化整体混合频率视图与特定频率带视图之间的互信息,模型能够自适应地过滤掉在不同视图之间不一致的随机噪声,同时保持用户偏好的稳定性。最后,在信号增强和表示优化的协同作用下,推荐性能得到了显著提高。
我们在真实世界数据集上设计了广泛的实验,并评估和分析了多个指标的实验结果。所提出的模型在综合性能上优于现有的最佳基线模型,全面的消融研究和变体实验进一步验证了模型每个模块的有效性。
贡献我们工作的主要贡献可以总结如下:
  • 我们识别了异构噪声分布的挑战,并提出了一种通过分层对比学习进行自适应去噪的机制。通过设计具有分层对比视图的金字塔残差网络,我们的模型充当了一个隐式的自适应去噪器,通过学习不同频率视图之间的相关性来抑制不一致的噪声并增强有用信号。
  • 我们将表示空间优化目标集成到频谱滤波框架中。通过显式优化嵌入的对齐和均匀性,我们作为空间约束来弥合全局频谱处理和局部几何区分之间的差距,缓解了过度平滑问题。
  • 我们在七个广泛使用的公共数据集上进行了广泛的实验和分析,以验证所提出模型PFCLRec的有效性。此外,为了便于重现性,实验代码和数据已开源。

章节片段

图协同过滤

图协同过滤(GCF)通过建模用户-物品交互图来捕捉用户对物品的偏好,由于其在图结构数据上的强大性能而受到广泛关注。图神经网络(GNN)方法可以分为两类:空间频谱。空间模型通过邻域聚合执行结构卷积以提取局部特征,而频谱模型将图解释为通过频谱域图卷积处理的信号

初步

在本节中,我们阐述了图协同过滤问题,符号描述见表1。

方法论

所提出模型PFCLRec的总体框架如图1所示。

实验

我们在几个真实世界数据集上进行了广泛的实验,通过严格的定量分析验证了PFCLRec的有效性,解决了以下Research Questions:
  • RQ1:PFCLRec与各种现有最佳推荐模型相比表现如何?
  • RQ2:模型的每个组件如何有助于提高推荐性能?
  • RQ3:不同的基于滤波器的对比视图生成方案的有效性如何?
  • RQ4:
  • 结论

    在这项工作中,我们设计了一个推荐模型,通过分层频域信号增强和对比表示优化学习来提高从用户-物品交互图中捕获信息的能力。首先,分析了图卷积信号中的频域层次差异。构建了多层对比视图,以减轻多项式滤波器在频率捕获方面的不足,强调跨视图稳定的组件

    CRediT作者贡献声明

    刘虎:撰写——原始草稿、方法论、调查、形式分析、数据策划、概念化。韩春晖:撰写——审阅与编辑、验证、调查、形式分析、概念化。周伟:撰写——审阅与编辑、验证、监督、资源管理、方法论、数据策划、概念化。文俊豪:验证、监督、资源管理、项目管理、资金获取。

    利益冲突声明

    作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

    致谢

    本工作得到了中国国家自然科学基金(项目编号72074036、62072060)的支持,以及中国重庆市自然科学基金(项目编号CSTB2024NSCQ-MSX0701)的支持。
    刘虎于2022年获得南京科技大学信息与计算科学学士学位,2025年获得重庆大学大数据与软件工程学院硕士学位。他的研究兴趣包括推荐系统、自监督学习和图神经网络。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号