双轨扩散:基于结构引导的高保真去噪技术在社交推荐中的应用
《Knowledge-Based Systems》:Dual-Track Diffusion: Structure-Guided High Fidelity Denoising for Social Recommendation
【字体:
大
中
小
】
时间:2026年02月08日
来源:Knowledge-Based Systems 7.6
编辑推荐:
社会推荐中,传统去噪方法存在网络结构破坏或忽略节点依赖的缺陷。本文提出结构引导高保真去噪框架SGDSR,通过双扩散模块融合网络拓扑约束与用户表征,利用对比学习对齐不同扩散路径的表征,并设计融合去噪机制消除残噪。实验表明在三个真实数据集上优于基线方法。
杨旭华|黄振雷|马刚峰|徐佳宁
浙江工业大学计算机科学与技术学院,杭州,310023,中国
摘要
社交推荐将社交网络信息整合到个性化推荐系统中,从而有效缓解了数据稀疏性和冷启动问题。然而,现实世界的社交网络中通常包含噪声,这严重阻碍了真实社交偏好信息的捕获。现有的社交去噪方法分为两类:“硬”去噪基于网络重建(可能会严重破坏原始网络拓扑结构)和“软”去噪基于用户表示(在去噪过程中常常忽略节点之间的依赖关系)。为了解决这些局限性,我们提出了一个结构引导的高保真度去噪框架用于社交推荐(SGDSR)。首先,我们设计了一个双扩散模块,通过将网络拓扑约束引入扩散过程来整合结构信息,从而在去噪过程中有效保留关键社交信号。然后,我们采用对比学习来对齐来自双扩散路径的表示,增强一致性。最后,我们提出了一种融合去噪机制,以改进集成网络信息的鲁棒性。在三个真实世界数据集上的广泛实验表明,SGDSR的性能优于现有的最佳方法。代码可在
https://github.com/Only-SR/SGDSR获取。
引言
推荐系统旨在通过分析用户与物品的行为交互数据来提供个性化的物品推荐。然而,现实世界场景中的交互数据往往很稀疏,传统的推荐系统无法有效解决冷启动问题[1]、[2]。近年来,由于社交推荐在缓解用户端冷启动问题方面的有效性[3]、[4]、[5],它吸引了大量研究关注。
在社交同质性和社交影响力假设下[6]、[7]、[8],社交推荐通过利用社交网络信息来提高推荐性能。社交同质性假设认为具有相似偏好的用户倾向于成为朋友,而社交影响力假设认为用户会影响他们朋友的偏好。近年来,图神经网络(GNNs)[9]、[10]、[11]、[12]在表示网络结构化数据方面展示了显著的优势。受此启发,基于GNN的社交推荐方法[13]、[14]、[15]、[16]利用邻域信息聚合和节点表示更新从社交网络中提取社交同质性和社交影响力信息。然后,它们通过完全整合和交互这些信息来学习可靠的用户和物品表示,最终实现用户的个性化物品推荐。然而,用户误点击、朋友接触有限以及虚假的社交关系等因素会向原始网络数据中引入大量噪声,严重影响模型性能。因此,许多当前模型专注于网络去噪以重建可靠且稳健的网络结构。
当前的社交推荐去噪方法通常分为两种方法。一种是基于用户表示的“软”去噪方法[17]、[18]、[19]。这类方法通过神经网络对原始网络表示进行去噪。得益于扩散模型(DMs)[20]、[21]在视觉领域的流行,一些方法[22]、[23]尝试将DMs应用于网络内的节点表示去噪。然而,这些方法直接移植了视觉领域的扩散模型,忽略了网络中固有的关键结构信息,导致去噪后的节点表示效果不佳。另一种方法是基于网络重建的“硬”去噪。硬去噪方法通常依赖节点表示的相似性来设置阈值,并以二值化方式重建网络。这类方法的缺点如下:首先,社交关系的形成受到多种潜在因素(如跨社区互动)的影响,仅依赖显式相似性容易导致误判。其次,直接删除或添加边会破坏网络的拓扑结构,从而影响社交同质性和社交影响力假设的建模,最终损害推荐性能。第三,阈值的选取具有主观性,设置得过高可能会移除低相似度的真实边(如跨群体社交联系),而设置得过低则可能保留噪声边或植入无关边。图1展示了这种方法对网络结构造成的显著扭曲:相似度适中的边(通常对应于真实但关联较弱的社交关系,例如相似度得分为0.49的边)被大量移除,而略高于阈值的边(例如相似度为0.51的边)则被保留。这导致网络拓扑结构扭曲,从而影响推荐性能。
为了解决上述挑战,我们提出了结构引导的高保真度去噪框架用于社交推荐(SGDSR)。该模型采用基于表示扩散的“软”去噪,减轻了与“硬”去噪相关的潜在网络损伤。关键的是,SGDSR将结构信息整合到扩散过程中,以克服仅靠“软”去噪产生的次优表示。具体来说,我们设计了一个双扩散模块,便于感知节点表示和结构信息,实现不同感知组合之间的信息融合。此外,还利用对比学习进行表示对齐。最后,采用双图神经网络(GNNs)深入捕获用户偏好,并利用扩散模型进一步去噪融合后的表示。
SGDSR采用双轨扩散去噪机制,其中两条轨道分别定义为
Track-A和
Track-B。在Track-A中,首先对用户表示进行扩散去噪,然后进行基于GCN的结构感知。在Track-B中,首先进行结构聚合,然后应用基于扩散的去噪。Track-A的优势在于其能够预过滤噪声,从而防止结构传播过程中的噪声放大。然而,其局限性在于去噪过程中可能会丢失结构聚合所需的关键信息。Track-B的优势在于其初始聚合了邻近信息,增强了局部结构感知。但其缺点是结构传播过程中可能存在噪声放大的风险。因此,SGDSR采用双轨扩散机制,从“先去噪”和“先结构”两个角度增强用户表示。它通过对比学习对齐两条轨道的表示。通过补充这两种信息融合的顺序,SGDSR不仅在结构传播过程中抑制噪声,还在去噪过程中保留结构信息,实现了去噪和结构的双向增强。本文的主要贡献如下:
1.我们提出了一个新颖的去噪框架SGDSR,避免了“硬”去噪方法可能对网络拓扑造成的损害,并解决了“软”去噪方法中缺失的结构信息问题。
2.我们设计了一种基于对比学习的表示对齐机制,比较并细化了每个双扩散模块派生的用户表示,增强了表示的鲁棒性并提高了模型的泛化能力。
3.我们提出了一种融合去噪策略,在融合后应用扩散模型进一步去噪表示,消除了融合过程中引入的残余噪声。
4.我们在三个真实世界数据集上进行了广泛实验,证明了SGDSR在社交推荐任务中的有效性、稳定性和优越性。
本文的其余部分组织如下。第2节回顾相关工作,第3节介绍初步知识。第4节详细阐述所提出的SGDSR模型。第5节介绍实验设置和结果。最后,第6节总结本文。
部分摘录
基于GNN的社交推荐
社交推荐系统分析用户的社交关系和社交网络信息,为用户提供个性化推荐,同时缓解了传统推荐系统的数据稀疏性和数据冷启动问题[24]、[25]。早期的社交推荐研究主要采用矩阵分解技术来浅层利用社交信息,例如协同分解[26]、[27]和正则化[28]、[29]。
初步知识
在本节中,我们简要介绍了与SGDSR相关的基本概念。
提出的模型
在本节中,我们首先介绍模型的整体架构。随后,我们详细阐述了SGDSR架构中每个模块的设计细节,并描述了这些模块的联合训练优化策略。最后,我们对模型进行了时间复杂度分析。
实验
在本节中,我们在三个真实世界的推荐数据集上进行了广泛实验,以验证所提出的SGDSR的有效性,并回答以下问题:
1.RQ1:我们提出的SGDSR与现有的最佳Top-K社交推荐方法相比表现如何?
2.RQ2:SGDSR的各个模块是否对推荐性能有积极贡献?
3.RQ3:不同超参数对SGDSR的有效性有何影响?
4.RQ4:去噪
结论与未来工作
在本文中,我们提出了SGDSR,这是一个基于扩散的新去噪框架,包含四个关键模块:1)双扩散,2)表示对齐,3)图编码器,4)融合去噪。SGDSR首先使用双扩散模块对社交网络中的用户表示进行去噪。与传统表示去噪方法不同,我们通过轻量级的GCN将用户和物品的结构信息注入扩散过程,以增强关键的关系上下文。
CRediT作者贡献声明
杨旭华:监督、项目管理、资金获取、概念化。黄振雷:撰写——原始草稿、软件、资源、形式分析。马刚峰:撰写——审阅与编辑、可视化、验证、方法论。徐佳宁:监督、调查。
利益冲突声明
作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(项目编号:62176236)和浙江省自然科学基金(项目编号:LZ24F030011)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号