用于下一代购物车推荐系统的具有区分能力的跨域卷积学习模型

《Knowledge-Based Systems》:Discriminative Cross-Domain Convolutional Learning Model for Next Basket Recommender Systems

【字体: 时间:2026年02月28日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  针对跨域下 basket Recommender 系统的数据稀疏、冷启动及泛化能力不足问题,本文提出 D-CCL 框架,通过融合本地敏感增强卷积捕捉几何共现、紧凑自注意力建模时序依赖、定向跨域知识迁移和自适应惯性粒子群优化,有效平衡探索与利用。实验表明,相比基线模型,在 Amazon 四域和 HM 跨域场景下,F1@k 和 NDCG@k 分别提升 10.1%-14.4% 和 9.8%-13.1%,验证了跨域几何-时序联合建模的优越性。

  
约翰·金斯利·亚瑟|周从华|沈向军|杰里迈亚·奥塞·夸克耶|埃里克·阿皮亚·曼特
江苏大学,学府路301号,江苏省镇江市,212013,中国

摘要

下一代购物篮推荐系统对于提升在线零售平台的用户参与度和收入至关重要,但它们仍然受到数据稀疏性、冷启动条件、跨领域泛化能力弱以及难以同时建模物品共现和购买序列变化的限制。为了解决这些问题,本研究提出了一个具有区分能力的跨领域卷积学习框架,该框架整合了四个组件:一个卷积模块,用于捕捉产品集内的细粒度物品共现模式;一个紧凑的自注意力机制,用于建模短距离和长距离的顺序购买依赖性;一种单向跨领域迁移策略,利用数据丰富的源领域知识来增强稀疏目标领域的学习;以及一种基于轻量级粒子的优化方案,通过自适应惯性和反向学习来平衡探索和利用。跨领域相关性通过学习到的物品表示之间的特征级相似性和类别分布上的行为差异来量化,而领域特定偏差则通过在源领域进行标签平衡采样以及在目标领域仅选择性地调整紧凑的排名头(同时保持共享的骨干网络不变)来减少。在四个亚马逊领域(书籍、电影、食品和厨房)以及来自Hennes & Mauritz个性化时尚推荐语料库的额外时尚基准数据集(女性→儿童)上进行的广泛实验表明,与强大的基线方法相比,该框架取得了持续的改进,在亚马逊上F1分数的提高幅度达到了14.40%,在Hennes & Mauritz儿童领域达到了10.10%。这些改进既适用于紧密相关的领域对,也适用于差异较大的领域对。总体而言,结果表明,在高效优化的框架内结合几何共现学习、紧凑的顺序建模和有针对性的跨领域迁移,可以在数据稀疏和冷启动条件下提供更准确、更稳健且更具上下文意识的购物篮推荐。

引言

在当今的数据驱动型数字经济中,在线平台越来越依赖大规模数据分析和智能决策系统来创造价值、优化供应链和个性化用户体验。电子商务、数字市场以及基于平台的商业模式的快速增长加剧了竞争,使得个性化服务成为用户保留和收入增长的关键差异化因素。在这一背景下,推荐系统已成为数字经济基础设施的基础组成部分,使亚马逊、Netflix和阿里巴巴等平台能够将大量行为数据转化为可操作的洞察和定制化的推荐[1]、[2]。在这些技术的前沿是下一代购物篮推荐系统(NBRS)[3]、[4]、[5]、[6],它们旨在根据历史交易序列预测用户即将购买的购物篮内容。通过预测用户需求和消费模式,NBRS不仅提高了客户满意度,还直接促进了购买频率的增加、运营效率的提升以及数字经济的持续价值创造。
问题陈述:尽管得到了广泛采用,现代NBRS仍存在三个持续的缺陷。(i) 表示: 单领域协同过滤和序列模型在孤立情况下表现良好,但在行为跨越多个领域时无法泛化;它们也未能充分表示几何(购物篮内的)共现和更长时间范围的时间结构[7]、[8]。(ii) 迁移: 跨领域方法通过知识迁移来缓解数据稀疏性问题,但它们主要依赖于单模态的文本/ID信号和弱的结构对齐,这限制了在冷启动和领域变化条件下的鲁棒性[9]、[10]、[11]、[12]。(iii) 优化: 标准的随机梯度下降/Adam和经典的粒子群优化(PSO)变体在高维、稀疏情况下容易崩溃,导致过早收敛、嵌入冗余和推荐多样性降低[13]、[14]、[15]。这些缺陷促使人们需要一种统一的方法,能够共同建模几何共现和序列动态,实现在稀疏/冷启动条件下的结构感知跨领域迁移,并结合一种平衡探索与利用的优化机制。
本工作的新颖之处。基于上述观察,本研究在单一的统一框架内做出了四个独特的贡献。首先,它引入了一个增强局部敏感性的卷积模块,能够在不依赖显式图构建的情况下捕捉购物篮内的细粒度几何共现。其次,它提出了一种紧凑的自注意力机制,替代了循环编码器,同时保留了短距离和长距离的顺序购买依赖性,并减少了计算开销。第三,它设计了一种结构感知的单向跨领域迁移策略,将来自数据丰富源领域的几何和顺序表示直接迁移到稀疏的目标领域,从而直接解决了冷启动和数据稀疏问题。最后,它结合了一种基于自适应惯性和反向学习的优化感知学习机制,以在高维稀疏环境中稳定收敛并保持推荐多样性。
动机:以亚历克斯为例,她是一个热衷于购物的用户,她的购买历史涵盖了源领域(书籍)和稀疏的目标领域(厨房电器)。虽然她在书籍领域的持续活动提供了丰富的行为数据,但她仅在厨房领域购买了一次搅拌机,这体现了冷启动问题。现有的NBRS往往过度拟合源领域,无法在目标领域推荐有意义的商品(例如榨汁机或空气炸锅)。解决这类问题需要先进的跨领域机制,能够在保留多样性和上下文相关性的同时跨领域传递丰富的信号(见图1)。此外,有效的解决方案必须通过选择性对齐领域特定的表示来减轻负面迁移,而不是强制进行严格的特征共享。这激发了对能够利用异构用户行为的区分性和自适应跨领域学习策略的需求。
差距分析:最近的模型(例如TMO [16]、PTUPCDR [17]、CDRIB [18]、HMRec [19])在跨领域推荐方面取得了进展,但通常受到领域相关性弱、对抗设置不稳定或缺乏细粒度几何建模的限制。同样,单领域NBRS如FPMC [20]、HAEM [8] 和 MBN [21] 在冷启动和稀疏条件下表现不佳。虽然一些方法结合了动态属性[22]、[23],但它们未能同时整合几何、序列和跨领域学习。
像动态属性NBRS(AnDa)[22]和超卷积模型(PPU)[23]这样的较新模型试图捕捉动态属性和行为模式。然而,AnDa的动态属性建模未能充分利用物品之间的静态和顺序关系,限制了其在极端冷启动条件下的性能。同样,PPU的超卷积结构虽然对重复购买有效,但在交互数据稀疏的冷启动用户情况下缺乏灵活性。
为了克服这些限制,我们提出了具有区分能力的跨领域卷积学习(D-CCL)框架,它统一了区分性的几何学习、自适应的顺序建模和高效的跨领域知识迁移。在其核心,D-CCL采用了带有局部敏感性估计器(LSE)的卷积神经网络,以提取购物篮内的细粒度物品关系和几何共现模式。为了建模时间动态,它用紧凑的顺序注意力模块(CSAM)替换了传统的循环结构,这是一种轻量级的自注意力编码器,能够以较低的计算成本捕捉短距离和长距离的依赖性。这种设计确保了对用户偏好变化的适应性,使D-CCL非常适合动态和稀疏的推荐场景。除了其特征表示能力外,D-CCL还结合了精细的学习感知粒子优化器(ReLaPo),该优化器用反向学习和自适应惯性控制替代了复杂的量子和基于核的策略。这种优化策略增强了收敛性,保持了多样性,并在高维稀疏空间中提高了物品排序的准确性。
这些组件共同构成了一个连贯的架构,在我们的评估中优于对比的基线方法。结合LSE驱动的几何编码、基于CSAM的顺序建模和ReLaPo驱动的优化,D-CCL缓解了冷启动问题,增强了跨领域迁移能力,并促进了推荐多样性。如表1所示,该框架在指定的数据集和协议下在F1@k和NDCG@k方面取得了持续的改进,各领域的结果和配对显著性测试在第4-5节中报告。

部分摘录

新颖性和贡献

本研究的新颖之处在于将几何学习、顺序学习和跨领域学习集成到一个统一的框架中用于购物篮推荐,并通过一个优化感知的训练机制进一步得到了增强。与之前独立处理这些方面的NBRS研究不同,我们提出的D-CCL:
  • 引入了LSE–CNN,这是一种增强局部敏感性的卷积模块,能够捕捉购物篮内物品之间的细粒度几何共现。
  • 提出了CSAN,一种紧凑的自注意力
  • 相关工作

    下一代购物篮推荐技术迅速发展,从传统的协同过滤技术发展到复杂的深度学习和跨领域策略。本节通过回顾几何特征提取、跨领域迁移、序列建模和优化策略方面的重大进展,将我们提出的D-CCL架构置于更广泛的研究背景中。

    提出的方法

    提出的D-CCL框架用于下一代购物篮推荐系统(NBRS),包括四个阶段(图2):购物篮表示学习、顺序行为建模、特征融合和购物篮预测。在购物篮表示阶段,一个带有局部敏感性估计器(LSE–CNN)的轻量级卷积编码器捕捉每个购物篮内的几何共现。与普通的CNN(固定核)或重新标记的GNN(消息传递)不同

    实验设置和评估

    在本文的这一部分,我们解决了以下研究问题,以评估所提出的D-CCL框架的有效性、性能和内部机制:RQ1:当与最佳的跨领域和单领域购物篮推荐模型进行比较时,这种D-CCL方法的表现如何?RQ2:特别是局部敏感性估计器(LSE)和紧凑顺序注意力网络(CSAN)在几何和顺序特征提取方面的集成效果如何

    D-CCL与基线方法的性能分析(RQ1)

    我们使用F1@5、NDCG@5、F1@20和NDCG@20,在电影、书籍、食品、厨房以及H&M时尚(女性→儿童上,将提出的D–CCL与代表性的跨领域和单领域NBRS基线进行了比较。表4、5和6报告了10次试验的平均值,并提供了与最强的非D–CCL基线(HCPIM)的相对改进,以及来自配对Wilcoxon符号秩检验的调整后的

    值(使用Holm–Bonferroni校正)。

    在所有基准测试中,D–CCL都建立了新的

    结论

    本文介绍了具有区分能力的跨领域卷积学习(D–CCL)框架,作为解决下一代购物篮推荐系统(NBRS)核心限制的综合性方案,包括数据稀疏性、冷启动条件和有限的跨领域泛化能力。D–CCL统一了三个组件:一个增强局部敏感性的CNN(LSE–CNN),用于捕捉购物篮内的细粒度几何共现;一个紧凑的顺序注意力网络(CSAN),用于建模时间动态

    未引用的参考文献

    表11、表13和图12。

    CRediT作者贡献声明

    约翰·金斯利·亚瑟:撰写——原始草稿、可视化、验证、软件、方法论、调查、概念化。周从华:验证、监督、资源管理、项目行政、资金获取。沈向军:验证、监督、项目行政、方法论、概念化。杰里迈亚·奥塞·夸克耶:撰写——审阅与编辑、可视化、调查、数据管理、概念化。埃里克·阿皮亚·曼特:撰写——审阅与

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

    致谢

    本文得到了中国江苏省的关键研发计划(社会发展)项目BE2016630和BE2017628以及无锡市卫生健康和计划生育委员会的科学研究项目Z201603的支持。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号