通过基于归纳子图模式的图神经网络,实现对云服务的稀疏服务质量(QoS)预测

《Computer Communications》:Sparse QoS prediction for cloud services via inductive subgraph pattern aware graph neural network

【字体: 时间:2026年01月30日 来源:Computer Communications 4.3

编辑推荐:

  针对云服务QoS预测中的数据稀疏和模型可迁移性挑战,提出ISPA-GNN框架,结合图神经网络与子图采样策略,优化稀疏场景下的预测性能,同时降低存储开销,实验验证其优于现有方法。

  
Jianlong Xu|Caiyi Chen|Qingcao Dai|Guanchen Du|Ruiqi Wang|Mingtong Li|Quanqing Guo|Yuxiang Zeng
汕头大学数学与计算机科学学院,中国汕头,515063

摘要

准确预测服务质量(QoS)对于为每位用户选择合适的云服务至关重要。协作预测模型在为用户选择合适的云服务方面已经取得了成功。然而,它们经常面临极端稀疏性的问题,即可用于协作过滤的交互数据非常有限。一些模型在处理极端稀疏性方面表现出色,但同时在泛化能力上存在不足。为了克服这些挑战,我们提出了一种基于归纳子图模式感知图神经网络(ISPA-GNN)的云服务QoS预测框架。我们的框架采用了一种新颖的基于图的协作过滤方法,并结合子图采样策略,以更有效地提取用户与服务交互的语义信息。为了优化内存使用并提高对未见用户或服务的泛化能力,我们使用了解耦的基于ID的嵌入方法,以最大化上下文信息。在大型真实世界QoS数据集上的广泛实验表明,ISPA-GNN在平均绝对误差(MAE)和均方根误差(RMSE)方面优于大多数当前的协作QoS预测技术,同时在内存效率上也取得了显著提升。

引言

随着物联网(IoT)、边缘计算和5G等技术的进步,全球网络基础设施不断扩展,云服务在全球范围内得到广泛应用。这些进步使云服务提供商能够提供多样化的智能服务,从而提高人类的生活质量与效率[1]。然而,云市场的快速扩张也导致了替代服务的数量不断增加,这使得准确匹配用户与最合适的选项变得越来越困难。
为了解决这个问题,服务质量(QoS)的概念变得至关重要。QoS描述了服务的非功能性属性(例如响应时间、吞吐量和故障率),并常被用来区分功能上等价的云服务[2]。根据QoS指标选择合适的服务对于改善用户体验、优化资源分配以及提高服务提供商的竞争力至关重要。然而,由于用户和服务的数量庞大,请求者直接调用每个服务来监控QoS值是不切实际的。准确预测QoS对于满足下游任务的需求至关重要。但由于历史上的用户服务交互数据有限,这已成为一个具有挑战性的研究问题。
最近的研究提出了许多QoS预测方法,其中协作过滤(CF)仍然是最广泛采用的方法。这些基于CF的方法主要利用与待预测用户相似的历史QoS数据来预测缺失值[3]。尽管基于CF的方法有效,但它们在同时处理数据稀疏性和数据传导性问题方面存在困难。为了克服这些限制,仍有几个关键挑战需要解决:
  • 传导性。现有的QoS预测方法往往是传导性的。它们需要定期重新训练以纳入新用户、新服务和新观察到的QoS记录。因此,当环境发生变化时,模型无法立即适应。然而,这种方法有两个主要缺点:(1)新用户和服务的最新QoS数据无法立即影响模型,这延迟了相关信息的利用,降低了系统的响应性和准确性;(2)当前的训练数据预先决定了新用户和服务的预测QoS值,忽略了他们的独特偏好和需求,可能导致推荐服务与实际用户需求不匹配,从而降低整体用户满意度。总之,当前模型的传导性质限制了它们在不断有新用户和服务添加的动态环境中的有效性。
  • 高稀疏性。QoS预测模型中的初始稀疏数据阶段,即冷启动问题,存在重大风险,因为新用户或服务的历史数据不足。这种数据缺乏使得准确的QoS预测变得困难,可能导致用户流失甚至业务失败,因为用户可能对推荐的服务不满意。因此,开发在高稀疏性条件下仍然有效的QoS预测模型至关重要。能够处理冷启动问题的强大模型将减轻与稀疏数据相关的风险,确保新用户和服务获得准确相关的推荐。
  • 高存储成本。
    以往基于模型的QoS预测方法在服务推荐系统中为每个用户和每个服务创建唯一的嵌入,有时甚至为每个上下文特征创建嵌入。这种复杂的嵌入设计导致模型的存储占用随实体数量线性增长,引入了大量的空间开销。在云服务环境中,这种行为通常是不可接受的。
为了解决上述限制,我们提出了ISPA-GNN(归纳子图模式感知图神经网络)用于云服务的稀疏QoS预测。ISPA-GNN从用户-服务QoS矩阵中学习有信息的局部子图模式,以捕捉重要的用户-服务依赖关系。该方法专为动态的在线云服务推荐系统设计,消除了频繁重新训练的需要。为了在高稀疏环境中提高性能,我们开发了一种基于上下文的邻域子图采样策略来捕获粗粒度的网络上下文。我们通过使用上下文嵌入来表示独特的用户和服务嵌入,简化了这一过程。我们的实验表明,ISPA-GNN在极端稀疏场景下实现了出色的预测性能,并解决了数据传导性问题。主要贡献总结如下:
  • 我们提出了一种基于图神经网络和QoS预测方法的新方法。它扩展了模型的感知范围,使其能够覆盖远离中心用户的服务,同时减少了训练时间并提高了整体效率。它还利用邻近节点的嵌入来减少内存开销,并降低了时间和空间复杂度。
  • 我们还提出了两种采样策略,即基于BFS的子树采样和基于上下文的邻域采样,用于用户-服务交互图。这些策略有助于在高稀疏条件下进行准确的QoS预测。我们在学习阶段利用服务质量数据的模式来实现准确的归纳推理。
  • 我们在真实世界的QoS数据集(WSDREAM [4])上进行了广泛的实验,以评估ISPA-GNN的性能。实验结果表明,ISPA-GNN在处理稀疏预测挑战方面优于现有模型。通过在训练期间保留高达25%的用户和服务来模拟未见场景,ISPA-GNN在稀疏设置(密度=1%)下仍保持竞争力。RMSE的下降最多仅为3.52%,而QoS预测的准确性、鲁棒性和公平性仍可与全数据设置相媲美。
本文的其余部分结构如下。第2节介绍相关文献。第3节介绍问题定义和模型概述。第4节讨论我们的详细设计和完整解决方案。第4.1节评估我们在不同设置下的模型性能,第5节总结本文。

相关工作

相关研究

准确的QoS值对于各种基于QoS的云服务方法至关重要。CF在QoS预测任务中被广泛使用[5],因为它在推荐系统中的成熟应用可以预测未知的评分[6]。现有的基于CF的方法可以分为基于内存的方法、基于模型的方法和混合方法。
对于基于内存的CF方法,Jin等人[7]提出了一种基于邻域和皮尔逊相关系数(PCC)的方法来预测QoS值

方法论

本节首先介绍问题定义,然后概述ISPA-GNN框架及其主要组成部分。

实验

在前一节介绍了ISPA-GNN的架构和机制之后,我们现在转向对其方法的实证评估。本节旨在全面验证所提出模型在真实世界服务计算场景下的有效性和效率。为了回答以下研究问题,我们进行了一系列实验:
  • RQ1
    ISPA-GNN在真实世界场景中的表现与基线相比如何?
  • RQ2
    粗粒度网络子图如何影响我们的

结论与未来工作

在这项研究中,我们研究了在极端稀疏数据条件下的归纳QoS预测问题。之前的传导模型在有效处理新用户和服务方面存在困难。这些模型在处理高度稀疏的记录时也表现出性能下降。为了解决这些挑战,我们提出了两种新的ISPA-GNN设计。首先,我们直接学习目标用户和服务周围的局部QoS模式。这是通过提取QoS子树来实现的

CRediT作者贡献声明

Jianlong Xu:撰写——原始草稿、方法论、资金获取、形式分析、概念化。Caiyi Chen:撰写——原始草稿、监督、调查、形式分析。Qingcao Dai:撰写——审阅与编辑、数据整理。Guanchen Du:可视化、验证、调查。Ruiqi Wang:撰写——审阅与编辑、监督。Mingtong Li:概念化。Quanqing Guo:撰写——审阅与编辑。Yuxiang Zeng:撰写——审阅与编辑、监督。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本研究得到了广东省基础与应用基础研究基金(编号:2023A1515010707、2024A1515012468、2024A1515011765)、广东省高校重点领域专项(编号:2022ZDZX1008)、广东省科技专项基金(“重大专项+任务清单”项目(编号:STKJ202209017)、广东省科技计划(编号:STKJ2023012)的财政支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号