边缘计算的出现为分布式计算和数据处理带来了范式的转变,特别是在需要实时任务执行和低延迟决策的环境中(Kambala (2024); Nain, Pattanaik, & Sharma (2022))。随着物联网设备的普及和数据密集型应用的指数级增长,传统的以云为中心的模型在高效处理计算工作负载方面面临重大挑战(Bablu, Aziz, & Rashid (2025))。例如,严重的传输延迟和网络拥塞使得这些模型不适用于包括自动驾驶系统、智能医疗和工业自动化在内的对延迟敏感的应用。因此,雾计算作为一种革命性框架应运而生,它通过将计算能力带到边缘来缓解这些问题(Arora & Sharma (2025); Verma & Naik (2024)),减少对云基础设施的依赖,并实现最低延迟的实时决策。
然而,在雾计算环境中进行高效的任务分配和卸载仍然是一个重大挑战,尤其是在任务到达率、资源可用性和网络条件不断变化的高度动态的集群环境中(Li et al. (2025))。在这种不断演变的环境中,战略性地管理任务卸载对于实现最佳工作负载分配同时减少延迟和能源消耗至关重要(Tian et al. (2025))。基于强化学习的任务卸载策略因其能够在复杂和不确定的系统动态中自适应地获取最佳策略而受到广泛关注(Carmo et al. (2024))。具体来说,多智能体强化学习(MARL)实现了分布式决策,其中多个智能体协作优化任务分配和执行策略(Hu et al. (2024); Sun, Chen, & Liu (2024))。然而,传统的RL方法在可扩展性、收敛时间过长以及任务转发路径探索效率低下方面存在问题(Dai, Wu, Wang, & Xu (2022); Goudarzi, Palaniswami, & Buyya (2021); Huang, Ye, & Zhou (2025))。此外,现有模型往往未能考虑簇间通信开销,这显著影响了网络拥塞和任务完成时间。尽管如此,现有的集中式或基于启发式的卸载方法受到可扩展性问题、资源分配不理想以及在不可预测的工作负载下决策效率低下的限制(Jia, Cao, & Yang (2014); Yang et al. (2025))。克服这些挑战需要一种整合了先进学习机制和全局优化策略的协调策略,以提供自适应、可扩展且高效的任务卸载方案。
在动态的雾计算环境中,关于在哪里以及何时卸载任务的决策不仅需要考虑当前的网络状态,还需要预测未来状态以避免潜在的瓶颈和资源冲突(Boubaker, Houda, & Zarour (2025))。这需要一种高度适应性和智能的方法,能够实时学习和预测变化。现有方法在处理异构资源和跨簇协调方面存在上述限制。为了解决这些问题,我们提出了MAG-Q,这是一种基于图强化学习(GRL)的混合任务卸载框架,它利用图注意力网络(GATs)和多智能体演员-评论家(MAAC)学习来增强集群式雾环境中的决策制定。通过结合GATs,该框架能够有效地捕捉雾节点之间的复杂依赖关系,从而更好地建模网络动态和任务依赖性(Cao et al. (2024))。同时,多智能体演员-评论家机制促进了去中心化但协调的决策制定,确保卸载策略在整个雾集群中得到优化(Chen et al. (2025))。此外,为了克服传统RL模型在处理簇间通信开销方面的效率低下问题,我们引入了量子启发式任务转发(QITF)。该组件结合了量子退火原理来探索最佳任务转发路径,同时最小化拥塞并平衡计算负载(Paul, Singh, Li, Dobre, & Duong (2024))。通过联合优化任务迁移、资源利用和通信延迟,所提出的框架提高了适应性、可扩展性和整体系统效率。通过实时学习和预测性任务分配,该模型主动缓解了网络瓶颈,确保在动态雾计算环境中无缝执行任务。
所提出的MAG-Q框架通过引入自适应、可扩展和去中心化的学习机制,解决了与传统任务卸载方法相关的关键挑战。与传统基于图的深度强化学习模型不同,后者将所有相邻节点视为同等重要,MAG-Q的GAT模块动态调整节点注意力权重,以强调高优先级节点和高效的通信链接。此外,虽然标准的多智能体RL方法存在收敛速度慢和动作空间探索效率低的问题,但MAAC中的演员-评论家结构确保了策略更新的稳定性和学习收敛的加速。另外,QIF模块的量子启发式优化允许并行探索多个任务转发路径,从而降低了与大规模任务卸载相关的计算复杂性和决策延迟。这种先进学习机制和量子启发式优化的协同整合显著提高了能源效率,改善了任务转发速率,并减少了延迟。
基于当前的卸载技术和基于学习的方法,本研究旨在为以下具体领域做出贡献:
- •
通过结合图注意力编码器和多智能体演员评论家控制器,开发一个考虑异构性的簇内任务卸载框架,以映射节点和链接特征,从而实现自适应决策。与GCN和MLP编码器相比,测量平均延迟和总能源的减少。
- •
将簇间转发表述为二次无约束二进制优化问题,并使用退火风格搜索方法求解,以减少传输延迟和计算开销。
- •
通过从二次无约束二进制优化问题进行归约,证明该问题的计算复杂性为NP难问题。在此基础上,推导出基于退火的求解器所需的精确系数结构,指定等效伊辛表示中的二次交互矩阵和线性偏置项,使搜索目标明确化。
- •
使用基于MAAC的强化学习优化去中心化任务卸载决策,其中分布式智能体在考虑网络约束、执行成本和延迟约束的情况下协作学习任务分配策略,确保在大规模雾计算架构中的可扩展性。
- •
通过实现更低的响应延迟、更高的任务成功率以及更快的训练收敛速度,证明MAG-Q优于现有的最佳基线,确保在动态雾计算环境中的高效实时工作负载优化。
本文的其余部分组织如下。第二节提供了全面的文献综述,重点介绍了基于先进机制的雾计算环境中的任务卸载研究的当前状态。第三节概述了系统模型,并详细介绍了从文献中确定的问题表述。第四节介绍了所提出的基于MAG-Q的任务卸载框架,描述了底层算法和系统架构。第五节讨论了用于评估所提出框架性能的实验设置和评估指标。最后,第六节总结了研究结果和未来研究的潜在方向。
以下部分对之前的研究进行了全面回顾,以证实所识别的研究空白,并指出了本研究的关键贡献。