在机器人蜂窝仓库系统中，存在通信不确定性的情况下，动态多智能体拣选与配送任务的研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW》：Dynamic multi-agent pickup and delivery under communication uncertainties in robotic cellular warehousing systems

【字体：大中小】 时间：2026年05月10日 来源：TRANSPORTATION RESEARCH PART E-LOGISTICS AND TRANSPORTATION REVIEW 8.8

编辑推荐：

　　作者：任城 | 李明 | 黄乔治·Q. 所属部门：香港理工大学工业与系统工程系，香港红磡摘要机器人蜂窝仓储系统（RCWS）代表了自动化物流的新范式，然而现有的多代理取货和配送（MAPD）模型通常假设订单是静态的且通信是理想的，但在实际中这种情况很少见。本文首次研究了在通信

作者：任城 | 李明 | 黄乔治·Q.

所属部门：香港理工大学工业与系统工程系，香港红磡

摘要

机器人蜂窝仓储系统（RCWS）代表了自动化物流的新范式，然而现有的多代理取货和配送（MAPD）模型通常假设订单是静态的且通信是理想的，但在实际中这种情况很少见。本文首次研究了在通信不確定的情况下RCWS中的动态MAPD问题，其中订单规格可能在执行过程中发生变化，协调决策依赖于延迟的信息。为了捕捉系统层面的通信效应，我们使用反映仓库布局和规模引起的空间异质性的无线地图来模拟位置依赖的随机传输延迟。基于此模型，我们开发了一种通信感知的令牌传递框架，该框架能够根据接收到的更新的时间和空间上下文调整重新规划决策，从而在信息交换不理想的情况下实现有效协调。在不同的订单动态、机器人车队规模和通信条件下进行的广泛模拟表明，为静态和无延迟环境设计的协调策略在不确定环境中可能会显著下降。结果进一步揭示了响应性和资源利用之间的基本权衡，并表明通过合作协调利用空闲资源可以显著提高系统性能。这些发现突显了通信在动态仓库操作中的关键作用，并为设计RCWS中的协调政策和系统配置提供了实际指导。

引言

机器人蜂窝仓储系统（RCWS）是一种最近提出的仓储系统，它克服了现有G2P系统的局限性（Ma等人，2023年）。RCWS由多个称为RubikCells的模块化单元组成，如图1所示，每个单元根据指定的存储策略存储特定的SKU。每个RubikCell通过让机器人在分配器下方移动来运作，分配器从上方的存储柜中释放产品。每个订单通常包括多个SKU（Boysen等人，2019年）。当机器人收到取货订单时，它会按顺序收集所需的SKU，在完成订单后返回工作站。与G2P系统不同，RCWS中的机器人只运输订单所需的特定SKU，从而提高了取货效率。在工作站，无论是人工操作员还是机器人操作员都会将取出的物品从机器人的托盘转移到订单箱中，然后准备好进行包装和发货。在RCWS中，每个机器人每次行程只为一个订单取货，消除了在工作站对订单的排序工作，并实现了“边取货边排序”的策略（Ma等人，2025年）。RCWS中的这种订单履行过程可以被视为多代理取货和配送（MAPD）过程（Stern等人，2019年）。

关于多代理取货和配送（MAPD）问题的现有研究广泛调查了仓库机器人的任务分配和路径规划策略（Salzman和Stern，2020年）。这些模型大多隐含地假设了理想的运行条件，即订单信息事先已知并且在执行过程中保持不变。此外，协调决策通常假设能够及时可靠地传递给机器人，以便控制命令始终可以按预期执行。虽然这样的假设简化了问题建模和算法设计，但在实际的机器人仓储系统中这种情况很少见。

一方面，RCWS的应用场景非常多样化，例如制造车间、自动化超市和电子商务配送中心（Benavides-Robles等人，2024年；da Costa Barros和Nascimento，2021年），在这些环境中，任务要求可能在执行过程中发生变化。例如，生产线上的工人可能会要求额外的工具或材料，或者在零售环境中客户可能会修改订单（Zou等人，2017年）。在这里，“动态”一词特指内部订单的演变，即在执行过程中向已发布的订单中添加新的SKU，而不是系统外部完全新的任务的到来。与以前的MAPD模型中常见的静态假设不同，动态演变的订单要求机器人迅速重新规划路线，同时保持可行性并避免碰撞。然而，执行这种重新规划的路线依赖于及时且一致地向相关机器人传递更新指令。这对系统层面的信息交换提出了严格要求，尤其是在需要在线修订协调决策以应对任务演变时（Boysen等人，2019年）。

另一方面，在实际的机器人仓储系统中，机器人、存储模块和打包站之间的协调在很大程度上依赖于无线通信来进行状态报告和命令传播（Chen等人，2021b）。与有线工业环境不同，仓库环境通常涉及在较大区域内操作的移动机器人，无线链接容易受到干扰、拥塞和环境动态的影响（Liu等人，2021年）。系统以R2G模式运行，机器人不断与存储单元和打包站交互。在这种密集的仓库环境中，无线通信条件（例如信道衰落、遮挡或干扰）可能会导致订单更新信息的延迟。这些通信延迟会影响令牌获取和重新规划决策的时机。因此，这类系统中的信息交换不可避免地会出现延迟更新的形式，这挑战了大多数MAPD模型中采用的理想和即时通信的隐含假设。

虽然通信不确定性在某种程度上影响大多数机器人仓储系统，但其运营后果在不同的履行范式中并不统一。在传统的RMFS中，订单级别的动态主要在工作站被吸收，机器人的运动仅与个别订单松散耦合。相比之下，在RCWS的R2G模式下，机器人直接负责执行完整的多个SKU订单。因此，动态订单更新和通信不确定性共同影响机器人层的任务分配和路由决策，显著放大了它们对系统性能的影响。这些特性使得RCWS特别容易受到动态运行条件下信息及时性的影响，并强调了在分析动态取货和配送行为时明确考虑通信不确定性的必要性。受RCWS中对响应性和可扩展控制需求的启发，本研究提出了以下研究问题：

1.

动态订单演变如何与通信不确定性相互作用，从而影响RCWS中的取货和配送性能？

2.

在什么条件下，每个RubikCell应该采用不同的在线重新规划策略？

3.

当存在通信延迟和数据包丢失时，旅行效率、响应性和鲁棒性之间会出现哪些系统层面的权衡？

本文的其余部分组织如下：第2节回顾相关工作。第3节定义了在通信不确定性下的动态MAPD问题。第4节介绍了通信感知的事件触发令牌传递机制。第5节讨论了仿真设置并分析了实验结果。最后，第6节总结了本文并概述了未来的研究方向。

章节摘要

多代理取货和配送

MAPD问题将多代理路径查找扩展到机器人以在线方式连续执行取货和配送任务的场景。目标是最优化任务分配并计算无碰撞路径，从而最大化吞吐量（Di Pietro，2025年）。Ma等人首次正式提出了MAPD以及令牌传递（TP）和带任务交换的令牌传递（TPTS）算法，为MAPD中的在线任务分配和路径规划建立了基准（Ma等人）

系统描述和问题表述

如图2所示，在每个RubikCell内，边缘控制器通过无线网络（例如LoRa、Wi-Fi、5G或蓝牙）与各种代理进行双向通信，交换的信息分为以下三类：

•

外部订单信息：从基于云的仓库管理系统接收订单信息，包括订单标识符、SKU列表、交付约束和优先级级别。边缘控制器的订单管理器在这些细节上进行本地解析和管理。

•

通信感知的事件触发令牌传递

本节为RCWS中通信不确定性下的动态MAPD开发了通信感知的协调机制。我们没有提出全新的路径规划算法类别，而是在广泛采用的经典TP框架基础上进行构建，该框架作为MAPD中的常见在线策略。

我们首先在第4.1节简要回顾了经典的令牌传递机制。然后，在第4.2节中，我们介绍了最初为处理动态订单而设计的三种事件触发TP变体

数值实验和结果

本节通过广泛的仿真实验评估了所提出的事件触发协调机制和通信感知策略。目的不是评估算法的最优性，而是研究不同协调机制在动态订单演变和信息延迟交换下的行为，并确定在什么条件下每种机制更适用。

我们在MATLAB中开发了一个仿真框架，该框架忠实地模拟了多个SKU的动态

贡献

本项目的主要贡献总结如下：

•

问题表述。我们首次在通信不确定性下提出了动态MAPD问题，其中订单更新在执行过程中到达，信息受到随机传输延迟的影响。这扩展了通常假设任务集是静态的和通信是理想的现有MAPD模型，并明确捕捉了RCWS中通信和协调之间的耦合。

•

通信感知建模。

CRediT作者贡献声明

任城：概念化、验证、撰写——原始大纲。李明：资金获取、监督。黄乔治·Q：概念化、资金获取、监督。

利益冲突声明

作者声明他们没有已知的利益冲突或个人关系可能影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言