《Business & Information Systems Engineering》:A Benchmark for Selecting Real-Time Scheduling Approaches for Fleets of Automated Guided Vehicles in Intralogistics
编辑推荐:
在厂内物流中,自动导引车(Automated Guided Vehicle, AGV)车队正成为提升运营绩效的关键技术。AGV车队的调度是一个复杂问题,涉及车辆与运输货物的时空协同。目前,传统调度方法与机器学习方法(如深度(强化)学习模型)均被用于解决该问题,
在厂内物流中,自动导引车(Automated Guided Vehicle, AGV)车队正成为提升运营绩效的关键技术。AGV车队的调度是一个复杂问题,涉及车辆与运输货物的时空协同。目前,传统调度方法与机器学习方法(如深度(强化)学习模型)均被用于解决该问题,但缺乏针对具体场景的选择指导以优化车队效率。因此,决策者在选择调度方法时可能采用次优方案,牺牲效率及竞争优势。研究人员基于“无免费午餐定理”(No Free Lunch Theorem)并采用设计科学(Design Science Research, DSR)方法,提出了用于排序AGV车队调度方法的标准测试基准的设计需求(Design Requirements, DRs)、设计原则(Design Principles, DPs)与设计特征(Design Features, DFs),分别为五项、三项与七项。为验证可行性,研究人员将设计知识实例化并在案例研究中应用该基准。该成果对实践与理论均具启示意义,所提出的规范性方法选择知识可推广至其他类似问题,尤其在人工智能模型日益普及的背景下。
该研究聚焦于厂内物流中AGV车队的实时调度方法选择问题,旨在解决因调度方法种类繁多而缺乏针对性选择依据导致的效率损失。研究人员指出,AGV调度包含任务分配与时间规划,属于NP难问题,传统启发式算法与新兴的深度强化学习(Deep Reinforcement Learning, DRL)等方法各有适用边界,但受“无免费午餐定理”约束,不存在通用最优方案。为此,研究人员采用设计科学方法,结合文献综述与行业专家访谈,构建了包含五项设计需求、三项设计原则和七项设计特征的基准测试体系。设计需求涵盖吞吐量、响应性、服务等级协议(Service-Level Agreement, SLA)遵守率、跨方法可比性及本地适应性;设计原则强调效率指标集成、总分聚合与参数可配置性;设计特征则细化为吞吐量、晚任务率、总延迟、实时能力、平均响应时间、加权总分计算等具体量化指标,并支持用户自定义权重。研究人员在Python环境中实现了该基准,并通过2×2因子设计的案例研究(含对称/非对称布局、小规模/大规模车队)对随机策略、最短行程启发式、轮询调度(Round-Robin, R-R)及两种DRL模型(近端策略优化Proximal Policy Optimization, PPO与柔性演员-评论家Soft Actor-Critic, SAC)进行评估。结果表明,对称场景下轮询调度综合表现最优,非对称场景下PPO模型更具优势,验证了基准在不同场景下的适配性与决策支持有效性。该研究发表于《Business & Information Systems Engineering》,其贡献在于填补了AGV调度方法选择决策支持的空白,并为相关领域的基准设计提供了可复用的规范性知识。
关键技术方法方面,研究人员采用设计科学研究的六阶段框架,首先通过结构化文献综述(检索数据库包括ACM Digital Library、IEEE Xplore、ScienceDirect与Scopus)明确研究缺口;其次,开展两轮专家访谈(共9位来自AGV开发与物流自动化领域的从业者)以提炼实际需求与评估标准;随后,基于决策支持系统(Decision Support System, DSS)通用设计需求,迭代推导基准的具体设计要素;最终,通过自然主义评估(专家评分)与人工评估(仿真案例测试)完成验证。案例研究采用已验证的高动态AGV仿真环境,涵盖不同规模与布局的场景,并引入五种代表性调度方法进行对比。
研究结果部分,在设计需求、设计原则与设计特征章节中,研究人员明确了基准需覆盖吞吐量(P = n / (Cmax/3600),单位:任务数/小时)、晚任务率(Tr,百分比)、总延迟(Tsum,单位:秒)、实时能力比(Er,计算时间与执行时间之比)、平均响应时间(?,单位:秒)等核心指标,并提出加权总分公式(SB= w1·P - w2·Tr- w3·Tsum- w4·Er- w5·?)以实现灵活配置。在自然主义评估中,专家一致认可吞吐量、响应性与SLA作为核心指标的合理性,并对总分聚合与权重配置功能给予积极评价(平均评分高于3分,6点李克特量表)。人工评估结果证实,基准能有效区分不同调度方法在各场景下的性能差异:小规模对称场景中,轮询调度在吞吐量与响应时间上略优于PPO(约0.1%),而在非对称场景中,PPO的总延迟较启发式降低约1.5%,综合得分领先4.5%。此外,加权总分显著改善了未加权分数中实时能力指标被吞吐量掩盖的问题,提升了决策透明度。
讨论部分指出,该研究呼应了“无免费午餐定理”在AGV调度领域的适用性,揭示了单一方法无法普适最优的规律。基准设计中存在两项权衡:一是增加指标复杂度可提升决策质量,但会提高认知负荷;二是扩大API兼容性可降低部署限制,但需标准化数据输入格式。理论层面,研究为复杂决策场景下的方法选择提供了规范性设计知识,可扩展至自主移动机器人(Autonomous Mobile Robot, AMR)等去中心化调度场景。实践层面,基准的模块化特性支持企业根据自身优先级(如能效、设备利用率)定制评估体系,增强了对AI模型的信任度,降低了算法厌恶风险。局限在于文献检索范围与专家样本量有限,未来可纳入更多优化算法(如元启发式)与传统低动态场景测试。结论重申,该研究通过设计科学方法构建了AGV调度方法选择的基准框架,其实例化验证为厂内物流的智能化升级提供了可操作的决策支持工具。