传染性废物的管理在现代城市基础设施系统中构成了一个关键而艰巨的挑战,它处于公共卫生要求、环境保护和经济约束之间的微妙交点。后疫情时代进一步突显了这一问题的复杂性和规模,需要强大的物流框架来应对不可预见的激增(Cao等人,2025年)。高效管理系统的核心在于仓库的战略布局,这是一个涉及急性风险考虑的先进设施选址问题(Shang等人,2022年;Feng等人,2024年)。与惰性城市固体废物不同,来自医疗和生物技术活动的传染性废物具有显著的传染风险(Tang等人,2025年)。传统的模型,如p-中位数(Mladenovic等人,2007年)和最大覆盖选址问题(Church和Velle,1974年),侧重于成本最小化和需求覆盖。然而,这些传统方法的一个显著局限性在于它们对风险的处理方式。在这些设施中处理不当可能会引发疾病传播和社会恐慌。危险品运输文献已经发展出复杂的风险评估方法(Erkut和Verter,1998年),包括概率事故释放模型和后果分析。这些模型在量化风险的精细空间分布方面表现出色,但通常与战略设施选址决策脱节。因此,优化模型必须是多目标的,必须协调不可调和的冲突:在减少资本和运营支出的同时,降低公众暴露风险,并最大化医院和诊所等分散来源的服务覆盖范围(Shang等人,2025年)。从数学上讲,这转化为一个多目标优化模型,其特征是非线性的、非凸的目标函数和高维的决策空间,使得识别完整的帕累托前沿在计算上具有挑战性(Liu等人,2025年)。
多目标组合优化问题本质上具有挑战性,通常被归类为NP难问题(Darouni等人,2026年;Deb等人,2002年),并已成为广泛研究的焦点,产生了重要的理论见解(Kemmar等人,2025年;Shang等人,2023年)。早期的解决策略经常依赖于标量化技术,将多个目标聚合为一个单一函数。然而,这种方法假设复杂的权衡可以通过简化的模型有效捕捉,这与同时优化冲突目标的基本原则相矛盾(Peng等人,2022年;Sankoju和Shastri,2026年)。
依赖于通用交叉和变异的标准多目标问题往往会出现过早收敛和多样性维护不足的问题(Harris等人,2014年)。虽然像两阶段算法这样的精确方法对于双目标线性问题有效(Dou等人,2024年),但它们在复杂非线性模型中的适用性较差。因此,元启发式算法变得流行起来(Wang等人,2026年;Lotfi等人,2024年)。特别是基于种群的进化算法非常有效,因为它们可以在一次运行中近似整个帕累托前沿(Sun和Cai,2025年)。NSGA-II和MOEA/D等框架表现出稳健的性能(Zade等人,2025年;Zhong等人,2024年),但它们经常在处理复杂帕累托前沿时遇到过早收敛和多样性维护不足的问题。常见的改进措施包括混合搜索机制(Ghafour,2024年)、使用强化学习来改善探索(Díaz-Quezada等人,2025年)以及整合参数适应以平衡探索和利用(Wu等人,2024年)。尽管有这些进展,但在设计能够自主且协调地以问题感知方式应用这些先进策略的算法方面仍存在显著差距。
这种方法论上的差距在设施选址等应用领域尤为重要,因为模型必须捕捉现实世界的复杂性。对设施选址文献的回顾显示,研究主要集中在以成本为中心的模型(Tarhan等人,2024年)、单目标优化(Bin Islam等人,2025年)以及元启发式算法的应用(Wang等人,2020年)上。然而,很少有研究充分解决危险设施(如传染性废物仓库)在高风险期间的选址控制问题。虽然一些理论工作考虑了安全方面(Cao等人,2024年;Quan等人,2025年),但往往缺乏针对紧急情况的可行决策支持框架。因此,在传染风险下的选址安全性成为一个关键但未充分探索的研究领域。
正是在这种背景下,传染性废物仓库的多目标选址问题(MOL-IW2)成为一个关键而复杂的挑战,它整合了非线性风险传播和拥堵效应。这种复杂性带来了三个相互交织的挑战,当前的多目标进化算法难以克服。
(1) 目标函数通常是非线性和非凸的,导致难以全面近似的复杂帕累托前沿。传统方法,如加权求和法或经典的NSGA-II,在这种情况下往往表现不佳,难以保持多样化的解决方案集,并且容易过早收敛。由于探索和利用之间的固有不平衡,强烈的选择压力会迅速侵蚀种群多样性。
(2) 感染风险的本质无法通过简单的欧几里得距离模型来捕捉。风险通过网络传播,受到人口密度、流动性和环境路径的影响,形成了充满非线性和复杂依赖性的适应度景观,简单的搜索运算符难以有效遍历。
(3) 决策空间的高维性,加上多目标评估的计算成本,造成了显著的效率瓶颈。这通常迫使研究人员在解决方案质量和计算可行性之间进行权衡,导致大量解决方案空间未被探索。
为应对这些挑战,本文提出了一种名为元适应反射决策框架(MRDF)的新方法。我们的贡献旨在解决上述难题。
首先,为了解决高维性和参数敏感性问题,该算法基于一个元适应框架构建,该框架在搜索过程中自动调节其探索和利用参数,减少了对繁琐手动调整的依赖,并提高了不同问题实例的鲁棒性。
其次,为了模拟风险传播中固有的复杂空间和社会交互,MRDF采用了一个自适应的社会交互模型。该模型动态调整候选解决方案之间的影响,模拟了一个比简单吸引到全局最佳位置更细致的集体决策过程。
第三,为了应对在复杂帕累托前沿上的过早收敛问题,我们引入了一个分层反射循环机制。该机制通过结合反向学习和动态降序排序运算符,协同地探索搜索空间的对立区域,从而定期将搜索重点重新聚焦于最有希望的方向,从而增强多样性和深度。
通过一个关于传染性废物仓库的全面案例研究,验证了该框架的实际效用和优越性。除了其算法贡献外,这项研究还提供了可操作的管理智慧,通过阐明帕累托最优解中嵌入的关键权衡和决策路径,为政策制定者和城市规划者提供了一个稳健的决策支持系统。