综述:基于场景的多智能体合作在月球表面任务中的研究综述
《Acta Astronautica》:A scenario-driven review of multi-agent cooperation for lunar surface missions
【字体:
大
中
小
】
时间:2026年06月06日
来源:Acta Astronautica 3.4
编辑推荐:
贾翔 E| 鲍瑞| 范俊杰| 戴正林| 崔恩泽| 李楠| 王凯
中国科学院空间利用技术与工程中心,北京,100094,中国
**摘要**
从短期月球任务向持续的国际月球研究站的过渡需要多智能体协作系统。然而,在月球环境的限制下,地面集群范式在通信、系统重量和功耗(S
贾翔 E| 鲍瑞| 范俊杰| 戴正林| 崔恩泽| 李楠| 王凯
中国科学院空间利用技术与工程中心,北京,100094,中国
**摘要**
从短期月球任务向持续的国际月球研究站的过渡需要多智能体协作系统。然而,在月球环境的限制下,地面集群范式在通信、系统重量和功耗(SWaP)以及抗辐射计算方面面临着严重的现实差距。本系统综述采用了一种新的操作分类法,涵盖了三个任务阶段和一个六领域协作技术框架,通过证据成熟度量表(L0–L4)来评估各研究的验证准备情况。我们的证据加权综合分析显示出一个分化的成熟度格局:虽然基础探索和测绘架构在地面行星类比中已经达到了L3级别的验证,但实际的月球飞行部署(L4)仍然缺失,而关于建造、物流和维护的研究则严重不足。我们的分析还揭示,经过验证的系统一致采用了具有通信感知规划和人工干预监督的混合模块化架构,而完全去中心化的端到端学习范式仍局限于模拟阶段。此外,我们还发现了算法前提与月球物理现实之间的假设差距。为了缩小模拟与现实之间的差距,我们提出了从深空学习和在轨服务中可转移的方法,并提出了一条强调通信自主性、任务自组织和工程现实性的路线图。
**引言**
近年来,月球重新成为国际深空探索的主要基地。在NASA的阿尔忒弥斯计划、欧洲航天局的太空资源战略以及中国国家航天局的嫦娥任务和计划中的国际月球研究站(ILRS)等倡议的推动下,月球任务正从短暂的出访转向持续运营。这些雄心勃勃的项目包括复杂的、大规模的目标,如极地水冰探索、原位资源利用(ISRU)和自主建造研究栖息地。在这种背景下,加强国际合作和解决共同的技术瓶颈已成为所有方的共识。
然而,执行这些连续的、空间分布的任务暴露了传统单体机器人系统的根本局限性。极端的月球环境——其特征是昼夜温差超过254°C、磨蚀性真空尘埃、严重的辐射以及熔岩管或月球南极等区域的通信中断——极大地增加了单点任务失败的风险。过去依赖地面远程操作或孤立单智能体执行的范式缺乏下一代科学目标所需的空间覆盖范围、容错能力和动态适应性。关键的是,非协作系统的扩展仅导致成本线性增长,无法满足多目标月球基础设施项目的指数级需求。为了克服这些瓶颈,多智能体协作系统(MACS)已成为未来月球探索的关键路径。通过实现任务分解、并行执行和分布式自主性,多智能体架构提供了“超线性”的性能提升潜力。尽管这类系统在地面无人机编队中得到了广泛应用,但将其直接应用于月球表面却极具挑战性。月球严格的物理限制——特别是延迟容忍网络(DTN)条件、极端能源稀缺以及缺乏GNSS基础设施——使得大多数地面集群所依赖的集中协调和持续连接假设不再适用。
尽管这一转变迫在眉睫,现有的关于多智能体系统的综述主要集中在地球应用上。系统性地评估这些协作范式如何在极端月球环境下生存和运作的文献明显不足。这种差距使得研究人员难以评估现有算法的真实准备情况。此外,由于缺乏物理月球测试平台,现有文献大多依赖于模拟或部分验证的结果,掩盖了“现实差距”,限制了性能的可解释性。为了解决这一问题,我们提出了一种基于任务的系统综述方法,该方法采用了一种新的操作分类法,使得论文之间的比较更加一致(第4节)。具体来说,我们使用四个标签轴来组织文献:(i)任务领域(任务需求是什么),(ii)协作能力链(执行任务需要解决什么),(iii)系统形态(智能体如何组织和协调),以及(iv)证据成熟度(声明的验证程度)。该框架揭示了潜在的假设依赖性,区分了“有潜力但未充分验证”的模拟方法和“飞行就绪”的操作架构。
**分析结果**
首先,回顾的文献主要集中在协作探索和测绘方面,而建造、物流和维护领域的探索严重不足。其次,在涵盖任务分配、路径规划、协作感知、通信、异构协作及其交叉验证基础设施(模拟)的五层能力链中,我们观察到一种一致的架构分歧:在L2/L3成熟度级别经过验证的系统(例如CADRE、CoRob-X、NeBula)一致倾向于使用混合模块化架构,而不是完全去中心化的学习架构(第5.2节)。第三,我们发现了一个系统性的假设差距,即算法依赖于连续连接性、不受限制的机载计算和运动学,而这些条件在月球环境中是无法满足的。这些发现共同表明,工程现实性而非算法复杂性是月球多智能体部署的主要瓶颈。
本文的其余部分安排如下:我们首先建立月球任务背景并严格定义物理和操作限制(第2节)。第3节介绍了我们的综述协议。第4节提出了操作分类法,这是定量证据图(第5节)和多智能体能力核心技术综合(第6节)的基础。最后,我们总结了关键的假设差距、缺失的基准以及从深空和在轨应用中可转移的方法(第7节),并在第8节对全文进行了总结。
**章节摘录**
**月球任务背景与限制**
本节确立了月球探索的物理和操作边界。通过分析月球的高级科学和工程目标以及极端的环境限制,我们定义了任何机器人架构在月球任务中生存和运作必须解决的严格性能要求和系统脆弱性。
**研究问题**
本综述重点关注在月球表面和近月表面环境中运行的协作多智能体应用。我们主要关注在月球限制下的任务相关协作自主性。地面和深空协作系统不是主要的研究对象,它们仅作为背景或可转移技术的来源被提及,仅在其假设明确对应于月球任务需求时才会被包括在内。
**分类法和操作定义**
根据第3.3节定义的资格标准,我们现在将用于编码所包含研究的分类法具体化。
**月球多智能体系统的证据图**
为了系统地评估当前月球多智能体研究的现状,我们将第4节中定义的操作分类法应用于最终的70项主要研究。本节提供了一个定量映射,揭示了任务领域、能力链和验证成熟度交叉点上的主要研究集群和关键能力差距。请注意,统计中的参考文献总数可能高于此数字,因为一些参考文献可能被重复计算。
**多智能体系统和技术**
鉴于第2节中确定的系统脆弱性,本节分析了每个协作能力链如何应对特定的月球故障模式(见图3)。我们将独特的月球地质特性映射到以下能力链:
• **物理不确定性**:由于低重力和松散的风化层,随机性的车轮-地形相互作用[73]需要第6.2节讨论的风险感知路径规划策略和数据驱动的地形力学建模。
**路径规划差距分析与未来方向**
将技术分析(第6节)与证据图(第5节)相结合,揭示了系统性的假设差距是月球部署的主要障碍。当协作开销(连续连接性、实时状态共享、不受限制的计算)受到月球物理现实的影响时,往往抵消了多智能体范式的理论优势。
**结论**
随着国际月球探索从短期出访向持续基础设施建设的转变,多智能体系统(MAS)已成为生存和成功的基本前提。本系统综述通过将操作任务领域与六领域协作技术框架相结合,严格评估了提出的解决方案的证据成熟度,以应对月球环境的严苛要求。
**作者贡献声明**
贾翔 E:撰写——原始草稿、项目管理、方法论、调查、概念化。
鲍瑞:撰写——审阅与编辑、撰写——原始草稿、调查、数据管理。
范俊杰:撰写——审阅与编辑、撰写——原始草稿、调查、数据管理。
戴正林:监督、调查、概念化。
崔恩泽:可视化、验证、调查。
李楠:撰写——审阅与编辑、监督、项目管理。
王凯:在论文准备过程中声明生成式AI和AI辅助技术的使用。
**利益冲突声明**
作者声明没有已知的财务利益或个人关系可能影响本文报告的工作。
**致谢**
本工作部分得到了中国科学院空间利用技术与工程中心的支持,合同编号为T5030211PN和T4035011PY,以及“精细建模和灵巧操控技术用于在轨维护”项目的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号