《Robotics and Autonomous Systems》:HIA-APF: A hierarchical based path planning method for lunar rovers on a partially observable surface
编辑推荐:
月球车路径规划中提出分层迭代A*结合人工势场(HIA-APF)方法,解决部分可观测环境下的动态障碍避让与高效全局规划问题,通过低层高分辨率感知与高层低分辨率地图结合,实现多场景路径优化与资源管理。
吕思瑶|徐瑞|李兆宇|王邦|朱胜英|高艾|潘波|赵志军
北京工业大学深空探测技术研究所,中国北京100081
摘要
自主月球车对于月球探测和建设至关重要。然而,月球上的探测精度受到限制,因为月球车的高分辨率视觉范围仅限于其周围环境,这使得长期规划变得具有挑战性。在整个路径规划过程中,高精度是必不可少的,但在任务开始之前只能使用低分辨率的数字高程模型(DEM)地图。像A-Star这样的全局规划器生成的路径可能会因全局视野细节不足而与障碍物发生碰撞,而传统的增量算法(如D-Star)则规划速度较慢。因此,我们提出了分层迭代A星-人工势场(HIA-APF)方法,这是一种针对在部分可观测表面上运行的月球车的创新路径规划方法,适用于平坦的月球基地区域和崎岖的采矿通道区域。首先,我们在月球基地区域的低分辨率地图上使用高级A星和APF设置中间坐标以进行高级规划。规划过程的迭代性质允许使用已探索的低分辨率地图进行有效导航,同时适应有限的高分辨率局部观测数据。然后,我们提出了一种低级规划方法,该方法结合了不同的人工势场来模拟小型和大型障碍物。在A星算法中使用人工势场作为启发式方法,增强了避障和目标选择能力。这种分层方法结合了A星算法的效率和D星算法的适应性,实现了能够响应动态月球环境的长期路径规划。我们的实验表明,即使在从真实DEM地图中选定的基地和通道区域,分层方法生成的路径也比A星、D星和在线RRT-Star方法更好,为月球探测任务提供了更优的路径质量和资源管理。
引言
国际月球研究站将于2030年后建立[1],届时将实施月球土壤采集、月球土壤分析以及通过3D打印进行建设活动[2]。月球车必须远离基地收集月球水冰,并且必须在地形信息有限的情况下穿越崎岖的地形。传统的路径规划方法主要基于地面控制,通过创建航点并检查所有人类指令[3],但这并不适用,因为人类决策耗时较长。与静态算法(如A星[5])相比,传统的增量规划方法(如D星[4])速度较慢。然而,在远离基地的过程中,由于电力和日光有限,时间非常紧张,尤其是在国际月球研究站将要建立的南极附近[6]。
到目前为止,工程师们已经设计了几种可用于月球车路径规划的系统。日本宇宙航空研究开发机构(JAXA)开发了一种路径规划算法[7],该算法有助于在日光有限的情况下做出决策,而不是仅仅避免障碍物。NASA的好奇号月球车[8]被设计为通过NASA火星科学实验室确定的中间航点和Field D-Star算法[9]生成路径,并在中间航点之间使用视觉里程计进行导航。然而,上述算法过于依赖人类设计和控制,无法直接用于无人月球车的路径规划。
最近的研究更多地集中在复杂区域中的自动路径规划上。提出了一种基于GPS的路径规划算法[10],用于在GPS可观测的不同地形中为月球车生成路径,但月球缺乏像地球上的GPS那样的定位系统。蚁群算法[11]被改编用于月球车的全局路径规划,其数据来自卫星,但它需要等待收敛,通常需要很长时间,然后才能生成整个路径,有时甚至长时间无法收敛。Bi-RRT算法[12]与人工势场(APF)结合使用,以规划安全路径,从而提高了探测器的搜索效率和安全性。人工势场[13]通过A星算法得到改进,以避免规划中的局部最小值。此外,还开发了几种启发式搜索算法的变体,以提高路径规划的效率和减少内存使用。迭代深化A星(IDA-Star)算法[14]结合了深度优先搜索的空间效率和A星的最优性,能够在内存有限的情况下有效处理大型搜索空间。递归最佳优先搜索(RBFS)[15]通过仅在搜索过程中维护最小必要信息来进一步提高内存效率。为了在内存限制和最优性之间取得平衡,引入了内存受限A星(MA-Star)和简化内存受限A星(SMA-Star)算法[16],这些算法在有限内存内保留最佳的部分解决方案,同时丢弃不太有希望的节点。这些算法特别适合像月球车这样的嵌入式或机载系统,这些系统的计算资源有限,但需要高质量的路径规划。
然而,上述研究主要集中在可观测环境中的路径规划,或者使用卫星拍摄的图片,而这些图片的分辨率对于移动期间的需求来说不够高。因此,学者们开始关注在视野受限的部分可观测区域中的路径规划。创建了一个月球车-直升机团队[17],用于安全探索火星,在该团队中,直升机在前面收集信息,为地面月球车提供更安全和更快的路径规划。逆强化学习[18]被用于行星探测车的路径规划,并在网格世界数据集和由当前部署的月球车任务规划工具及真实火星图像生成的高度真实的合成数据集中进行了测试。它在Jezero Crater数据集上的准确率为75%,在32 × 32网格世界上的准确率为89%。通过风险感知信息进行主动可通行性学习[19]应用于行星探测车,该方法结合高斯过程(GP)建模,通过现场测量进行风险感知的路径规划和GP更新。它在陨石坑类型和随机生成的环境中成功规划了路径,每个方向的最大滑动幅度分别为84.4%和83.3%。提出了一种软件框架[20],用于通过部分可观测马尔可夫决策过程(POMDP)进行部分可观测区域的路径规划,该框架有助于为月球车建模和解决问题。D-Star算法被用于月球车上,以避免移动过程中视野中出现的障碍物。基于采样的算法在线RRT-Star[21]也可用于在部分可观测和视野受限的情况下进行路径规划。
尽管上述研究试图解决视野受限环境中的路径规划问题,但这些方法不适用于月球表面的月球车。直升机在月球上无法工作,因为月球上没有空气。基于学习的方法可以通过POMDP处理部分可观测环境,但超参数需要调整,且不够稳定。D-Star和在线RRT-Star算法运行速度较慢,并且需要初始地图,这会影响多辆月球车协同工作时的性能。
因此,我们提出了HIA-APF方法,这是一种两级分层路径规划框架,具有迭代更新的视频功能,专为部分可观测的月球环境设计。低级规划器在连续的、局部受限的高分辨率感知下运行,而高级规划器利用轨道卫星提供的低分辨率全局信息。这种方法通过结合人工势场来扩展经典的A星算法,增强了避障和安全性。通过利用卫星级别的信息进行规划,所提出的方法提高了生成路径的质量和可靠性。本文的其余部分结构如下:第2节阐述了路径规划问题的定义、月球表面的构建(包括不同大小的障碍物,如月球基地和通往采矿区域的通道),以及生成月球表面网格的方法。第3节提出了我们在月球上连续规划的分层算法。人工势场是根据小型和大型障碍物构建的,有助于在视野受限的情况下避免障碍物并选择临时目标。此外,调整APF中的参数还可以影响路径长度和资源消耗的平衡。第4节将在生成的环境中进行综合实验,并比较A星、D星和在线RRT-Star方法。最后,第5节提供了结论。
章节片段
月球环境建模
在本节中,我们将描述月球环境用于路径规划的规格、环境中的视野限制以及路径规划问题。两级视觉也代表了卫星和月球表面月球车的视觉。
基于A星的APF方法,用于部分可观测环境
在本节中,我们提出了基于A星和APF的月球路径规划算法。人工势场针对小型和大型障碍物构建了不同的权重。此外,视野边缘的障碍物有助于确定中间目标。最后,我们提出了一种迭代分层规划算法,以结合低分辨率和高分辨率视觉。
实验
本节通过模拟月球基地和通道区域的路径规划来评估所提出的方法。首先,受到月球资源探索和利用的实际任务的启发,我们为月球车构建了一个结合了基地和通道的环境。其次,我们将我们的方法与全地图A星规划和D星规划在动态环境中进行了比较。第三,我们使用我们的部分分层规划方法在月球表面的大面积区域进行了测试。
结论与未来工作
提出了HIA-APF,这是一种用于视野受限环境的分层路径规划方法。创建了用于月球基地和通道的环境,以模拟建立月球基地和资源收集的过程。然后将障碍物分为小型和大型障碍物,并为它们提出了不同的人工势场。视野边缘的障碍物有助于在视野受限的情况下做出中间目标决策。HIA-APF的创新之处在于它独特地结合了低分辨率和高分辨率映射。
CRediT作者贡献声明
吕思瑶:写作——审稿与编辑,写作——原始草稿,可视化,验证,软件,方法论,调查,形式分析,数据管理,概念化。徐瑞:项目管理,方法论,资金获取,形式分析。李兆宇:资源,方法论,形式分析。王邦:可视化,验证,调查。朱胜英:资源,方法论,资金获取。高艾:写作——审稿与编辑,写作——原始草稿。潘波:
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
致谢
本工作得到了国家自然科学基金(重大项目)[资助编号 U2037602]和中国科学技术协会青年精英科学家资助计划 [资助编号 2022QNRC001]的支持。
吕思瑶于2019年从北京工业大学航空航天工程学院获得学士学位。他是北京工业大学航空航天学院自主导航与控制深空探测重点实验室的博士候选人,他的研究重点是月球车在深度强化学习和启发式算法中的任务规划和路径规划。