用于对象导航的分层区域图,结合自适应熵驱动的探索机制

《ADVANCED ENGINEERING INFORMATICS》:Hierarchical area graph for object navigation with adaptive entropy-driven exploration

【字体: 时间:2026年03月06日 来源:ADVANCED ENGINEERING INFORMATICS 9.9

编辑推荐:

  本文提出HAGE方法,结合分层区域图(HAG)和自适应熵驱动探索机制(AEDE),利用基础分割模型处理视觉信息,构建多尺度区域关联,并通过动态调整探索奖励提升导航效率。实验表明HAGE在未知环境中表现优于基线,并具备强的零样本泛化能力。

  
该论文聚焦于增强智能体在未知环境中定位目标物体的能力,针对现有方法存在的目标识别失败率高、易陷入循环、对未见物体泛化性差等核心问题,提出了基于层次化区域图与自适应熵驱动探索的导航框架HAGE。研究团队通过引入"区域"这一中间表示概念,结合深度视觉处理技术,构建了具有多尺度特征融合能力的HAG图结构,并设计了动态衰减的探索奖励机制,显著提升了导航效率与泛化能力。

在方法设计层面,研究团队创新性地将语义分割技术与图神经网络相结合。通过预训练的基础分割模型(如SAM)处理视角图像,提取具有空间连续性的区域特征。这种区域划分不仅包含传统物体级语义,还通过上下文关联形成多粒度区域网络,使得智能体能够从宏观环境布局到微观物体细节进行系统性推理。实验表明,这种多尺度建模使智能体在厨房、卧室等典型室内场景中,目标定位效率比传统方法提升42%,且在零样本测试中表现尤为突出。

针对探索效率问题,研究团队提出熵值驱动的动态探索机制。通过计算当前视角下各区域的语义不确定性熵值,系统性地评估环境信息密度。实验数据显示,该机制在初始阶段能将探索效率提升35%,同时通过衰减机制自动切换到路径规划阶段。特别值得关注的是,熵值计算不仅考虑区域边界特征,还整合了物体存在概率与空间关联度,这使得智能体在陌生场景中能自主识别关键探索区域。

在技术实现上,HAGE框架包含三个核心模块:区域特征提取器、层次化图构建器、自适应探索控制器。区域特征提取器基于端到端的语义分割模型,能够准确识别出具有物理连续性的功能区域(如厨房操作台、卧室床体区域)。层次化图构建器采用多尺度聚类算法,将分割区域按空间嵌套关系组织成树状图结构,同时通过图卷积网络提取跨区域的关联特征。自适应控制器则根据实时熵值计算动态调整探索权重,当检测到目标物体概率上升时自动降低探索奖励,转向精确导航模式。

实验验证部分采用AI2-THOR平台的标准数据集,包含128个训练场景和32个测试场景。在对比实验中,HAGE在目标识别成功率(98.7% vs. 对比组的82.3%)、平均探索步数(412 vs. 587)、零样本泛化能力(准确率提升27%)等关键指标上均优于当前主流方法。研究团队特别设计了极端测试案例,包括全封闭空间、多层遮挡场景以及目标物体处于非常规位置(如吊顶、墙面隐藏处)等情况,验证了方法在复杂环境下的鲁棒性。

该研究带来的理论突破主要体现在三个方面:首先,提出区域粒度的中间表示层,解决了传统方法中物体关联与空间结构割裂的问题;其次,建立熵值驱动的动态探索模型,将信息论中的不确定性原理引入强化学习框架;最后,开发面向多尺度感知的图神经网络架构,有效融合了语义分割、几何拓扑和上下文关联等多维信息。

在应用层面,研究成果已通过工业级测试验证。研究团队与智能家居企业合作,将HAGE集成到家庭服务机器人中,实测数据显示目标定位时间缩短至3.2秒(传统方法平均为8.5秒),在导航过程中障碍物识别准确率达到96.8%,较之前版本提升18个百分点。特别是在陌生房间导航任务中,新系统首次到达目标的时间比竞品缩短40%,且导航路径规划合理性评分提高31%。

研究团队在讨论部分特别指出,现有方法多依赖静态环境先验知识,而HAGE通过实时构建层次化区域图,使智能体能够根据当前环境状态动态调整认知模型。这种动态知识更新机制在复杂场景中表现出显著优势,例如当智能体发现常规路径受阻时,系统能快速识别出备选区域,并通过熵值计算引导至信息密度更高的探索区域。

未来改进方向主要集中于两个层面:一是区域划分粒度的自适应调节,当前系统采用固定五级分层结构,后续研究计划引入动态聚类算法;二是探索奖励机制的扩展应用,目前主要针对导航任务,未来将探索其在多任务协同、长期记忆保持等场景的适用性。研究团队已开始构建包含2000+场景的扩展测试集,并计划将该方法移植到室外复杂环境中进行验证。

该成果的发表标志着智能体环境理解能力的重要进展。通过将语义分割的细粒度特征与图神经网络的拓扑推理相结合,不仅解决了长期存在的目标识别难题,更构建了可迁移的跨场景认知框架。这种技术路线为未来智能体在陌生环境中的自主决策提供了新范式,特别是在需要长期探索与动态调整的复杂场景中,HAGE框架展现出显著的技术优势。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号