受蜜蜂学习飞行启发的机器人高效导航策略

《Nature》：Efficient robot navigation inspired by honeybee learning flights

【字体：大中小】 时间：2026年05月15日 来源：Nature 48.5

编辑推荐：

　　摘要导航是动物和机器人至关重要的能力。虽然微小的飞行昆虫能够长距离稳健导航，但目前最先进的机器人导航方法计算成本高昂，因此仅限于大型机器人。在此，研究人员提出“Bee-Nav”，一种受蜜蜂视觉学习飞行启发的、高度高效的导航策略。在等效的机器人学习飞行中，训练

摘要导航是动物和机器人至关重要的能力。虽然微小的飞行昆虫能够长距离稳健导航，但目前最先进的机器人导航方法计算成本高昂，因此仅限于大型机器人。在此，研究人员提出“Bee-Nav”，一种受蜜蜂视觉学习飞行启发的、高度高效的导航策略。在等效的机器人学习飞行中，训练一个微型神经网络，基于路径积分（path integration）将全向图像映射到归巢向量（home vector）。学习后，机器人可以飞离家园较远，通过路径积分直线返回，并利用视觉归巢网络（visual homing network）消除积分漂移。模拟显示，对于实际的路径积分精度，神经网络仅需在总飞行面积的大约0.25–10.00%上进行训练。在真实世界的室内和室外实验中，一架小型无人机在风力条件下，成功地在30–110米飞行中100%、在200–600米飞行中70%返回至家园0.5米范围内，分别使用了3.4千字节（kB）和42千字节（kB）的神经网络。所提出的导航策略对于在往返家园位置执行任务的资源受限机器人至关重要。此外，它为昆虫导航的神经行为学提供了新视角，从视觉学习如何塑造归巢轨迹到认知地图的性质。

一、研究背景与问题

导航是自主机器人的核心能力。然而，当前先进的机器人导航方法（如基于视觉的同时定位与地图构建^[2,3]）需要大量计算资源和高性能硬件（如高端笔记本电脑或带GPU的嵌入式计算机），导致其无法应用于资源受限的小型机器人（如轻量级飞行无人机）。尽管已有研究尝试通过牺牲地图精度（例如采用拓扑地图表示）或提升计算效率来改进，但导航范围仍受限于地图规模的增长带来的计算负担增加^[11,12]。相比之下，自然界中的昆虫（如蜜蜂）展示了惊人的高效长距离导航能力，它们依赖路径积分和视觉记忆（view memory）两种机制^[15]。然而，如何将这两种互补机制整合为一个统一的、高效的、适合长距离导航的策略，在机器人学领域仍存在关键空白。

二、研究概述与意义

本研究发表于《Nature》期刊，提出了一种名为“Bee-Nav”的仿生机器人导航策略，灵感来源于蜜蜂的视觉学习飞行。该策略的核心是通过一次短时间的“学习飞行”，利用路径积分产生的带有噪声的归巢向量作为自监督标签，训练一个极小的卷积神经网络（Convolutional Neural Network, CNN），从而建立视觉记忆。之后，机器人可在远离家园的位置执行任务，先依靠路径积分直线返回，最后在接近家园时切换至基于神经网络的视觉归巢，以校正路径积分累积的漂移。模拟和真实世界实验表明，该方法能实现高效、长距离的精准归巢，且计算和内存开销极低。这项工作不仅为资源受限的小型机器人实现自主长距离导航提供了可行方案，也为理解昆虫导航的神经机制提供了新的计算模型视角。

三、关键技术方法

为验证Bee-Nav策略，研究人员开展了一系列模拟与机器人实验。关键技术方法包括：1. 模拟环境构建：使用简化模拟器分析路径积分噪声与所需学习归巢区域（Learned Homing Area, LHA）大小的关系，并在NVIDIA Isaac视觉逼真模拟器中生成随机森林环境，测试视觉归巢性能并与快照匹配法（snapshot-based method）^[34]、完美记忆法（perfect memory method）^[51,52]进行对比。2. 机器人平台与感知系统：使用定制四旋翼无人机，搭载全向相机、基于光流和激光测距的里程计、Raspberry Pi 4机载计算机等。3. 视觉归巢模型：设计了两种轻量级神经网络——参数量为868的紧凑网络和参数量为10,820的注意力网络，将预处理后的全景图像直接映射到机体坐标系下的归巢向量。4. 学习与导航流程：设计了仿黄蜂的螺旋形学习飞行轨迹，并实现了离板离线、板上离线和板上在线三种神经网络训练配置。导航分为出航、基于里程计的返航和视觉归巢三个阶段。5. 风扰补偿：在户外实验中，通过模型或视觉检测地平线，动态校正因强风导致的相机倾斜引起的图像畸变。

四、研究结果

1. Honeybee-inspired learning flights for navigation

研究受蜜蜂离巢前的学习飞行启发，提出了Bee-Nav策略。机器人先执行学习飞行，利用路径积分获得有噪声的归巢向量作为自监督标签，训练一个小型神经网络，从而在围绕家园的一个圆形区域（LHA）内建立视觉记忆。之后，机器人可飞至远处，先依靠路径积分直线返回，若终点落入LHA内，则启动视觉归巢以消除漂移。

2. Simulation experiments

模拟实验量化了策略的效率和有效性。

•
对于机器人实际的路径积分噪声水平，LHA面积仅需占总飞行面积的3.84%，即可捕获99%的返航终点。若使用更精确的里程计或带罗盘的路径积分，该比例可降至0.24%–7.6%。
•
在视觉逼真的模拟森林环境中，使用42.3 kB的注意力神经网络，在LHA半径内的视觉归巢成功率为100%，在部分环境中甚至可泛化至2.5倍LHA半径。
•
与基于单张家园快照的归巢方法和存储所有学习图像的完美记忆法相比，Bee-Nav的归巢成功率和效率显著更高，归因于神经网络能够关注相关的标志物。

3. Robot experiments

在多种真实环境中进行了机器人实验验证。

•
在10×10米室内飞行场，48次视觉归巢飞行全部成功返回家园0.5米内，方向误差主要低于40°，距离误差低于1.5米。三种学习配置（离板离线、板上离线、板上在线）均表现成功。
•
在更大的室内场馆（30×40米）和户外开阔场地（400×500米）实施了完整的导航策略（出航-里程计返航-视觉归巢）。在30–110米飞行中，归巢成功率达100%；在200–600米飞行中，无风条件下成功率为80%，强风条件下降至50%。户外实验挑战包括强风导致的相机倾斜、光照变化和缺乏近处地标，研究人员通过添加人工地标和使用更大的注意力网络（42.3 kB）来应对。实验证明，学习一个半径10米的区域，足以支持最远600米的往返飞行。

五、讨论与结论

讨论：

本研究对机器人学和生物学均具有启示。对机器人学而言，Bee-Nav使得资源受限的小型机器人实现长距离导航成为可能。其神经网络内存占用（3.4–42.3 kB）比高精度地图低约三个数量级，且计算高效，可运行于树莓派甚至微控制器，极大降低了硬件质量、功耗和经济成本。尽管目前策略仅限于单一家园位置，但已适用于需往返家园进行充电或数据传输的应用场景（如温室监测、仓库盘点）。未来研究方向包括：结合家园识别与精准降落、归巢失败时的结构化搜索、整合磁力计或太阳检测以改进户外路径积分、让网络输出不确定性估计、以及探索更具生物合理性的神经网络结构（如基于昆虫蘑菇体的模型）。

对生物学而言，该策略为飞行昆虫导航提供了新视角。机器人实验表明，基于不完美路径积分的自监督学习会导致视觉归巢轨迹的曲折，这与重新分析的蜜蜂学习飞行数据特征相符^[4]，但需通过操控昆虫路径积分机制的实验来验证因果关系。此外，机器人实验证明了学习完整归巢向量（含方向与距离）的实用性，这与蜜蜂能感知并传递距离信息的行为和神经观测相符^[18,46-48]。

当前的策略使用机体坐标系的归巢向量进行直接行动，且仅学习家园周边区域，尚未涉及通常定义的认知地图^[49]。未来可扩展至学习多个地点并能在未访问路径间进行捷径计算，但这用纯神经机制实现将更具挑战性。

研究结论：

总而言之，研究人员提出并验证了一种受蜜蜂学习飞行启发的高效机器人导航策略“Bee-Nav”。该策略通过结合路径积分和由极小神经网络实现的视觉记忆，使小型无人机能够在资源严格受限的条件下，于复杂真实环境中进行长距离、精准的归巢。这项工作为下一代自主微型机器人的导航开辟了道路，并为进一步探究昆虫导航的算法与神经基础提供了计算框架。

热点排行