基于混合气电驱动系统的苹果采摘机器人设计

《Agriculture》：Design of an Apple Harvesting Robot Based on Hybrid Pneumatic-Electric Drive System Feiyu Liu and Wei Ji

【字体：大中小】 时间：2026年03月10日 来源：Agriculture 3.6

编辑推荐：

　　本文介绍了基于混合气电驱动系统的苹果采摘机器人设计，该系统结合了高精度的电动伺服与高功率的气动控制，实现了全天候作业。核心创新在于混合驱动架构与自适应视觉策略，在实验室和田间实验中，其采摘成功率达81%，平均用时7.81秒/个，果损率低于5%，为解决现有采摘机器人成本高、环境适应性差等关键问题提供了经济高效、鲁棒的自动化方案。

1. 引言

随着全球农业的快速发展，农产品采收的自动化因其复杂性面临诸多挑战。在中国，果蔬采摘自动化水平普遍较低，目前仍主要依赖人工，存在成本高、效率低和安全风险等问题。特别是在苹果采摘中，人工成本约占总生产成本的20-30%。随着人口老龄化与城镇化，劳动力成本上升，开发机械化、智能化的采收机器人成为迫切需求。

农业机器人研究始于20世纪80年代，但大多数已报道的采摘机器人适应性有限或仍停留在实验室阶段，缺乏大规模商业应用。近年来，苹果采摘机器人研究在中国取得显著进展，但仍需解决成本、适应性和操作鲁棒性之间的平衡问题。为此，本研究提出一种新型苹果采摘机器人，其核心创新在于：1) 混合气电驱动系统，将高精度定位（由电动伺服处理）与高力、快速采摘动作（由气动系统处理）解耦，实现性能与成本的平衡；2) 智能视觉系统，动态融合传统机器视觉与深度神经网络(DCNN)，能根据实时环境复杂度自动切换算法，确保在稳定条件下具有高检测速度，在复杂光照或遮挡下具有稳健精度，从而实现可靠的全天候操作。

2. 材料与方法

2.1. 苹果采摘机器人的机械架构

该机器人系统设计用于实际应用，包含一个2自由度(2-DOF)电动移动平台、一个5自由度(5-DOF)机器人操作器、一个碗形末端执行器、集成传感器、视觉系统和一个集中控制系统。移动平台采用“Traveler 4”履带式平台，具备自主导航能力。操作器采用Prismatic-Revolute-Revolute-Revolute-Prismatic (PRRRP)架构，其运动链依次包含升降机构(P)、上臂关节(R)、前臂关节(R)、腰部关节(R)以及驱动末端执行器的气动执行器(P)。

末端执行器是影响采摘质量的关键，针对苹果等球形果实，本研究基于其生物力学特性开发了勺形末端执行器。它包含两个气动执行器，分别操作碗形夹持器和用于果梗分离的气动切割机构。夹持器内径约80毫米，可容纳直径60-90毫米的苹果，内表面有泡沫衬垫以防止果实损伤，并通过基于实时压力反馈的力控策略动态调节夹持力。

2.2. 传感器

为确保精确抓取和果梗切割，并实现机器人手臂旋转、移动平台定位和准确抓取果实，系统集成了多种传感器，包括压力传感器、限位开关和光电二极管。末端执行器集成了压力传感器、位置传感器和红外光电传感器。光电传感器提供目标存在/不存在的二元检测，并作为启动抓取序列的主要触发器；抓取开始后，压力传感器提供用于力控的连续模拟反馈。两者采用加权投票算法进行信号融合。

为在采摘操作中实现避障，在Festo DNCI标准气缸的上、左、右三侧安装了三个微动开关。当操作器气动执行器碰到任何一侧的树枝时，相应的微动开关被触发，数据采集(DAQ)卡采集此信号并发送给工控机(IPC)，工控机随即发出指令引导操作器避开障碍物。

2.3. 视觉系统

为在多样化环境条件下实现稳健的苹果检测，本研究采用了基于YOLOv3的深度卷积神经网络(DCNN)。网络结构针对本应用进行了剪枝，将残差网络替换为VGG风格架构，并将输出张量尺度从三个减少到两个，在保持可比平均精度(mAP)的同时，推理时间减少了32%，模型大小从235 MB减少到158 MB。训练数据集包含8500张苹果图像，并进行了广泛的数据增强。模型训练了12000次迭代，验证集上的mAP稳定在约92%。

在照明稳定、环境变化不大的时期，传统机器视觉算法也能实现稳定的检测结果，且消耗的计算资源显著更少，检测速度更快。传统算法的工作流程为：将RGB图像转换到HSV色彩空间，提取色调(H)分量，应用红色范围阈值进行二值化以初步分割苹果区域；执行形态学开运算以消除细粒度噪声；识别所有连通分量；用最小边界矩形(MBR)标注每个连通分量，将面积最大的矩形设为主要目标。

为综合利用两种算法的优势，采用了混合集成方法。视觉系统根据实时环境条件动态切换算法：在复杂场景中部署更稳健的DNN，在均匀环境中使用更快的传统机器视觉算法。切换机制由定义的阈值τ=k√((x₁-x₂)²+(y₁-y₂)²)/(w₁+h₁)控制，其中(x, y)表示目标中心坐标，w和h表示MBR的宽度和高度，下标1表示DNN结果，下标2表示传统机器视觉结果。该切换机制在两种条件下触发：1)机器人运行10分钟后，或2)末端执行器连续两次采摘尝试失败后。

2.4. 控制系统

系统硬件包括主控计算机、交流伺服控制系统、串行通信接口转换器、机器视觉系统和数据采集板(DAQ)等。电动驱动部分对应机器人的三个自由度(DOF)：腰部、上臂和前臂关节，各由一个伺服电机驱动。气动驱动部分对应第五个自由度和末端执行器。机器人以自主模式运行，其主工作流程是视觉系统检测摄像头视野内的苹果，然后选择最靠近图像中心的苹果作为目标，控制其像素坐标系统引导操作器进行采摘。

伺服电机（电动）与气动系统之间的同步控制通过基于时间协调的主从架构实现。工控机作为主控制器，以100 Hz间隔发出同步命令包。每个命令包包含三个伺服电机的目标位置和触发气动执行器的信号。为处理多关节协调运动期间潜在的耦合干扰，实施了前馈补偿算法。

苹果采摘机器人操作器采用PRRRP构型。结合电动和气动驱动的不同特性，采用了混合电-气驱动系统。中间三个旋转自由度(R-R-R)使用交流伺服控制，而最后的棱柱形关节(P)由Festo气动执行器驱动。每个伺服电机都配备有电磁制动器以增强操作安全性。

苹果采摘机器人的最后一个棱柱形自由度(P)由Festo气动伺服控制系统驱动，该系统调节杆的线性运动。CPX-CMAX-C1-1控制器、比例方向控制阀和气缸位移编码器互连形成闭环控制电路。该定位系统实现两个主要功能：1)位置控制：以可选速度移动到指定位置；2)力控制：在接近目标位置时施加预定义的力。

机器人操作器负责在整个运动序列中将末端执行器与目标苹果对齐。它从视觉系统接收到目标坐标后启动对齐模式。由于视觉传感器以手眼配置安装在末端执行器中心，视觉系统提供的坐标在本地坐标系中表示。手眼配置的显著优势是：操作器基于本地坐标运行，能够实现连续位置校正。与使用全局摄像头的精确坐标进行一次定位相比，这种方法大大降低了对机械精度的要求，并且对轻微的机械磨损或不准确性保持稳健，确保了可靠的目标抓取。操作器的控制模型如上图所示。视觉系统获取目标坐标(x_t, y_t)后，计算目标与图像中心之间的偏移(e_x, e_y)。然后使用该偏移计算所需的关节旋转角度以使目标与中心点对齐，变换关系表达为：

? ?θ₁= e_x/ d

? ?θ₂= k₁e_y/ d

? ?θ₃= k₂e_y/ d

其中d是比例因子，k₁和k₂是耦合系数。计算出?θ₁、?θ₂、?θ₃后，工控机通过伺服驱动器控制对应关节旋转指定角度。视觉系统持续监测目标的图像位置，并重复此过程，直到目标与图像中心对齐，即(e_x, e_y)小于预设阈值。此时，目标被认为在末端执行器的有效抓取范围内。

热点排行

新闻专题