《Agriculture》:Design of an Apple Harvesting Robot Based on Hybrid Pneumatic-Electric Drive System
Feiyu Liu and
Wei Ji
编辑推荐:
本文介绍了基于混合气电驱动系统的苹果采摘机器人设计,该系统结合了高精度的电动伺服与高功率的气动控制,实现了全天候作业。核心创新在于混合驱动架构与自适应视觉策略,在实验室和田间实验中,其采摘成功率达81%,平均用时7.81秒/个,果损率低于5%,为解决现有采摘机器人成本高、环境适应性差等关键问题提供了经济高效、鲁棒的自动化方案。
1. 引言
随着全球农业的快速发展,农产品采收的自动化因其复杂性面临诸多挑战。在中国,果蔬采摘自动化水平普遍较低,目前仍主要依赖人工,存在成本高、效率低和安全风险等问题。特别是在苹果采摘中,人工成本约占总生产成本的20-30%。随着人口老龄化与城镇化,劳动力成本上升,开发机械化、智能化的采收机器人成为迫切需求。
农业机器人研究始于20世纪80年代,但大多数已报道的采摘机器人适应性有限或仍停留在实验室阶段,缺乏大规模商业应用。近年来,苹果采摘机器人研究在中国取得显著进展,但仍需解决成本、适应性和操作鲁棒性之间的平衡问题。为此,本研究提出一种新型苹果采摘机器人,其核心创新在于:1) 混合气电驱动系统,将高精度定位(由电动伺服处理)与高力、快速采摘动作(由气动系统处理)解耦,实现性能与成本的平衡;2) 智能视觉系统,动态融合传统机器视觉与深度神经网络(DCNN),能根据实时环境复杂度自动切换算法,确保在稳定条件下具有高检测速度,在复杂光照或遮挡下具有稳健精度,从而实现可靠的全天候操作。
2. 材料与方法
2.1. 苹果采摘机器人的机械架构
该机器人系统设计用于实际应用,包含一个2自由度(2-DOF)电动移动平台、一个5自由度(5-DOF)机器人操作器、一个碗形末端执行器、集成传感器、视觉系统和一个集中控制系统。移动平台采用“Traveler 4”履带式平台,具备自主导航能力。操作器采用Prismatic-Revolute-Revolute-Revolute-Prismatic (PRRRP)架构,其运动链依次包含升降机构(P)、上臂关节(R)、前臂关节(R)、腰部关节(R)以及驱动末端执行器的气动执行器(P)。
末端执行器是影响采摘质量的关键,针对苹果等球形果实,本研究基于其生物力学特性开发了勺形末端执行器。它包含两个气动执行器,分别操作碗形夹持器和用于果梗分离的气动切割机构。夹持器内径约80毫米,可容纳直径60-90毫米的苹果,内表面有泡沫衬垫以防止果实损伤,并通过基于实时压力反馈的力控策略动态调节夹持力。
2.2. 传感器
为确保精确抓取和果梗切割,并实现机器人手臂旋转、移动平台定位和准确抓取果实,系统集成了多种传感器,包括压力传感器、限位开关和光电二极管。末端执行器集成了压力传感器、位置传感器和红外光电传感器。光电传感器提供目标存在/不存在的二元检测,并作为启动抓取序列的主要触发器;抓取开始后,压力传感器提供用于力控的连续模拟反馈。两者采用加权投票算法进行信号融合。
为在采摘操作中实现避障,在Festo DNCI标准气缸的上、左、右三侧安装了三个微动开关。当操作器气动执行器碰到任何一侧的树枝时,相应的微动开关被触发,数据采集(DAQ)卡采集此信号并发送给工控机(IPC),工控机随即发出指令引导操作器避开障碍物。
2.3. 视觉系统
为在多样化环境条件下实现稳健的苹果检测,本研究采用了基于YOLOv3的深度卷积神经网络(DCNN)。网络结构针对本应用进行了剪枝,将残差网络替换为VGG风格架构,并将输出张量尺度从三个减少到两个,在保持可比平均精度(mAP)的同时,推理时间减少了32%,模型大小从235 MB减少到158 MB。训练数据集包含8500张苹果图像,并进行了广泛的数据增强。模型训练了12000次迭代,验证集上的mAP稳定在约92%。
在照明稳定、环境变化不大的时期,传统机器视觉算法也能实现稳定的检测结果,且消耗的计算资源显著更少,检测速度更快。传统算法的工作流程为:将RGB图像转换到HSV色彩空间,提取色调(H)分量,应用红色范围阈值进行二值化以初步分割苹果区域;执行形态学开运算以消除细粒度噪声;识别所有连通分量;用最小边界矩形(MBR)标注每个连通分量,将面积最大的矩形设为主要目标。
为综合利用两种算法的优势,采用了混合集成方法。视觉系统根据实时环境条件动态切换算法:在复杂场景中部署更稳健的DNN,在均匀环境中使用更快的传统机器视觉算法。切换机制由定义的阈值τ=k√((x1-x2)2+(y1-y2)2)/(w1+h1)控制,其中(x, y)表示目标中心坐标,w和h表示MBR的宽度和高度,下标1表示DNN结果,下标2表示传统机器视觉结果。该切换机制在两种条件下触发:1)机器人运行10分钟后,或2)末端执行器连续两次采摘尝试失败后。
2.4. 控制系统
系统硬件包括主控计算机、交流伺服控制系统、串行通信接口转换器、机器视觉系统和数据采集板(DAQ)等。电动驱动部分对应机器人的三个自由度(DOF):腰部、上臂和前臂关节,各由一个伺服电机驱动。气动驱动部分对应第五个自由度和末端执行器。机器人以自主模式运行,其主工作流程是视觉系统检测摄像头视野内的苹果,然后选择最靠近图像中心的苹果作为目标,控制其像素坐标系统引导操作器进行采摘。
伺服电机(电动)与气动系统之间的同步控制通过基于时间协调的主从架构实现。工控机作为主控制器,以100 Hz间隔发出同步命令包。每个命令包包含三个伺服电机的目标位置和触发气动执行器的信号。为处理多关节协调运动期间潜在的耦合干扰,实施了前馈补偿算法。
苹果采摘机器人操作器采用PRRRP构型。结合电动和气动驱动的不同特性,采用了混合电-气驱动系统。中间三个旋转自由度(R-R-R)使用交流伺服控制,而最后的棱柱形关节(P)由Festo气动执行器驱动。每个伺服电机都配备有电磁制动器以增强操作安全性。
苹果采摘机器人的最后一个棱柱形自由度(P)由Festo气动伺服控制系统驱动,该系统调节杆的线性运动。CPX-CMAX-C1-1控制器、比例方向控制阀和气缸位移编码器互连形成闭环控制电路。该定位系统实现两个主要功能:1)位置控制:以可选速度移动到指定位置;2)力控制:在接近目标位置时施加预定义的力。
机器人操作器负责在整个运动序列中将末端执行器与目标苹果对齐。它从视觉系统接收到目标坐标后启动对齐模式。由于视觉传感器以手眼配置安装在末端执行器中心,视觉系统提供的坐标在本地坐标系中表示。手眼配置的显著优势是:操作器基于本地坐标运行,能够实现连续位置校正。与使用全局摄像头的精确坐标进行一次定位相比,这种方法大大降低了对机械精度的要求,并且对轻微的机械磨损或不准确性保持稳健,确保了可靠的目标抓取。操作器的控制模型如上图所示。视觉系统获取目标坐标(xt, yt)后,计算目标与图像中心之间的偏移(ex, ey)。然后使用该偏移计算所需的关节旋转角度以使目标与中心点对齐,变换关系表达为:
? ?θ1= ex/ d
? ?θ2= k1ey/ d
? ?θ3= k2ey/ d
其中d是比例因子,k1和k2是耦合系数。计算出?θ1、?θ2、?θ3后,工控机通过伺服驱动器控制对应关节旋转指定角度。视觉系统持续监测目标的图像位置,并重复此过程,直到目标与图像中心对齐,即(ex, ey)小于预设阈值。此时,目标被认为在末端执行器的有效抓取范围内。