编辑推荐:
基于实时位置测量的三维连续体软机器人输出空间建模方法研究,提出自适应小波神经网络与无限冲激响应滤波器联动的WaveNet-IIR架构,无需预训练即可实现非线性动态系统的实时建模与控制。
L.-E Ramos-Velasco | O.-F Garcia-Castro | C.-E Vazquez-Garcia | R. Garcia-Rodriguez | V. Parra-Vega | E. Olguín-Díaz
墨西哥伊达尔戈州科学、技术和创新委员会(CITNOVA),圣奥古斯丁-特拉希亚卡,伊达尔戈州
摘要
神经网络在建模机器人系统时,通常假设可以完全获取稳定变量(如位置和速度)的信息,这适用于典型的二阶系统。然而,当无法测量到完整状态的信息时,问题就变成了神经网络模型的输出预测。对于刚性机器人来说,这种情况尤为突出,因为它们的速度传感器通常没有被安装。对于连续介质软体机器人来说,问题更加严重,不仅因为缺乏变形坐标的速度信息,还因为它们的动态特性高度非线性——这些机器人由超弹性弹性体制成,并且包含来自微小粒子运动的复杂内生摩擦力。因此,针对仅能测量位置信息的3D连续介质软体机器人,我们提出了一种自适应小波神经网络模型,该模型采用无限脉冲响应滤波器参数,以在采样域中得到输出空间的规范形式。神经权重、小波参数和无限脉冲响应滤波器参数的学习机制不需要训练或预训练阶段,这对于实时应用于物理系统是一个关键优势。使用来自连续介质软体机器人的实时位置数据进行的实验表明,延迟会显著影响神经模型的准确性。这些发现突显了输出神经网络在建模复杂动态系统、基于模型的设计、特性分析或神经控制应用方面的潜力。
引言
现代数据建模方法(如数据驱动和机器学习)的核心优势源于神经网络(NN)架构及其基本的逼近定理[1]。得益于近期在可负担硬件和开源软件方面的进展,先进的NN工具现在更容易为研究社区所使用。然而,尽管神经网络已成功应用于非线性动态系统的建模[2],但在假设能够完全获取状态信息的情况下,基于输出的NNm(oNNm)的研究仍然很少。最近的工作改进了这些方法,以适应现实世界中的严格条件。为了提高在不确定性下的收敛性,提出了状态输入仿射微分NN[3]。尽管针对复杂非线性动态的神经建模(NNm)已经取得了进展,但假设能够完全获取状态信息的情况仍然很少见;不幸的是,在实践中,部分输出测量通常是常态。这种情况尤其适用于连续介质软体机器人(cSR)[4],因为它们只能测量位置信息,而关于cSR的oNNm在文献中尚未得到充分研究。
在不同类型的软体机器人中,使用超弹性弹性体制成的cSR具有最高的柔顺性,但同时也具有最复杂的动态特性。本文介绍了一种由嵌入式气动系统驱动的变密度连续软体机器人,这种机器人目前尚未在文献中得到研究。幸运的是,cSR可以被建模为拉格朗日或准拉格朗日机器人,但它们表现出独特的复杂动态特性。具体来说,cSR的变密度特性会导致质心略微移动和模型频率的变化,而这些在刚性机器人中是不存在的。为了增加这种类型cSR的oNNm建模的难度,其内生粘弹性力表现出随参数变化的非线性特性,这使得建模变得困难且计算成本高昂[5]。因此,有效的cSR oNNm需要开发一种定制且易于解释的NN架构。对于实际应用(尤其是需要保证稳定性的应用)来说,建立可解释性至关重要,因为如果需要大量的预训练才能确保收敛,物理系统可能会失败。因此,需要一种在线的非参数(oNNm)方案,该方案能够利用实时数据而无需训练,仅依赖于数据到达时的即时值[6]。
基于小波的NN架构与IIR滤波器(WaveNet-IIR)
本文提出了一种基于小波的NN架构,其中小波作为神经元,输出采用无限脉冲响应(IIR)滤波器,用于MIMO非线性系统的oNNm。实验使用实时数据对一个三自由度的cSR进行了验证。IIR为隐藏层和输出层提供了反馈和前馈记忆循环,从而能够在输出空间中重构非线性规范形式。这证明了单层NN架构足以确保梯度下降算法能够最小化逼近误差。实验结果表明,这种最小化过程不需要大量的训练数据(基于时代的训练数据),而只需要即时数据,从而大大降低了计算负担。
初步工作和问题陈述
在开发拉格朗日cSR的分析性且可操作的模型方面,由于技术限制(例如:a) 缺乏用于长度、方位角和曲率的传感器(这些参数在cSR的典型运动中变化幅度很大);b) 传感器的分辨率和精度较低,气动驱动往往导致输入输出数据质量较差;c) 缺乏明确的指导原则等),已经遇到了许多困难。
基于小波的NN架构与IIR滤波器(WaveNet-IIR)
设一个以小波作为激活函数的神经网络,其输出通过基于IIR滤波器的反馈-前馈连接实现[21]。小波家族是通过在“母”小波上进行参数的移位和缩放来构建的。
机器人设计与制造过程
cSR的设计在图1的CAD模型中有所展示。其变形坐标分别见图1a(长度和曲率)和图1b(方位角)。图中还标出了其参考框架:基部(x?, y?, z?)和远端点(x?, y?, z?)。cSR的驱动装置基于一种最优设计的近似[22],由三个相等的多腔室部分组成,分别用ch?表示(x ∈ 1, 2, 3)。如图2a所示,每个腔室...
结果
WaveNet-IIR模型包含三个输入层和三个输出层,这三个层连接到三个滤波输出层。WaveNet-IIR配置了6个神经元,激活函数为RASP1,9个反馈系数和6个前馈系数。所有延迟情况下的学习率保持不变,而WaveNet和IIR滤波器参数则根据设计者的要求进行调整。神经权重的学习率为...
结论
自适应WaveNet-IIR架构已被证明可以仅使用实时位置测量数据来近似cSR的动态特性,这是一种称为基于输出的神经网络建模的方法。所提出的oNNm方法保证了这种高度非线性系统的输出逼近误差的收敛性,该系统具有变化的模态频率和非均匀的密度分布。这种方法无需训练或预训练阶段。因此,所提出的建模方法是一种有价值的技术。