人机协作(HRC)已成为现代制造和服务领域的核心范式,在这种协作中,机器人与人类共享工作空间,执行组装、物料处理和协作操作等任务[1]。与独立运行的传统工业机器人不同,协作机器人需要精确的动态模型来保证安全交互、精确的轨迹跟踪和可靠的力估计[2]。这些模型的核心是逆动力学,它建立了关节扭矩与机器人运动状态(位置、速度和加速度)之间的关系[3]。强大的逆动力学建模不仅减少了跟踪误差,提高了能源效率,而且在确保复杂动态环境中的安全和响应行为方面也起着关键作用[4]。
在实际应用中推导精确的逆动力学模型具有挑战性,因为模型精度常常受到参数不确定性、未建模的动态和变化环境的影响[5]。虽然基于刚体动力学和拉格朗日力学等公式的经典方法提供了原理性的流程,但当系统参数难以确定时,这些方法会变得不可靠,并且无法捕捉摩擦力、柔顺性或执行器动态等重要效应。在HRC中,这种挑战尤为突出,因为机器人为了安全而设计得轻量且柔顺,必须在非结构化和动态环境中可靠运行[7]。在这种情况下,不准确的逆动力学建模会直接威胁到安全性、适应性和与人类的协作。
由于明确建模复杂物理现象通常不可行,因此采用了数据驱动的方法来进行机器人动力学和扭矩估计。通过利用神经网络[8]或高斯过程(GP)回归[9][10]等机器学习技术,数据驱动方法可以捕捉传统分析模型无法表示的非线性行为和未建模的效应。尽管数据驱动模型提供了灵活性并可以直接从观测数据中近似动态,但它们在逆动力学建模方面的局限性在于缺乏明确的物理约束。如果不结合物理原理,这些模型可能会产生违反基本动力学的预测,从而降低HRC场景中的可靠性和泛化能力。这突显了需要结合数据驱动方法和物理信息结构的混合方法来提高一致性和鲁棒性的必要性[11]。
为了克服传统数据驱动方法在泛化和可解释性方面的不足,最近的研究开始探索集成物理知识的混合建模方法。在各种数据驱动技术中,神经网络因其强大的非线性拟合能力而显示出独特优势。为了进一步深化物理知识与学习框架的整合,应用了物理信息神经网络(PINNs)[12]。这种方法将牛顿[13]或拉格朗日动力学[14]等物理定律直接嵌入到结构的训练过程中,显著提高了模型的泛化能力、数据效率和物理一致性。本质上,基于PINNs的方法成功结合了基于物理的模型的可解释性和神经网络的灵活性,以捕捉复杂效应[15]。
尽管前景广阔,但目前基于PINNs的机器人学方法在现实世界的协作场景中仍面临几个关键限制。首先,物理定律通常仅在个别时间步骤中作为点约束施加,难以利用机器人臂动态运动的时间连续性[16]。其次,在训练过程中同时施加多个物理约束往往会导致相互干扰,从而影响稳定性和预测准确性。第三,许多模型在表示对HRC的安全性和适应性至关重要的难以捉摸的效应方面仍然不足。这些限制表明需要一个更先进的框架,能够更好地利用时间依赖性并更有效地整合物理约束,以确保鲁棒和安全的动态建模。
为了克服这些限制,提出了一种针对HRC的鲁棒物理信息逆动力学方法。该方法结合了PINNsFormer架构进行时间动态的序列感知建模,分层学习策略来平衡动态和能量约束而不影响训练稳定性,以及高斯过程残差补偿模块来考虑未建模的物理效应,如复杂的摩擦力或执行器非线性。本工作的主要贡献包括:
(1) 模型架构:应用了序列建模框架PINNsFormer,通过利用多头自注意力对关节状态和扭矩序列进行处理,明确捕捉动态系统中的时间依赖性。这种设计使模型能够考虑动态随时间的变化,从而提高扭矩估计的准确性和稳定性。
(2) 平衡的学习策略:设计了一种分层训练策略,最初优先考虑动态损失,随后结合了通过神经切线核(NTK)缩放的能量守恒(EC)损失。这种策略直接解决了训练过程中平衡多个物理约束的挑战,确保了物理一致的学习而不会破坏优化过程。
(3) 物理残差建模:引入了基于高斯过程的残差补偿模块来捕捉未建模的动态、执行器非线性和随机噪声。通过明确建模这些残差现象,系统在现实世界的HRC场景中实现了更高的鲁棒性和可靠性。
本文的其余部分结构如下:第2节回顾了机器人逆动力学建模的相关工作,特别关注基于模型和数据驱动的方法。第3节介绍了所提出的框架,详细介绍了PINNsFormer架构、分层学习策略和高斯过程残差补偿。第4节展示了实验评估,包括与基线方法的比较以及在两个协作机器人数据集上的消融研究,随后是泛化实验。最后,第5节总结了本文。