一种自适应的、基于物理知识的Transformer模型,结合高斯过程残差补偿技术,用于人机协作中的逆动力学建模

《ROBOTICS AND COMPUTER-INTEGRATED MANUFACTURING》:Adaptive Physics-informed Transformer with Gaussian process residual compensation for inverse dynamics modeling in Human–Robot Collaboration

【字体: 时间:2026年03月16日 来源:ROBOTICS AND COMPUTER-INTEGRATED MANUFACTURING 11.4

编辑推荐:

  针对人机协作中逆动力学建模的不足,提出自适应物理信息Transformer框架,集成分层训练与高斯过程残差补偿,实验验证在UR5e/UR10e平台上平均扭矩误差降低31.7%,有效提升动态建模精度与安全性。

  
钱睿|张曦|李东鹏|夏立桥|郑派
中国香港特别行政区香港理工大学工业与系统工程系

摘要

精确的逆动力学建模对于安全高效的人机协作(HRC)至关重要,在这种协作中,机器人与人类在近距离内共同工作,必须同时保证精度和安全性。传统的基于模型的方法依赖于线性化模型,往往无法捕捉非线性和摩擦力,导致HRC的逆动力学建模不准确。最近基于学习的方法改进了逆动力学建模,但由于序列建模能力有限以及物理约束整合不足,仍难以捕捉机器人运动中的时间依赖性。为了解决这些问题,本文采用了一种自适应的物理信息Transformer,利用多头自注意力机制来捕捉时间动态。此外,引入了带有能量守恒正则化的分层训练策略,以确保物理一致性。最后,加入了高斯过程残差补偿模块来考虑非线性效应和未建模的动态。在两个HRC平台上进行的实验验证表明,所提出的方法显著优于先进的基线方法,平均关节扭矩误差降低了31.7%。结果证实了该方法在实现适用于HRC应用的可靠和精确逆动力学建模方面的有效性。

引言

人机协作(HRC)已成为现代制造和服务领域的核心范式,在这种协作中,机器人与人类共享工作空间,执行组装、物料处理和协作操作等任务[1]。与独立运行的传统工业机器人不同,协作机器人需要精确的动态模型来保证安全交互、精确的轨迹跟踪和可靠的力估计[2]。这些模型的核心是逆动力学,它建立了关节扭矩与机器人运动状态(位置、速度和加速度)之间的关系[3]。强大的逆动力学建模不仅减少了跟踪误差,提高了能源效率,而且在确保复杂动态环境中的安全和响应行为方面也起着关键作用[4]。
在实际应用中推导精确的逆动力学模型具有挑战性,因为模型精度常常受到参数不确定性、未建模的动态和变化环境的影响[5]。虽然基于刚体动力学和拉格朗日力学等公式的经典方法提供了原理性的流程,但当系统参数难以确定时,这些方法会变得不可靠,并且无法捕捉摩擦力、柔顺性或执行器动态等重要效应。在HRC中,这种挑战尤为突出,因为机器人为了安全而设计得轻量且柔顺,必须在非结构化和动态环境中可靠运行[7]。在这种情况下,不准确的逆动力学建模会直接威胁到安全性、适应性和与人类的协作。
由于明确建模复杂物理现象通常不可行,因此采用了数据驱动的方法来进行机器人动力学和扭矩估计。通过利用神经网络[8]或高斯过程(GP)回归[9][10]等机器学习技术,数据驱动方法可以捕捉传统分析模型无法表示的非线性行为和未建模的效应。尽管数据驱动模型提供了灵活性并可以直接从观测数据中近似动态,但它们在逆动力学建模方面的局限性在于缺乏明确的物理约束。如果不结合物理原理,这些模型可能会产生违反基本动力学的预测,从而降低HRC场景中的可靠性和泛化能力。这突显了需要结合数据驱动方法和物理信息结构的混合方法来提高一致性和鲁棒性的必要性[11]。
为了克服传统数据驱动方法在泛化和可解释性方面的不足,最近的研究开始探索集成物理知识的混合建模方法。在各种数据驱动技术中,神经网络因其强大的非线性拟合能力而显示出独特优势。为了进一步深化物理知识与学习框架的整合,应用了物理信息神经网络(PINNs)[12]。这种方法将牛顿[13]或拉格朗日动力学[14]等物理定律直接嵌入到结构的训练过程中,显著提高了模型的泛化能力、数据效率和物理一致性。本质上,基于PINNs的方法成功结合了基于物理的模型的可解释性和神经网络的灵活性,以捕捉复杂效应[15]。
尽管前景广阔,但目前基于PINNs的机器人学方法在现实世界的协作场景中仍面临几个关键限制。首先,物理定律通常仅在个别时间步骤中作为点约束施加,难以利用机器人臂动态运动的时间连续性[16]。其次,在训练过程中同时施加多个物理约束往往会导致相互干扰,从而影响稳定性和预测准确性。第三,许多模型在表示对HRC的安全性和适应性至关重要的难以捉摸的效应方面仍然不足。这些限制表明需要一个更先进的框架,能够更好地利用时间依赖性并更有效地整合物理约束,以确保鲁棒和安全的动态建模。
为了克服这些限制,提出了一种针对HRC的鲁棒物理信息逆动力学方法。该方法结合了PINNsFormer架构进行时间动态的序列感知建模,分层学习策略来平衡动态和能量约束而不影响训练稳定性,以及高斯过程残差补偿模块来考虑未建模的物理效应,如复杂的摩擦力或执行器非线性。本工作的主要贡献包括:
(1) 模型架构:应用了序列建模框架PINNsFormer,通过利用多头自注意力对关节状态和扭矩序列进行处理,明确捕捉动态系统中的时间依赖性。这种设计使模型能够考虑动态随时间的变化,从而提高扭矩估计的准确性和稳定性。
(2) 平衡的学习策略:设计了一种分层训练策略,最初优先考虑动态损失,随后结合了通过神经切线核(NTK)缩放的能量守恒(EC)损失。这种策略直接解决了训练过程中平衡多个物理约束的挑战,确保了物理一致的学习而不会破坏优化过程。
(3) 物理残差建模:引入了基于高斯过程的残差补偿模块来捕捉未建模的动态、执行器非线性和随机噪声。通过明确建模这些残差现象,系统在现实世界的HRC场景中实现了更高的鲁棒性和可靠性。
本文的其余部分结构如下:第2节回顾了机器人逆动力学建模的相关工作,特别关注基于模型和数据驱动的方法。第3节介绍了所提出的框架,详细介绍了PINNsFormer架构、分层学习策略和高斯过程残差补偿。第4节展示了实验评估,包括与基线方法的比较以及在两个协作机器人数据集上的消融研究,随后是泛化实验。最后,第5节总结了本文。

部分摘录

基于模型的机器人动力学建模方法

动态模型是机器人运动规划和优化的基础。精确的建模有助于实现高精度轨迹跟踪、阻抗控制和自适应控制。解决动态模型主要涉及正向动力学问题和逆动力学问题。为了实现精确控制,通常采用逆动力学解决方案,例如根据期望的运动状态计算所需的关节扭矩。

方法论

由于时间连续性有限、物理约束冲突和未建模的非线性效应,HRC中的可靠扭矩预测仍然具有挑战性。为了解决这个问题,开发了一种混合PINNsFormer–GP框架,结合了时间建模、分层训练和残差补偿。所提出的混合建模方法将时间动态学习、分层训练策略和GP残差补偿整合到一个统一的框架中。

案例研究

在本节中,展示了两个具有不同运动模式的真实世界HRC数据集的比较和消融结果,反映了典型的HRC场景。这允许在多种配置和协作行为下全面评估所提出的方法。

结论

在这项工作中,提出了一种自适应的物理信息Transformer,结合了物理信息Transformer框架、NTK引导的分层能量约束学习策略和基于高斯过程的残差补偿,用于机器人动力学建模。通过在自收集的UR5e数据集和公共UR10e平台上进行比较和消融研究,验证了其有效性,这些平台涵盖了无负载和有负载条件。

CRediT作者贡献声明

钱睿:撰写 – 审稿与编辑、撰写 – 原始草稿、可视化、验证、软件、方法论、调查、形式分析、数据整理、概念化。张曦:撰写 – 原始草稿、软件、调查、形式分析、概念化。李东鹏:撰写 – 原始草稿、方法论、概念化。夏立桥:撰写 – 审稿与编辑、监督、软件、方法论、概念化。郑派:撰写 – 审稿与编辑、资源整理,

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

致谢

本工作主要得到了国家自然科学基金(编号52422514)、一般研究基金(GRF)(项目编号PolyU 15210222和PolyU15206723)以及研究资助委员会(RGC)的合作研究基金(CRF)(项目编号C6044-23GF)、香港深圳基础研究计划-通用项目(JCYJ20230807140407016)和粤港科技合作资助计划(GHX/075/22GD)的资助支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号