PG-DGPRL：一种基于物理原理且具备不确定性感知能力的前馈力-导纳控制方法，适用于软体操作机器人

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Computers & Industrial Engineering》：PG-DGPRL: A physics-guided and uncertainty-aware feedforward force-admittance control method for soft-bodied operational robots

【字体：大中小】 时间：2026年01月30日 来源：Computers & Industrial Engineering 6.5

编辑推荐：

　　软体操作机器人面临力控制延迟与不确定性的挑战，本文提出物理嵌入与不确定性量化结合的前馈力-导纳控制方法PG-DGPRL。通过在线预估力跟踪误差调整控制参数以降低延迟，并利用深度高斯过程强化学习量化不确定性，同时将柔性材料本构方程嵌入控制器，增强物理一致性与泛化能力。实验表明该方法在动态环境中表现出更好的轨迹跟踪和力控制性能。

郭玉荣|张杰|王俊良

中国上海201620，东华大学信息与智能科学学院人工智能研究所，教育部纺织工业人工智能工程研究中心

摘要

为了解决涉及软体操作机器人的力控制任务中的控制延迟和不确定性问题，本文提出了一种基于物理原理且具有不确定性意识的前馈力-导纳控制方法，称为PG-DGPRL。首先，引入了一种具有在线力跟踪误差估计的前馈导纳控制策略。通过预测交互力的未来偏差，可以提前调整控制器参数，从而减轻控制延迟的不利影响。其次，开发了一种基于物理信息的深度高斯过程强化学习（DGPRL）方法。策略表示为高斯分布，柔性材料的本构力学模型作为物理约束嵌入其中，以实现不确定性意识和物理一致性验证。此外，设计了一个复合损失函数，以实现在演员网络生成策略、DGP进行不确定性估计以及物理信息神经网络（PINN）进行物理正则化之间的联合优化。最后，在不同的环境阻尼和交互力条件下进行了实验，将PG-DGPRL与包括CAC、Ada-CAC和A2C在内的基线方法进行了比较。结果表明，在当前的实验条件下，PG-DGPRL在轨迹跟踪和力控制性能方面表现更优，表现出较强的稳定性和泛化能力。

引言

随着机器人技术的快速发展，柔性物体操纵机器人在工业、医疗和服务领域得到了越来越多的应用（Zhu等人，2022年；Yin等人，2021年）。在这些任务中，机器人必须与柔性材料（如纱线、电缆和软组织）进行动态和物理交互，这对控制精度和响应性提出了前所未有的挑战（Andronas等人，2021年）。与刚体任务相比，柔性物体操纵的主要难点在于目标材料的复杂机械行为（Zhu等人，2019年；Kadi和Terzi?，2023年）。特别是在高速拉拔和缠绕过程中，柔性物体的机械响应具有高度不确定性，经常导致控制延迟问题。例如，图1展示了纱线柔性体的操纵任务。

导纳控制有效地协调了力和位置之间的耦合，被认为是柔性物体操纵的一种有前景的方法（Tang等人，2023年）。然而，在实际应用中，由于外部干扰和环境不确定性，导纳控制器的性能往往会下降（Samuel等人，2023年）。因此，最近的研究转向了变参数导纳控制。与传统固定参数控制方法不同，变参数导纳控制可以根据任务需求和环境变化在线调整虚拟阻尼和虚拟惯性参数，从而使机器人的动态响应更加灵活（Sharkawy和Koustoumpardis，2022年；Bae等人，2020年）

目前，柔性物体操纵机器人的力跟踪控制面临几个关键挑战，主要体现在以下三个方面：

1) 柔性物体中外力与内部应力的异步响应加剧了控制延迟。虽然控制延迟是机器人系统中的常见问题，但柔性物体的固有材料惯性和弹性传播延迟会导致执行器运动与力反馈感知之间的时间不对齐，进一步放大延迟。在涉及柔性材料的高精度任务中，这种延迟容易导致张力超调或欠调，从而造成材料损坏——尤其是在高速拉拔或大变形阶段。

2) 外部干扰导致柔性物体中的力感测数据不可靠，从而导致控制不稳定。与刚体不同，柔性材料在操作过程中对环境干扰非常敏感。例如，在纱线的情况下，传感器的张力反馈容易受到气流和机械振动的影响，引入测量误差。这些不可控因素在数据驱动的建模和预测中引入了随机不确定性，使得难以使期望的交互力与实际交互力对齐（Mullins等人，2016年；Jung等人，2022年）。因此，量化和减轻这种不确定性对于提高控制稳定性至关重要（Cao等人，2019年；Zhang等人，2023年；Lu等人，2025年；Wen等人，2023年）。

3) 为柔性物体建立力控制模型需要基于物理信息的指导。柔性物体的机械响应严重依赖于其瞬时状态（例如位置、速度、外力分布），而这些关系通常是非线性的。传统的数据驱动方法主要依赖于训练数据的分布，缺乏对柔性物体底层力学的深入理解。因此，它们难以在多种操作条件（如高速拉拔或突然的张力变化）下进行泛化。因此，将机械知识嵌入模型中，建立基于物理信息的混合建模范式至关重要，从而提高控制策略的物理一致性（Huang等人，2024年）。

为了解决上述挑战，本文以纱线操纵为例，提出了一种用于软体操作机器人的前馈力-导纳控制方法，称为PG-DGPRL，该方法将物理指导与不确定性量化相结合。与现有的强化学习框架不同，PG-DGPRL直接将柔性材料的本构力学关系映射到导纳控制参数的物理一致性约束中，从而将策略搜索限制在物理上可实现的参数空间内。同时，通过在策略生成网络中嵌入DGP来实现控制策略的分布式建模，建立了不确定性意识与前馈导纳控制之间的闭环耦合，从而主动补偿控制延迟并有效抑制随机干扰。主要贡献如下：

1)

通过预测未来的力跟踪误差来减少控制延迟。为了解决由于柔性物体中外力与内部应力的异步响应导致的控制延迟问题，开发了一种前馈导纳控制策略。该策略利用历史数据提前预测未来的力跟踪误差，从而主动校正控制策略并减轻延迟的负面影响。

2)

控制策略表示为高斯分布，并对其不确定性进行量化，以实现策略的动态调整。为了解决由于外部干扰导致柔性物体中力感测数据不可靠的问题，提出了一种DGPRL框架。DGP嵌入在演员网络的策略输出层，以进行分布预测和不确定性量化。当环境干扰导致预测置信区间变宽时，主动减小策略步长以提高稳定性。

3)

将柔性材料的本构力学模型嵌入强化学习框架中，以对输出策略施加物理一致性约束。为了克服传统数据驱动方法在未见操作条件下的有限泛化能力，将纱线的本构方程集成到策略网络中。这导致了一种由物理知识指导的混合建模方法。在演员网络的策略生成过程中，每个输出都经过物理一致性验证，以确保符合基本物理定律，从而提高模型的泛化和可解释性。

本文的其余部分安排如下：第2节回顾相关工作。第3节介绍了具有在线交互力估计的前馈导纳控制器，以及用于自适应参数调整的基于物理指导的深度高斯过程强化学习框架。第4节展示了所提出方法的有效性。第5节总结了主要贡献。

章节摘录

基于物理指导和不确定性量化的软体操作机器人的前馈力-导纳控制方法

以纱线操纵为例，本文提出了一种用于软体操作机器人的前馈力-导纳控制方法，该方法结合了物理指导和不确定性量化。该方法旨在解决涉及柔性材料的力控制任务中常见的控制延迟和各种不确定性问题。

实验验证

为了验证所提出方法的可行性和有效性，使用Python开发了一个用于机器人力跟踪导纳控制的仿真环境。在多种场景下进行了一系列比较实验，以评估所提出方法在动态变化的环境阻尼和时变力跟踪任务下的性能。所有实验都在配备了AMD Ryzen 7 7840H处理器（Radeon 780M显卡）的Windows 11系统上运行

结论

本文解决了在复杂和动态环境中实现软体操作机器人高精度力控制的挑战。提出了一种新颖的前馈力-导纳控制方法，该方法结合了物理指导和不确定性量化。该方法系统地解决了由于控制延迟、随机不确定性和认知因素引起的响应退化、策略不稳定和泛化能力有限等关键问题

CRediT作者贡献声明

郭玉荣：撰写 – 审稿与编辑。张杰：撰写 – 审稿与编辑。王俊良：研究、数据整理。

利益冲突声明

作者声明他们没有已知的竞争财务利益或个人关系可能影响本文报告的工作。

致谢

本研究得到了国家自然科学基金（项目编号：52275478和52375485）和上海市教育委员会的AI增强研究计划（项目编号：SMEC-AI-DHUY-05）的支持，以及中央高校基本科研业务费（项目编号：2232025G-14和LZB2023001）和DHU杰出青年教授计划的支持。

联系信箱：

粤ICP备09063491号

摘要

引言

章节摘录

相关工作

基于物理指导和不确定性量化的软体操作机器人的前馈力-导纳控制方法

实验验证

结论

CRediT作者贡献声明

利益冲突声明

致谢

热点排行