基于观测器的规定时间最优神经一致性控制:六旋翼无人机的新型执行者-评判者强化学习策略

《Neural Networks》:Observer-Based Prescribed-Time Optimal Neural Consensus Control for Six-Rotor UAVs: A Novel Actor-Critic Reinforcement Learning Strategy

【字体: 时间:2026年02月03日 来源:Neural Networks 6.3

编辑推荐:

  本文提出了一种结合规定时间控制与强化学习的创新方案,通过设计新型执行者-评判者神经网络更新律和分布式观测器,实现了六旋翼无人机在动态环境中的资源优化分配和精确轨迹跟踪。该方法采用规定时间调整函数(PTAF)确保系统在预设时间内收敛,并通过非线性变换满足多性能需求,为工业检测等应用场景提供了高效解决方案。

  
亮点
  1. 1.
    开发了融合PTAF的新型AC-RL神经网络更新算法,实现按需可调收敛时间的最优控制性能
  2. 2.
    构建改进的分布式规定时间观测器,使跟随者能在预设时间内精确估计领导者状态
  3. 3.
    将RL策略与实用规定时间控制方案扩展到六旋翼无人机,实现资源优化与性能约束
章节概览
图论基础
引入图F=(N,J,M)描述六旋翼无人机的通信拓扑,其中N为节点集,J?N×N表示边集。邻接矩阵M=[ai,j]∈RN×N定义节点间信息流向,拉普拉斯矩阵L=D-M表征网络连接关系。
优化控制设计
通过坐标变换定义跟踪误差zi,ι?2=xi,ι?2i,ι?和滤波误差si,ι?2i,ι?i,ι?1。基于哈密顿-雅可比-贝尔曼方程(HJB)构建虚拟控制器αi,ι?1,采用自适应规定时间滤波器解决反步法复杂度爆炸问题。
仿真验证
在基础设施巡检场景中,六旋翼无人机凭借卓越飞行稳定性成为工业检测的理想平台。多机协同检测需在有限资源和指定时间内完成精确轨迹跟踪,仿真结果证实所提控制策略在实际工业场景中的有效性。
结论
本文提出的基于观测器的实用规定时间最优控制协议,通过新型评判者-执行者神经网络更新律实现实际应用中的高效资源分配。结合PTAF的改进规定时间观测器保证所有跟随者在规定时间内精确跟踪领导者,建立的非线性变换在统一框架下实现多样化性能需求。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号