今日动态 返回首页
会员注册 登录 生物通快讯免费订阅
  • 首页 今日动态 人才市场 新技术专栏 中国科学人 云展台
    BioHot
    • 定制我的BioHot
    • 进入我的BioHot
    • 进入我的集采
    • 肿瘤癌症研究
    • 免疫/基因/细胞疗法
    • 神经生物学
    • 健康与疾病
    • 衰老机制与长寿
    • 单细胞技术
    • 基因编辑-CRISPR
    • RNA研究
    • 肠道菌与人体微生态
    • 细胞代谢
    • AI生物信息学
    • COVID
    云讲堂直播 会展中心 特价专栏 技术快讯 免费试用

  • 生物通官微
    陪你抓住生命科技
    跳动的脉搏

生物通首页  >  今日动态  >  正文

基于选择性熵融合的近端策略优化与联邦强化学习相结合的方法,用于智能多无人机(multi-UAV)的轨迹规划和通信优化

《Scientific Reports》:Selective entropy-fused proximal policy optimisation with federated reinforcement learning for intelligent multi-UAV trajectory and communication optimisation

【字体: 大 中 小 】 时间:2026年06月06日 来源:Scientific Reports 3.9

编辑推荐:

  摘要5G和新兴的6G网络的快速发展增加了对能够提供高容量、低延迟和适应性的无线通信系统的需求。然而,传统的地面基础设施仍然成本高昂且不够灵活,尤其是在动态或偏远环境中。本文提出了一种基于联邦强化学习(FRL)的无人机(UAV)通信系统,该系统采用选择性熵融合近端策略优化(SEF-

  

摘要

5G和新兴的6G网络的快速发展增加了对能够提供高容量、低延迟和适应性的无线通信系统的需求。然而,传统的地面基础设施仍然成本高昂且不够灵活,尤其是在动态或偏远环境中。本文提出了一种基于联邦强化学习(FRL)的无人机(UAV)通信系统,该系统采用选择性熵融合近端策略优化(SEF-PPO)算法,以提升实时决策环境中基于本地策略的学习性能。与现有的数字孪生技术或离线训练的深度强化学习(DRL)方法相比,该方案无需使用回放缓冲区,从而减少了无人机平台对内存和计算资源的需求。无人机通过与其他无人机以及高空平台(HAP)的联邦聚合进行协作学习,同时保护数据隐私并保持对非独立同分布(non-IID)用户分布的鲁棒性。该框架将轨迹规划、用户关联、能效资源分配和切换管理整合到一个统一的自适应架构中。实验结果表明,与基线方法(包括DMTD、DRL-EC3以及贪婪算法和随机算法)相比,在吞吐量、公平性、延迟和能效方面均有显著提升。总体而言,所提出的设计实现了可扩展、节能且能响应环境变化的无人机协调机制,为下一代无线网络提供了一种无需基于仿真的预训练即可直接部署的解决方案。

相关新闻
生物通微信公众号
生物通新浪微博
微信
新浪微博
我要投稿
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:5G 低延迟|无人机通信|联邦强化学习|SEF-PPO|非 IID 用户|动态资源分配

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号