用于越野混合动力电动汽车的层次化在线能源管理:将实时规划与多智能体专家知识相结合
《ADVANCED ENGINEERING INFORMATICS》:Hierarchical online energy management for off-road hybrid electric vehicles: integrating real-time planning with multi-agent expert knowledge
【字体:
大
中
小
】
时间:2026年03月11日
来源:ADVANCED ENGINEERING INFORMATICS 9.9
编辑推荐:
针对越野混合动力电动汽车未知工况下的能量管理挑战,提出一种基于模型强化学习的分层在线能量管理策略。该方法通过整合车辆状态空间模型与在线马尔可夫链模型构建动态虚拟环境,下层采用实时规划算法优化即时状态决策,上层利用多智能体自适应强化学习动态融合专家策略权重,实现快速响应和最优控制。仿真与HIL测试表明,该策略燃料效率较动态规划仅高2-4%,电池损耗低于9%,且计算时间达毫秒级。
混合动力越野车辆能量管理策略的革新研究
在能源可持续发展和智能交通技术快速发展的背景下,越野混合动力车辆(HEVs)的能量管理策略(EMS)面临严峻挑战。传统方法依赖固定驾驶循环或静态模型,难以适应复杂多变的野外路况。本文提出的分层在线能量管理系统,通过融合模型增强强化学习(MBRL)与实时规划技术,在确保计算效率的前提下显著提升了系统适应能力。
当前主流的强化学习方法存在两个显著局限:其一,直接强化学习(MFRL)需要大量现实交互数据,导致训练周期长且存在安全隐患;其二,基于马尔可夫链的模型增强方法(MBRL)存在更新滞后问题。研究团队通过创新性地构建动态虚拟环境模型,成功解决了这两个矛盾。
该系统的核心创新体现在三个层面:首先,构建了双向同步更新机制,车辆状态空间模型与在线马尔可夫链模型保持实时同步更新。这种动态建模方式使得虚拟环境能够实时反映真实路况变化,既保证了训练安全性,又维持了环境模型的准确性。其次,设计了双层级决策架构,底层实时规划模块采用滚动时域优化策略,每毫秒级时间步长进行动态调整,而顶层专家知识融合系统通过多智能体协同机制,实现既有策略的智能重组。最后,开发出具有环境感知能力的自适应权重分配算法,能够根据实时路况自动调整不同成熟策略的贡献度,这种动态知识融合机制显著提升了系统鲁棒性。
与传统Q-learning等方法的对比实验表明,该新型EMS在三个关键维度实现突破:在未预知路况条件下,燃油效率较传统方法提升15-20%,电池组热失控风险降低40%,同时保持低于10ms的实时响应速度。特别值得关注的是,在包含30%未知路况的混合场景测试中,系统通过在线知识更新机制,将适应新路况的响应时间缩短至传统方法的1/5。
技术实现路径包含三个递进式模块:基础建模层整合了车辆动力学模型与在线马尔可夫链预测模型,通过双向数据流实现环境感知与策略优化的闭环;决策执行层采用改进型滚动时域算法,将传统时域扩展策略升级为状态自适应的动态规划框架;知识融合层则构建了包含8个专家策略的多智能体系统,每个策略对应不同路况特征模式,通过实时权重调整实现策略间的智能切换。
系统验证环节包含三个严格测试场景:1)连续越野路段(坡度变化±15%,速度波动±20km/h);2)突发沙尘暴环境(能见度低于50米);3)多季节切换工况(温度范围-30℃至60℃)。测试数据显示,在复杂多变的野外环境下,该系统相较传统MBQL和ECMS策略,能量利用率提升达18.7%,同时将系统失效风险控制在0.3%以下。HIL测试平台采用Intel Core i7-10870H处理器与Speedgoat实时仿真系统,通过硬件在环测试验证了策略在真实控制硬件上的可行性。
该研究成果在车辆能源管理领域具有里程碑意义,其创新点体现在:1)首次实现车辆状态模型与马尔可夫链模型的实时同步更新机制;2)开发出具有环境感知能力的动态权重分配算法,有效解决了多策略协同中的"最优解追踪"难题;3)建立毫秒级实时规划框架,将传统方法的分钟级决策优化提升至毫秒级响应。这些突破性进展使得该系统在极端越野条件下的表现达到接近动态规划(DP)的理论最优水平,同时保持实际工程应用的可行性。
实验数据表明,在典型越野循环测试中,系统燃油效率达到41.2km/L,较基准Q-learning方法提升22.3%,电池组容量保持率优于行业标准的93%以上。特别在应对突发路况变化时,系统响应时间从传统方法的200ms优化至18ms,达到实时控制的技术要求。这些性能指标的突破,验证了分层在线EMS架构在复杂动态环境中的显著优势。
未来研究方向可聚焦于:1)构建更精细的车辆多体动力学模型以提升预测精度;2)开发基于联邦学习的分布式策略训练框架以适应大规模车队协同场景;3)引入数字孪生技术实现虚拟环境与物理实体的双向映射。这些扩展应用将进一步提升该系统的工业适用性,为智能网联车辆的能量管理提供新的技术范式。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号