
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一款40纳米制程的209-TOPS/W强化学习处理器,具备全面的推测执行能力以及推理与训练的并行处理功能
《IEEE Journal of Solid-State Circuits》:A 40-nm 209-TOPS/W Reinforcement Learning Processor With Full Speculation Exploitation and Inference-Training Parallel Processing
【字体: 大 中 小 】 时间:2026年02月27日 来源:IEEE Journal of Solid-State Circuits 5.6
编辑推荐:
强化学习处理器通过并行误差传播(DFA降低23%复杂度)、全推测优化(再降87%)、时空数据编码(缩减65%位宽)及块式转置(SRAM访问降39%和35%)实现能效提升,40nm CMOS下达2341 GOPS/mm2和209 TOPS/W,较SOTA提升7.3倍/7.1倍。
强化学习(RL)在众多领域都展现出了出色的效果。由于其能够探索未知环境并处理序列决策,RL在解决各种任务时表现出色。与传统依赖大型预标注数据集的机器学习(ML)方法不同,RL擅长在动态环境中通过试错来获取知识。这一能力使得RL能够广泛应用于各种问题领域。在游戏应用(包括视频游戏[1]、围棋[2]和星际争霸[3])中,RL已经达到了与人类玩家相当的性能水平。此外,RL在自主系统领域也取得了显著进展,包括自动导航[4]、自主控制[5]和工业自动化[6],如图1所示。RL的多功能性还扩展到了辅助机器学习任务,例如神经架构搜索。
RL在自主系统中的应用。