fPIM:一种整体设计方法,旨在优化PIM数据流以提高执行效率

【字体: 时间:2026年03月10日 来源:IEEE Transactions on Parallel and Distributed Systems 6

编辑推荐:

  随着应用对带宽需求的增长,“内存墙”问题日益严重,基于处理器的指令卸载架构(PIM)成为研究热点。现有PIM架构分为区域卸载和选择性卸载两类,但存在内部流量过高的性能瓶颈。本文提出fast PIM(fPIM)架构,通过在每个通道控制器集成PIM缓存优化数据流,结合处理器负载均衡器和基于行为的卸载器协同工作,显著提升执行效率。实验表明fPIM较PEI、Fafnir和SpaceA分别降低处理时间88.6%、87.5%和79.6%,平均效率提升达68.7%。

  

摘要:

随着应用程序对带宽需求的增加,“内存墙”问题变得越来越严重。因此,基于内存的处理(PIM)架构因其能够执行由处理器卸载的指令而受到了广泛的研究关注。现有的PIM架构研究可以分为两类:区域卸载,即将程序员指定的代码区域内的所有指令全部卸载;以及选择性卸载,仅通过硬件支持卸载感兴趣的指令。然而,PIM架构带来了显著的内存内部流量开销问题,这不仅影响了PIM本身的性能,也降低了整个系统的性能。为了解决这一挑战,我们提出了一种名为fast PIM(fPIM)的PIM架构,该架构将PIM缓存集成到每个通道控制器中,以优化PIM内部的数据流。这种设计与处理单元负载均衡器和基于行为的卸载器协同工作,以实现高效的执行。为了评估fPIM的性能,我们进行了大量实验,结果表明,与三种先进的PIM设计(PEI、Fafnir和SpaceA)相比,fPIM将工作负载完成时间分别减少了88.6%、87.5%和79.6%(平均减少了68.7%)。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号