S-TRAC:一种针对基于加速器的RISC-V指令集架构扩展的、考虑稀疏性的阈值调整算法与硬件协同设计方法

【字体: 时间:2026年03月10日 来源:ACM Transactions on Parallel Computing

编辑推荐:

  深度神经网络存在高能耗和内存需求问题,S-TRAC加速器通过动态稀疏阈值调整、静态稀疏-密集存储格式、动态位处理、列式处理单元、LUT移位累加乘法及全局部分和累加器实现能效提升11.16倍和硬件效率37.03倍,有效减少数据移动和内存占用。

  
要查看此由AI生成的摘要,您必须具有高级访问权限。

摘要

摘要

深度神经网络(DNN)已成为现代应用的基础,然而它们庞大的计算和内存需求对能效推理构成了重大障碍。此外,参数数量的迅速增加以及结构多样性进一步加剧了数据传输的负担,导致能耗和延迟开销显著增加。为了解决这些问题,我们提出了一种新型加速器S-TRAC,它通过算法-硬件协同设计动态调整稀疏性,以实现高效的DNN推理。在算法层面,我们采用静态稀疏-密集存储格式和动态位处理方案来跳过无贡献的位,同时不牺牲权重精度。在硬件层面,我们引入了基于列的处理单元阵列,并结合LUT(查找表)的移位-累加乘法运算和全局部分和累加器,以维持能效执行。为了支持这种算法-硬件协同设计,我们提出了一种RISC-V扩展架构,用于协调读取、排列、乘法、累加和写入等阶段,以支持端到端的加速器执行。实验结果表明,S-TRAC在评估的DNN模型中平均将有效稀疏性提高了8.4倍,从而大幅节省了内存。与现有技术相比,S-TRAC在能效方面提高了11.16倍,在硬件效率方面提高了37.03倍。

AI摘要

AI生成的摘要(实验结果)

该摘要是使用自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现研究价值、评估文章的相关性,并帮助来自相关研究领域的读者理解文章内容。它是对作者提供的摘要的补充,作者提供的摘要仍是文章的正式摘要。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由AI生成的通俗语言摘要,您必须具有高级访问权限。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号