MetaML-Pro:跨阶段设计流程自动化,用于高效加速深度学习

【字体: 时间:2026年03月11日 来源:ACM Transactions on Reconfigurable Technology and Systems

编辑推荐:

  该研究提出一种统一的框架,通过程序化优化技术与高阶合成(HLS)结合,利用贝叶斯优化自动平衡FPGA上的深度神经网络(DNN)性能、资源消耗和精度,减少人工干预,实验显示可节省92%的DSP和89%的LUT资源,优化时间减少15.6倍。

  
要查看此由人工智能生成的摘要,您必须具有高级访问权限。

摘要

摘要

本文提出了一个统一的框架,用于编码和自动化优化策略,以便在资源受限的硬件(如FPGA)上高效部署深度神经网络(DNN),同时保持高性能、准确性和资源效率。在这样的平台上部署DNN需要解决一个重大挑战:如何在性能、资源使用(例如DSP和LUT)和推理准确性之间取得平衡,而这通常需要大量的手动工作和领域专业知识。我们的新颖方法解决了两个核心问题:(i)编码自定义优化策略;(ii)实现跨阶段的优化搜索。具体而言,我们提出的框架将程序化的DNN优化技术与基于高级综合(HLS)的元编程无缝集成,利用先进的设计空间探索(DSE)策略(如贝叶斯优化)来自动化自上而下和自下而上的设计流程。因此,我们减少了手动干预和领域专业知识的需求。此外,该框架引入了可定制的优化、转换和控制模块,以提高DNN加速器的性能和资源效率。我们进一步形式化了一个跨阶段的受限贝叶斯优化过程,该过程将谓词-动作自下而上的反馈(通过BRANCH)与FORK/REDUCE顺序搜索相结合,实现了在软件和HLS任务之间的自动化选择、排序和调整。实验结果表明,对于某些网络,DSP使用量减少了92%,LUT使用量减少了89%,同时保持了准确性,并且与网格搜索相比,优化时间缩短了15.6倍。这些结果凸显了通过最小化工作量自动生成资源高效DNN加速器设计的潜力,从而实现了巨大的资源节省,并且探索成本可控。

人工智能摘要

人工智能生成的摘要(实验结果)

此摘要是使用自动化工具生成的,并非由文章作者撰写或审核的。它旨在帮助读者发现内容的相关性,并协助来自相关研究领域的读者理解本文的工作。它旨在补充作者提供的摘要,后者仍然是文章的官方摘要。完整文章才是权威版本。点击此处了解更多

点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。

要查看此由人工智能生成的通俗语言摘要,您必须具有高级访问权限。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号