CGR-AI引擎:一种基于CGRA的可扩展处理平台,专为太空应用中的人工智能任务设计

《Microprocessors and Microsystems》:CGR-AI Engine: A scalable CGRA-based processing platform for Artificial Intelligence in space applications

【字体: 时间:2026年03月05日 来源:Microprocessors and Microsystems 2.6

编辑推荐:

  本文提出基于粗粒度可重构阵列(CGRA)的CGR-AI Engine平台,结合RISC-V处理器和可重构处理矩阵优化空间AI推理,通过设计空间探索(DSE)实现能效比最大化,并在DARE65T辐射硬化标准库验证其性能,支持复杂神经网络层的高效执行。

  
卢卡·祖尔贝蒂(Luca Zulberti)|马泰奥·莫诺波利(Matteo Monopoli)|加布里埃拉·米斯特科夫斯卡(Gabriela Mystkowska)|安德烈亚·莫诺尔基奥(Andrea Monorchio)|西尔维娅·莫兰蒂(Silvia Moranti)|卢卡·法努奇(Luca Fanucci)|皮埃特罗·南尼皮埃里(Pietro Nannipieri)
意大利比萨大学信息工程系,G. 卡鲁索街16号,56122

摘要

在太空中执行处理任务是现代太空任务的基石,它使得各种关键应用成为可能。近年来,人工智能(AI)在太空工业中的整合日益受到重视,这得益于其相较于传统方法更优越的性能,尤其是在图像处理方面。这一趋势加速了AI在太空领域的应用。在这种情况下,选择航天器上的处理架构对于确保推理算法的效率以及最大化平台在多样化任务中的多功能性至关重要。本文介绍了CGR-AI引擎,这是一种基于粗粒度可重构阵列(CGRA)的可扩展处理平台,旨在促进AI在太空中的部署。该平台包含高度可定制的组件,其能力可以通过设计空间探索(DSE)活动进行优化。本文展示了这些优化的结果。通过将RISC-V处理器的可编程性与CGRA处理矩阵的可重构性相结合,以实现特定算法的数据流图(DFGs),CGR-AI引擎提供了一个灵活且适应性强的解决方案。它适用于多种工作负载,并可以根据特定应用需求以及严格的资源和功耗限制进行定制。本文概述了实现通用神经网络(NN)层和模型的方法,并在DARE65T标准单元库平台上展示了合成结果,并对性能进行了详细分析,验证了所提出的解决方案能够满足太空任务中处理的需求。

引言

AI算法在导航系统、陆地和海洋监测、气候和气象观测、恒星跟踪、姿态控制、目标跟踪和事件检测等方面显示出显著的价值[1]、[2]。由于神经网络能够分析大规模、高维度的数据(如卫星图像和遥感数据)[3]、[4],因此在太空领域的数据处理中发挥着关键作用。由神经网络驱动的特征识别和提取技术通过减少卫星与地面通信的带宽需求,使得卫星图像的分析更加高效,特别是在多光谱和高光谱图像分析中[6]、[7]。
近年来,人们对直接在卫星上使用和部署AI技术的兴趣显著增加。欧洲航天局(ESA)的?-Sat-1任务是这一方向的先驱性尝试,通过在Myriad 2视觉处理单元(VPU)上运行云检测算法,证明了机载机器学习(ML)的可行性和潜力[7]。此后,研究探索了神经网络在地球观测(EO)和遥感等应用中的优势。值得注意的是,OPS-SAT立方星被用于在轨训练和故障检测与恢复(FDIR),标志着机载AI实验的另一个里程碑[8]、[9]、[10]。尽管学术界和工业界都表现出越来越大的兴趣[11]、[12],但神经网络在实际操作场景中的部署仍然有限。其中一个值得注意的例子是Ubotica Technologies去年发射的CogniSAT-6任务,该任务专为地球观测任务(如船舶检测)而设计[13]。
在卫星上部署神经网络的主要挑战在于其巨大的计算需求,这主要是由于参数数量众多以及操作复杂,特别是在卷积层中[14]、[15]。随着复杂性和深度的增加,传统的处理器(如中央处理单元(CPUs)难以提供必要的吞吐量和能效,以满足训练和推理的需求。云计算系统通过利用高度并行的架构和大量的高速计算核心及内存资源来加速操作[16]。然而,它们消耗大量能源并产生大量热量,因此需要适当的热管理系统,这使得它们不适合嵌入式应用和在轨部署。利用云计算进行太空应用的唯一可行方法是在轨收集数据并将其传输到地面计算中心。这种方法受到数据隐私和安全问题的限制[17],有限的带宽会导致数据处理链中的延迟,以及需要大量的存储空间和先进的数据处理系统。太空任务还有严格的重量和尺寸限制,因此选择能够在性能、能效和耐用性之间取得平衡的硬件至关重要。
CGRA作为一种替代传统计算架构(如CPU、图形处理单元(GPUs)和现场可编程门阵列(FPGAs)的方法,在资源受限的环境中(如太空任务)中表现出竞争力[18]。尽管CPU提供通用处理能力,GPU在AI任务的并行处理方面表现出色,但这两种架构在能效和任务特定优化方面都存在局限性。FPGA以其可重构性和适应性而闻名,但编程和配置较为复杂,增加了开发成本。相比之下,CGRA在灵活性和效率之间取得了平衡,结合了空间和时间计算,无需针对特定任务重新设计硬件,即可优化特定AI工作负载,提供了接近ASIC级别的性能,并具有类似软件的可重构性。这使得CGRA特别适合太空任务,在这些任务中,部署后调整硬件的能力至关重要。与FPGA相比,CGRA具有更快的重构时间和更低的能耗开销,成为满足AI驱动的太空应用不断增长需求的有希望的解决方案。
利用CGRA的优势,本文介绍了CGR-AI引擎,这是一种专为太空应用中的AI任务设计的可扩展且节能的加速器。随着AI在太空实时决策中的依赖性增加,以及深度神经网络(DNNs)的计算需求,对既具有高性能又具有灵活性的可重构硬件解决方案的需求日益凸显。通过集成可重构处理单元(PEs),CGR-AI引擎旨在优化复杂数据处理任务的执行,如特征识别和卫星图像分析,同时确保能效和在恶劣太空条件下的可靠性。所提出的解决方案探索了多级别的硬件重构新方法,例如阵列维度和内存访问,确保系统能够动态适应不同的任务需求和计算负载,从而为下一代AI驱动的太空任务做出贡献。
在之前的研究基础上,本文的创新之处在于介绍了完整的CGR-AI引擎架构,集成了加速器核心和内存子系统以实现高效的数据传输,并引入了新功能,验证了所有组件之间的正确交互。我们还详细描述了RISC-V自定义功能单元(CFU)和伪代码示例,展示了如何编程该引擎。此外,我们在Interuniversity Microelectronics Centre(imec)的专有且经过太空辐射加固设计(RHBD)的DARE 65nm库(DARE65T)平台上对该架构进行了详细分析。最后,我们展示了在此框架内针对AI特定层和卷积神经网络(CNN)推理的初步基准测试结果。
本文的其余部分组织如下:第2节简要概述了文献中的CGRA架构和框架;第3节介绍了基于CGRA的高参数化平台CGR-AI引擎,用于在太空领域高效推断DNN;第4节通过描述构成这些算法的NN层的实现流程,展示了CGR-AI引擎的优势;随后,第5节评估了CGR-AI引擎在多种设计配置下的性能,展示了其在DARE65T RHBD标准单元库平台上的实现结果以及所考虑的CNN层的基准测试结果;最后,第6节总结了这项工作。

相关研究

相关工作

本节探讨了几种前沿的CGRA设计,重点关注其在节能计算中的应用。这些解决方案展示了CGRA开发中的多样性,包括架构创新、框架创新和节能处理,以满足现代计算不断增长的需求。分析未包括围绕CGRA系统的其他工作,例如互连生成[19]、分布式系统[20]、[21]、编译器

CGR-AI引擎平台

本节介绍了基于CGRA的高参数化平台CGR-AI引擎,用于加速数字信号处理(DSP)算法和神经网络(NNs)。该平台包括数据传输单元、内存块、CGRA处理核心以及RISC-V CPU,以协调架构内的数据传输。CGR-AI引擎执行调度内存事务的内核,将数据从外部内存加载到本地内存,再从本地内存加载到嵌入式CGRA矩阵,反之亦然。

案例研究:卷积神经网络推理

将NN层映射到CGR-AI引擎需要一个多步骤的过程,以高效地分配每个层在架构可用资源上的计算。这项任务对于优化性能、能效和NN推理期间的并行性至关重要。挑战在于NN的各种操作——如卷积、池化、矩阵乘法和激活——必须策略性地分布在CGRA核心内的PEs上。
映射过程

引擎评估和特性分析

采用与[47]中SmartDMA评估相同的方法,图7所示的芯片系统(SoC)设置了五种用于DSE活动的配置,这些配置在表5中进行了描述。选择这些位宽是因为量化后的NN运行在低精度算术上。其他参数的设计是为了维持高速端口中的可用带宽。银行数量、向量大小和本地内存数据宽度被设置为允许

结论

为了应对太空相关应用中对机器学习(ML)日益增长的兴趣,需要一个长期的解决方案来应对高级任务。深空任务的数据处理解决方案不包括高性能GPU,因为它们不具备辐射加固特性。其他解决方案,如CPU和FPGA,无法提供足够的计算能力或效率来在轨执行ML任务。本文解决了CGRA平台的DSE问题,提供了一个框架和解决方案

利益冲突声明

作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:卢卡·祖尔贝蒂报告称获得了欧洲航天局的财务支持。皮埃特罗·南尼皮埃里报告称获得了意大利大学和研究部的财务支持。如果有其他作者,他们声明没有已知的财务利益或个人关系可能影响所报告的工作

致谢

资助:本研究获得了欧盟 - Next-GenerationEU - 国家恢复和韧性计划(NRRP) – MISSION 4 COMPONENT 2, INVESTMENT N. 1.1, CALL PRIN 2022 PNRR D.D. 1409 14-09-2022 – (OPERAND - 一种用于边缘AI推理的可重构平台和框架) CUP N.I53D23006070001的资助,来自意大利大学和研究部(MUR),属于FoReLab项目(卓越部门)框架,以及欧洲航天局(ESA)
卢卡·祖尔贝蒂于2025年在比萨大学信息工程系获得信息工程博士学位,并于2021年获得电子工程硕士学位。他的博士学位由欧洲航天局共同资助,研究主题为“用于在轨计算人工智能的创新型粗粒度可重构阵列平台”。2021年3月至10月期间,他在该系担任研究助理
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号