ArKANe:在可重构空间架构上加速Kolmogorov–Arnold网络

《IEEE Embedded Systems Letters》:ArKANe: Accelerating Kolmogorov–Arnold Networks on Reconfigurable Spatial Architectures

【字体: 时间:2026年02月25日 来源:IEEE Embedded Systems Letters 2

编辑推荐:

  可解释机器学习模型Kolmogorov–Arnold网络(KANs)在嵌入式设备上的加速实现,通过AMD-Xilinx Versal自适应芯片的流式处理架构和波前架构优化B样条计算,实验表明在VCK-190设备上批量处理时性能提升11倍和60倍,能效比GPU高3倍以上,为边缘设备非传统ML算法提供新路径。

  

摘要:

柯尔莫哥洛夫-阿诺德网络(KANs)在嵌入式设备上的可解释机器学习(ML)领域具有巨大潜力。尽管KANs所需的模型参数较少,且规模比传统的深度神经网络更小,但其应用受到每个神经元中使用的基样条(B样条)函数复杂性的限制。因此,本文提出了一种针对基于数据流处理的加速器的KANs加速技术,这些加速器实现了在AMD-Xilinx Versal自适应系统芯片上的部署。我们在VCK-190设备上的实验表明,对于大规模批量处理,采用收缩架构和波前架构进行B样条计算的性能比标准CPU实现高出1160。另一方面,波前加速器在能耗方面相比GPU(RTX 3090)提升了超过3。因此,本文为嵌入式系统中非传统ML算法的空间加速器开辟了新的应用前景。本文的代码和实验结果可在此链接获取:https://github.com/SPIRE-GMU/SPIRE-ARKANE。

引言

近年来,柯尔莫哥洛夫-阿诺德网络(KAN)的进步使其成为替代传统深度神经网络(DNNs)进行可解释机器学习(ML)任务的强有力竞争者,这些任务包括符号回归、偏微分方程求解和持续学习[1]。KAN模型体积更小,同时能够提供更高的准确性、更高效的训练速度和更快的推理速度。因此,基于KAN的学习解决方案可以为边缘设备带来一种新的可解释机器智能范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号