《Nature Communications》:Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells
编辑推荐:
为解决Kolmogorov-Arnold网络(KANs)硬件实现成本高、难以为复杂计算提供高效能效支撑的问题,研究人员基于可调谐类高斯(Gaussian-like)记忆单元,设计了一种新型存内计算架构。该研究通过构建类高斯晶体管与忆阻器的组合单元,实现了可调的类高斯电流-电压响应,并成功将之用于并行推理计算。结果表明,该架构在函数回归、图像识别、偏微分方程求解及时间序列预测等任务中,有效保持了算法的优势,并显著提升了能效,为神经形态计算范式的灵活性与效率扩展提供了新途径。
在人工智能的浪潮中,神经网络模型不断推陈出新,其中,多层感知机(Multilayer Perceptron, MLP)长期扮演着基石角色。然而,其固有的架构在面对某些复杂函数逼近或需要更高解释性的任务时,仍显力不从心。受柯尔莫哥洛夫-阿诺德(Kolmogorov-Arnold)表示定理的启发,一种名为Kolmogorov-Arnold网络(KANs)的新型架构应运而生,它通过有限个基函数的叠加来实现可变的连续单变量激活函数,展现出比传统MLP更强的灵活性与适应性。这一理论前景令人兴奋,但将其从数学公式转化为物理现实的道路上却横亘着一座大山:硬件实现。具体而言,KANs所依赖的基函数在芯片上实现起来硬件成本高昂,导致难以用最精简的设备完成复杂的计算任务。这就像拥有一张精妙绝伦的建筑设计图,却找不到足够优质且经济的建筑材料来搭建它。能耗问题更是雪上加霜,限制了其在资源受限的边缘计算场景中的应用。因此,如何设计一种既能精准实现KANs数学特性,又具备高能效、低成本潜力的专用硬件架构,成为了推动下一代神经形态计算发展的关键瓶颈。
为了解决上述挑战,研究团队独辟蹊径,将目光投向了存内计算(Computing-in-Memory)范式与新型器件。他们不再试图用传统复杂的电路去生硬地模拟基函数,而是从物理底层出发,创造了一种全新的“乐高积木”——类高斯记忆单元(Gaussian-like memory cell)。这个单元的核心设计极为巧妙,它并非单一器件,而是一个由“类高斯晶体管(Gaussian transistor)”和“忆阻器(memristor)”协同构成的组合体。忆阻器以其独特的电阻记忆特性,能够存储和调节状态;而类高斯晶体管则能产生特定的电流响应。二者结合,最终使这个单元整体呈现出一种可调谐的、形状类似高斯函数的电流-电压响应曲线。这正是KANs所需基函数的理想硬件化身。基于这一基本单元,研究人员进一步构建了能够并行执行KANs推理计算的电路阵列。当信号输入时,这些单元并行工作,直接在存储数据的位置完成类高斯函数的计算,极大地减少了数据在处理器和存储器之间搬运所产生的能耗与延迟。
为了验证这一创新架构的有效性,研究团队展开了一系列严格的测试。在一维函数回归任务中,基于新硬件的KANs展现出了优异的函数逼近能力,能够精准拟合复杂的非线性曲线。在经典的图像识别任务(如MNIST数据集)中,其识别准确率与传统软件实现的KANs相当,证明了硬件实现的保真度。更具挑战性的是,研究还将其应用于求解偏微分方程(Partial Differential Equation, PDE)和进行时间序列预测。在这些需要捕捉数据深层动态与复杂依赖关系的任务中,该架构同样表现稳健,成功地将KANs的算法优势从软件领域迁移到了硬件平台。而所有这些性能的实现,都伴随着一个至关重要的指标提升:能效。与传统冯·诺依曼架构下执行相同计算相比,这种基于类高斯记忆单元的存内计算架构实现了显著的能效改进,为低功耗智能计算打开了新的可能。
该研究的核心方法主要包括:第一,提出了由类高斯晶体管与忆阻器集成的新型“类高斯记忆单元”的器件设计与表征方法,用以实现可调的高斯型电流-电压响应。第二,基于该单元,构建了支持Kolmogorov-Arnold网络并行推理计算的专用存内计算电路架构。第三,通过设计一系列基准测试(包括一维函数回归、图像识别、偏微分方程求解和时间序列预测),从算法性能与硬件能效两个维度,对该架构进行了全面的验证与评估。
研究结果
- •
类高斯记忆单元的设计与表征:通过将类高斯晶体管与忆阻器集成,成功制备出类高斯记忆单元。电学测试表明,该单元能够产生峰值位置和幅度均可电调谐的类高斯电流-电压(I-V)响应曲线,这为模拟KANs所需的可变激活函数提供了物理基础。
- •
用于KANs的存内计算电路构建:基于类高斯记忆单元,研究人员设计并实现了能够并行执行计算的交叉杆阵列电路。该电路可以将KANs的网络映射直接编码到硬件连接中,输入向量通过一次模拟计算即可在阵列边缘获得输出结果,极大提升了计算并行度与效率。
- •
算法性能验证:在多种任务上的测试表明,该硬件架构能够有效维持KANs的算法优势。在一维复杂函数回归中,它能精确拟合目标函数;在MNIST手写数字识别中,达到了与软件仿真相当的分类精度;在求解偏微分方程和预测混沌时间序列的任务中,也表现出良好的准确性和稳定性,证明了硬件实现的通用性与可靠性。
- •
能效优势评估:通过与传统数字计算平台在执行相同KANs推理任务时的对比分析,该研究量化了所提出架构的能效提升。得益于存内计算范式消除了数据搬运开销,以及类高斯单元本身的高效模拟计算特性,新架构实现了数量级级别的能效改进,凸显了其在低功耗边缘智能应用中的巨大潜力。
结论与讨论
本研究成功设计并验证了一种基于新型类高斯记忆单元的存内计算架构,用于高效实现Kolmogorov-Arnold网络。该工作的核心结论在于,通过器件层面的创新(类高斯晶体管与忆阻器融合),直接从物理原理上生成可调谐的类高斯函数响应,从而为KANs提供了天然匹配的硬件基底。在此基础上构建的并行计算电路,使得KANs的推理过程得以在硬件中高效、低能耗地执行。
研究的重要意义是多方面的。首先,它为解决KANs硬件实现成本高、能效低的难题提供了一个切实可行的“从器件到电路”的完整方案,打通了该先进算法模型走向实际应用的关键一环。其次,所提出的类高斯记忆单元概念,丰富了神经形态计算器件工具箱,为未来实现其他基于复杂激活函数的神经网络模型提供了新的器件设计思路。更为深远的是,这项工作将存内计算范式与先进的神经网络理论(Kolmogorov-Arnold表示定理)紧密结合,不仅拓展了存内计算架构的应用边界,也显著增强了神经形态计算范式的灵活性与计算效率。它为开发下一代高能效、高适应性的专用人工智能硬件开辟了一条充满希望的途径,有望推动人工智能在物联网、移动设备、科学计算等广泛领域的深入部署与应用。这项研究已发表在《自然·通讯》(Nature Communications)期刊上。