面向CNN的高效能电荷域卷积算子:实现22154 1b-TOPS/W的超高能效比

《IEEE Access》:An Efficient-Energy Charge-Domain Convolution Operator for CNN

【字体: 时间:2026年01月28日 来源:IEEE Access 3.6

编辑推荐:

  本文针对传统卷积神经网络(CNN)硬件实现能效低的问题,报道了一种基于电荷域的紧凑型低功耗混合信号卷积算子。该研究设计了支持-1至+1多比特权重的电压分压选择电路进行乘法运算,并利用电荷域平均电路顺序完成累加、求和与平均操作。基于180 nm CMOS工艺的版图后仿真表明,该算子能以仅117 μW的功耗在5.12μs内完成32×32灰度图像的卷积处理,能效高达22154 1b-TOPS/W,与理想处理的相似度达99%,为边缘计算视觉应用提供了高效解决方案。

  
随着人工智能,特别是卷积神经网络(Convolutional Neural Network, CNN)在图像识别、目标检测等领域的广泛应用,其对计算资源的需求急剧增长。然而,在资源受限的边缘设备上部署复杂的CNN模型面临着巨大的能效挑战。传统的数字电路实现方式虽然精度高,但功耗较大,难以满足移动设备对长时间续航的要求。因此,探索高能效的混合信号或模拟计算方案成为当前研究的热点。电荷域计算作为一种潜在的低功耗技术路径,其核心优势在于利用电荷这一物理量本身进行运算,有望显著降低能量消耗。本研究旨在设计一种高效的电荷域卷积算子,以应对边缘侧智能视觉处理对超高能效的迫切需求。
本研究主要采用了以下几种关键技术方法:首先,设计了基于电压分压与选择电路的乘法器,用于实现多比特权重(范围-1至+1)与模拟输入信号的乘法运算。其次,开发了电荷域平均电路,该电路能够顺序完成乘法结果的累加、求和与平均操作。研究构建了一个支持3x3卷积核的专用卷积算子,并进一步设计了可并行处理30次卷积运算的计算电路。该电路采用180 nm CMOS工艺进行设计与版图实现,并通过后仿真验证其性能。性能评估基于32×32像素的灰度图像处理任务。
Post layout simulation results
版图后仿真结果表明,该电荷域卷积算子处理一幅32×32的灰度图像仅需5.12微秒(μs)。在如此高的处理速度下,其功耗仅为117微瓦(μW)。通过计算得出的能效指标高达22154 1b-TOPS/W(1-bit Tera-Operations Per Second per Watt),这一定义特指每瓦特功率下每秒可完成的1比特操作次数,是衡量硬件能效的关键指标。此外,将电路输出与理想卷积处理结果进行比较,其相似度(similarity)达到了99%,证明了该混合信号方案在保持高计算精度的同时,实现了极低的能量消耗。
本研究成功设计并验证了一种紧凑、低功耗的电荷域卷积算子。该算子通过混合信号方法在电荷域内高效地完成了CNN中的核心卷积运算。实验数据证实,该方案在180 nm CMOS工艺下能够实现极高的能效(22154 1b-TOPS/W)和接近理想的处理精度(99%相似度)。这项工作为在资源严格的边缘计算场景中部署复杂的CNN模型提供了一种可行的硬件解决方案,显著推进了低功耗模拟计算在人工智能前端处理中的应用。该成果发表于《IEEE Access》,展示了电荷域计算在下一代高能效智能芯片中的巨大潜力。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号