MADA-Unet:一种多分辨率注意力密集聚合Unet模型,用于预测最恶劣情况下的瞬态红外衰减现象

《Microelectronics Journal》:MADA-Unet: MultiRes-scale attentive dense-aggregating Unet for worst-case transient IR-drop prediction

【字体: 时间:2026年02月11日 来源:Microelectronics Journal 2.3

编辑推荐:

  瞬态IR降预测 MADA-Unet 多尺度特征提取 全局PDN拓扑建模 计算效率优化

  
作者:纪远发、钟明峰、孙希燕、蒋芙蓉、傅强
广西精密导航技术及其应用重点实验室,桂林电子科技大学,桂林541004,中国

摘要

预测最坏情况下的瞬态IR降额对于确保电源完整性至关重要。然而,基于现有商业工具的IR降额分析方法计算成本较高。近年来,将机器学习方法应用于提高IR降额预测的效率和准确性已成为一个重要的研究焦点。现有方法主要关注跨时间模式,但常常忽略局部电流密度和宏观级电源分配网络(PDN)约束的影响。本文提出了MADA-Unet,该模型通过SC-MultiResBlock模块在多尺度上提取局部细节,使用DenseASPP模块对全局PDN拓扑关系进行建模,并通过CTrans模块汇总不同通道的最坏情况IR降额特征。在CircuitNet-N28数据集上的实验表明,与最先进(SOTA)模型相比,MADA-Unet将归一化平均绝对误差(NMAE)降低了9.10%,并将浮点运算次数(FLOPs)和GPU内存消耗分别降低了60.18%和71.21%,从而在高精度和低计算开销之间实现了最佳平衡。

引言

IR降额分析对于芯片电源完整性至关重要,因为它直接影响芯片的可靠性、性能和制造良率。这种现象是由电源分配网络的电阻(R)和电感(L)引起的,IR降额会导致局部供电电压下降或地电位反弹。这些效应会降低晶体管的切换速度,引起时序违规,并导致功能故障[1],[2]。
在非常大规模集成(VLSI)电路中,传统的IR降额分析方法需要通过节点分析构建电导矩阵方程[3]来求解节点电压。随着工艺节点的不断缩小,电路中的节点数量急剧增加,导致矩阵维度大幅扩展,计算复杂性呈指数级增长。商业工具需要数小时甚至数天才能完成全芯片仿真。为了减轻这一计算负担,研究人员引入了多网格算法[4]、随机行走方法[5]、边界元素方法[6]和块并行化策略[7]来降低计算复杂性。然而,当面对非均匀和不规则的电网时,这些方法仍然会遇到内存瓶颈,并且精度损失不可忽视。
鉴于机器学习在复杂模式识别和高精度回归预测方面的显著优势,将其应用于最坏情况下的瞬态IR降额预测已成为一个具有广泛应用前景的前沿研究方向。当前的主流方法严重依赖3D卷积建模来捕捉时间动态。例如,[8]采用了3D编码器-2D解码器架构来模拟稀疏的切换活动;[9]引入了PDNNet,这是一种双分支的GNN-CNN(图神经网络-卷积神经网络),其中GNN分支通过PDNGraph对PDN拓扑进行建模,CNN分支使用3D卷积来捕捉时间功率动态;[10]提出了一个双路径模型,该模型利用3D移位窗口多头自注意力(MSA)在3D Swin Transformer块中显式捕捉动态功率活动。然而,基于3D卷积的方法会产生过大的计算和内存开销,严重限制了其在工业部署中的可扩展性。为了缓解这一问题,最近的研究探索了先进的2D CNN。[11]提出了PowerNet,这是一种可迁移的Max-CNN(最大卷积神经网络),它使用时间分解和最大池化来高效估计无向IR降额;[12]提出了一个多任务U-Net,通过专用的输入融合块同时预测两个输出;[13]引入了一种协作式时空双编码器单解码器架构,并通过时空注意力融合(TSAF)模块增强了切片间的相互作用。
尽管高效的2D CNN方法大大降低了计算开销,但它们在全面捕捉IR降额特征方面仍然有限。例如,[11]依赖于最大值选择,无法表征整个周期内的最坏情况IR降额;[12]依赖于预先计算的平均/峰值功率统计信息,丢失了电流活动的关键细粒度细节;而[13]虽然通过时空注意力融合模块增强了切片间的相互作用,但忽略了局部和全局因素对最坏情况IR降额预测的影响。为了克服这些限制,本文介绍了MADA-Unet,这是第一个能够捕捉局部电流密度、建模全局PDN拓扑关系并实现智能跨通道特征聚合的卷积神经网络框架。在保持2D卷积神经网络效率的同时,MADA-Unet在最坏情况下的瞬态IR降额预测方面取得了突破性精度。
本文的主要研究贡献如下:
  • 1.
    我们引入了MADA-Unet,这是一个用于全芯片最坏情况下瞬态IR降额预测的先进深度学习模型。该模型在U-Net架构中协同集成了可分离的卷积多尺度块(SC-MultiResBlock)模块、密集孔状空间金字塔池化(DenseASPP)模块和通道变换器(CTrans)模块,以实现全面的特征捕捉。
  • 2.
    我们设计了一种新的SC-MultiResBlock,能够高效捕捉横向和纵向的IR降额特征。严格的消融实验验证了该模块对模型性能的贡献。
  • 3.
    与最先进模型相比,我们提出的方法将NMAE降低了9.10%。其高效的2D CNN架构同时将浮点运算次数(FLOPs)和GPU内存消耗分别降低了60.18%和71.21%,使其成为工业芯片电源完整性验证阶段的高度实用解决方案。

章节片段

最坏情况下瞬态IR降额的特征

在之前的最坏情况下瞬态IR降额预测任务中,主要使用与功率相关的特征作为输入来预测IR降额的热点。
输入特征的类型如下:
1. 基本功耗特征:
  • 内部功耗
    (pi)
(ps)

方法

本章详细介绍了MADA-Unet架构,其整体结构如图2(a–c)所示,其操作过程在算法1中进行了阐述。该模型的目标是准确预测PDN中的最坏情况下瞬态IR降额。IR降额表现为二维节点电压分布场,受到局部电流密度和全局PDN拓扑的显著多尺度影响[14]。此外,其瞬态性质要求

实验和结果

本章详细介绍了实验设置、使用的数据集以及用于模型性能评估的指标。通过与现有主流方法的比较实验,我们全面验证了所提出的MADA-UNet在最坏情况下瞬态IR降额预测任务中的优越性。

DuST对时间扰动的鲁棒性分析

第4.2节的实验表明,即使3D分支的输入时间切片顺序被随机化,DuST模型的性能仍然保持稳定(RSD < 1.40%)。这表明高性能不依赖于显式的时间序列建模。我们推断这种稳定性源于3D卷积中固有的特征聚合能力和Transformer的全局注意力机制之间的协同作用。

总结

为了克服现有模型在全面捕捉特征方面的局限性,本研究在U-Net架构中集成了SC-MultiResBlock、DenseASPP和CTrans模块。这些模块分别负责局部细节提取、全局PDN拓扑建模和跨通道特征聚合。CircuitNet基准测试表明,这种方法在更少的计算资源下实现了最优的最坏情况下瞬态IR降额预测性能。

CRediT作者贡献声明

纪远发:研究构思与设计、数据获取、数据分析和/或解释、初稿撰写。 钟明峰:研究构思与设计、数据获取、数据分析和/或解释、初稿撰写。 孙希燕:研究构思与设计、数据分析和/或解释、初稿撰写、审稿与编辑。 蒋芙蓉:数据获取、审稿与编辑。 傅强:审稿与

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

致谢

本工作部分得到了中央地方科技发展引导基金项目(GuikeZY23055048)、广西科技项目(GuikeAA24206043)、国家自然科学基金(U23A20280、62161007、62471153)、广西重大人才项目、广西高等教育机构北斗定位服务与边海防御安全应用工程研究中心项目、GuET研究生创新项目的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号