用于加速多拓扑模拟电路仿真的神经代理模型

《Results in Engineering》:A Neural Surrogate for Accelerated Multi-Topology Analog Circuit Simulation

【字体: 时间:2026年05月22日 来源:Results in Engineering 7.9

编辑推荐:

  采用数值常微分方程(ODE)求解器的模拟电路仿真具有较高可靠性,但在参数扫描、公差分析和设计迭代中,重复进行瞬态分析的计算开销可能过大。本文提出了一种单一共享神经代理模型,用于模拟 21 种模拟电路拓扑上的瞬态波形。研究人员构建了包含 176100 组仿真波形

  
采用数值常微分方程(ODE)求解器的模拟电路仿真具有较高可靠性,但在参数扫描、公差分析和设计迭代中,重复进行瞬态分析的计算开销可能过大。本文提出了一种单一共享神经代理模型,用于模拟 21 种模拟电路拓扑上的瞬态波形。研究人员构建了包含 176100 组仿真波形成对数据的数据集,覆盖无源滤波器、二极管与晶体管电路、运算放大器级以及开关变换器。该代理模型在保留测试集上达到了 8.39% 的平均归一化均方根误差(NRMSE)。完成训练后,在 RTX 5090 上的单样本推理时间为 0.127 ms,而参考 ODE 求解器在单个 CPU 核心上的单样本耗时为数毫秒至数十秒不等,对应整个电路库平均约 ~ 38,000 × 的加速比。本文还通过完整数据集消融研究评估了训练损失设计与骨干网络架构选择的影响。
该文发表于《Results in Engineering》,聚焦于模拟电路瞬态仿真的高效替代问题。研究背景在于,电子设计自动化(EDA)中标准仿真工具通常依赖数值常微分方程(ODE)求解来获得电路瞬态响应,这一方法在精度上可靠,但在参数扫描、优化、蒙特卡洛分析以及交互式应用场景下,重复仿真的时间成本极高。尤其当电路库同时包含简单 RC 网络、刚性振荡器、开关功率变换器等动力学特征差异显著的系统时,不同拓扑之间的仿真耗时可跨越多个数量级,这对大规模设计探索构成直接瓶颈。既有研究虽然已经将高斯过程、响应面方法、神经网络、物理信息模型与算子学习方法引入电路建模,但大多数工作仅针对单一电路或狭窄电路族,难以适用于拓扑频繁变化的实际设计流程。正是在这一问题背景下,研究人员尝试回答一个更具挑战性的任务:是否可以用一个共享的神经网络代理统一覆盖多个异构模拟电路拓扑,并在维持可接受精度的同时显著降低瞬态仿真成本。

围绕这一目标,研究人员建立了一个包含 21 种电路拓扑的异构电路库,拓扑类型涵盖无源滤波器、二极管电路、晶体管级、运算放大器电路、开关电源变换器以及振荡器,并基于这些电路生成了大规模瞬态波形数据集。论文的核心贡献主要有两点:其一,证明了单一共享神经代理能够在 21 个异构模拟电路拓扑上同时训练并完成瞬态波形模拟;其二,提供了一个包含 176100 组训练样本的大规模多拓扑基准数据集,并在完整数据规模上比较了不同损失函数设计和不同骨干架构的效果。实验结果表明,该模型在保留测试集上取得 8.39% 的平均 NRMSE,且在 RTX 5090 上单样本推理仅需 0.127 ms,相对于单核 CPU 上的 ODE 仿真实现了平均约 ~ 38,000 × 的加速。论文的重要意义在于,它并非仅展示某一特定电路的近似建模能力,而是验证了“共享多拓扑代理仿真”这一范式的可行性,为构建可复用、可扩展、面向多电路库的快速前向预测工具提供了实证基础。

在方法上,研究人员首先以 Python 模块形式实现 21 种电路拓扑,并使用 scipy.integrate.solve_ivp,结合 Radau 或 LSODA 求解器生成瞬态响应。所有拓扑统一接受 5 类激励信号,包括阶跃、正弦、多正弦、带限噪声和脉宽调制(PWM)信号,元件参数按对数均匀分布从物理合理范围采样。数据集共含 176100 个训练样本、35250 个验证样本和 35250 个测试样本,按电路仿真成本分配样本量。模型采用时序卷积网络(TCN,即 Temporal Convolutional Network)作为共享骨干,以输入波形 vin 和电路身份索引 c 为输入,通过电路嵌入实现拓扑条件化,输出对应的瞬态波形 v?out。训练使用 AdamW 优化器,并比较 L1 损失与多分辨率短时傅里叶变换(STFT,即 Short-Time Fourier Transform)谱损失组合的效果。全部实验在 NVIDIA RTX 5090 上完成。

以下对论文主体结果按原文小标题进行解读。

7.1. Emulation Accuracy
该部分评估模型在保留测试集上的波形模拟精度。研究人员采用两项指标:归一化平均绝对误差(MAE)和归一化均方根误差(NRMSE)。其中,NRMSE 以 z-score 标准化后的信号为基础报告,从而避免原始动态范围较小时评价不稳定的问题。总体上,模型在 21 种电路上的平均 MAE 为 0.3121,平均 NRMSE 为 8.39%,表明单一共享代理在跨拓扑条件下能够实现较有竞争力的瞬态响应逼近。

7.1.2. Per-circuit Results
该小节给出了逐电路拓扑的测试结果,并揭示了不同电路类型上的性能差异。在线性或中等非线性电路中,模型表现较好,例如 RLC Bandpass 的 NRMSE 为 1.10%,RLC Highpass 为 1.23%,Boost Converter 为 1.06%。这说明在动力学相对平滑、时域结构较稳定的拓扑中,共享代理能够较准确地捕捉输入—输出波形映射。相对而言,?uk Converter、Op-Amp Lowpass、BJT Common-Emitter 与 MOSFET Switch 的误差较大,NRMSE 分别为 27.38%、25.42%、19.28% 和 18.98%。论文指出,这些电路往往包含更尖锐的跃迁、更强的非线性或更高的参数敏感性,而在当前 Δt=0.1 ms 的采样间隔下,这类快速或刚性行为不易被准确重建。由此可见,模型精度并非对所有拓扑均匀一致,而是受到动力学复杂度与时间分辨率的共同约束。

7.1.3. Qualitative Waveform Examples
该部分通过代表性波形样例展示模型预测与 ODE 真值之间的一致性。研究人员选取了 6 个电路,其中 5 个来自模型表现较好的拓扑,另 1 个刻意选取较困难的 ?uk 变换器作为对照。图示结果表明,在容易建模的电路中,预测波形与真值在主要趋势、相位和形态上较为接近;而对于 ?uk 变换器,尽管展示样本已是较优测试样本,其 NRMSE 仍达 15.2%,且整个测试集的中位误差更高。这一结果直观体现出共享代理对不同波形机制的适应能力存在明显差异,也印证了高刚性开关动力学是当前方法的主要难点。

7.2. Inference Speed-Up
该部分比较了神经代理与 ODE 求解器的运行速度。研究人员以单核 CPU 上的 SciPy LSODA 求解时间作为基线,并以 RTX 5090 上批量大小为 256 的代理推理时间进行对照。结果显示,代理模型对所有拓扑的单样本推理时间均约为 0.127 ms,而 ODE 求解时间则因电路而异,从数毫秒到 98,000 ms 不等。以代表性电路为例,RC Lowpass 的加速比约为 24 ×,BJT Common-Emitter 约为 850 ×,?uk Converter 约为 6,299 ×,Wien-bridge Oscillator 超过 771,000 ×。在全部 21 种电路上,中位加速比约为 ~ 550 ×,平均加速比约为 ~ 38,000 ×。论文同时强调,这一比较基于“单核 CPU ODE 求解”与“GPU 批量推理”的非等资源条件,因此结果应理解为当前评测设置下的实际收益,而非严格硬件公平基准下的理论优势。

7.3. Surrogate as a Fast Forward Model
该节阐明了所提模型的功能边界。研究人员指出,代理模型在推理时仅接收输入波形 vin 和电路身份索引 c,不接收显式元件参数,因此其输出应理解为在给定拓扑和输入条件下、对训练参数分布上的平均响应近似,即 E[vout|vin,c]。为说明其用途,论文将代理的单次前向预测与基于 ODE 的 Nelder-Mead 参数搜索进行对比。在 RC Lowpass 示例中,ODE 参数搜索需要 93 次函数评估,总耗时 5.67 s,MAE 为 0.321;代理模型单次前向仅需 0.649 ms,MAE 为 0.240。论文特别强调,两者并非执行同一任务:前者是在搜索参数,后者是在进行快速前向预测。因此,这一比较主要说明神经代理在“替代重复前向仿真”方面的成本优势,而不意味着其具备参数辨识能力。作者进一步指出,在未引入显式参数条件化之前,模型无法区分同一拓扑下不同元件取值对应的不同响应,这构成现阶段的重要限制。

8. Discussion
讨论部分首先总结了方法的优势。研究人员认为,最实际的成果在于,一个共享代理即可覆盖多种模拟电路,而无需在拓扑变化时重新训练单独模型,这种跨混合电路库的复用性是方法的重要价值。此外,完整数据集消融实验也使得损失设计与骨干选择的结论更具可信度。

8.2. Limitations
论文系统讨论了当前方法的局限。首先,模型性能在不同电路间差异明显,对于具有尖锐开关事件、刚性动力学或强参数敏感性的拓扑,误差显著增大。其次,固定采样间隔 Δt=0.1 ms 可能不足以刻画快速瞬态,导致如 ?uk 变换器和 MOSFET 开关等电路的关键信息在单步内发生而无法被充分解析。再次,输入设计仅包含 vin 与 c,不包含电阻、电容、电感等元件参数,因此映射关系并不唯一,模型只能学习条件期望意义下的平均响应,无法支持精确参数辨识和基于梯度的参数优化。除此之外,方法当前仅适用于固定长度瞬态窗口、已见拓扑以及训练参数范围内的仿真,不覆盖未知拓扑、交流(AC)分析、噪声分析或温度依赖行为。最后,数据与评测本身也存在边界:全部样本来自无噪声仿真,未在真实硬件测量数据或包含器件失配、工艺波动的模拟数据上验证;振荡器样本数量较少;速度基准也未与并行 CPU 或 GPU 加速求解器比较。

8.3. Ablation Study
消融研究考察了损失函数设计与骨干架构选择。结果表明,在完整数据集上,仅使用 L1 损失的 TCN 取得最低平均 NRMSE,即 38.29%;加入 STFT 幅度项后为 38.47%;采用完整损失则升至 38.66%。分电路族统计也显示,谱损失项并未在任何电路族上稳定降低误差,反而在无源滤波器族中出现更明显退化。因此,论文认为在该多拓扑场景中,多分辨率 STFT 谱损失并未带来平均精度提升,未来实际使用更推荐 L1-only 训练。对于骨干架构,Transformer 的平均 NRMSE 为 40.82%,略差于 TCN;LSTM 在完整损失下达到 38.51%,与 TCN 接近。作者因此并未对 TCN 相对于 LSTM 的优越性作强结论,而是将 TCN 保留为主模型,主要基于其在本文速度与精度分析中的实际使用。

8.4. Future Work
论文将未来工作重点明确指向显式元件参数条件化。研究人员认为,这将使模型能够区分同一拓扑下不同参数实例,并进一步支持基于梯度的参数优化。此外,其他潜在方向包括:探索更适合频率敏感行为的损失函数形式;引入不确定性估计;实现硬件在环集成;扩展到 AC 与噪声分析;以及使用基于图的电路表示或算子学习风格代理处理未见拓扑。

9. Conclusion
结论部分指出,本文提出了一种面向 21 种异构模拟电路拓扑的共享神经代理,用于瞬态波形模拟。核心结果是:单一模型可在大规模多拓扑数据集上训练,并在保留测试集上达到 8.39% 的平均 NRMSE;在 RTX 5090 上其单样本推理时间为 0.127 ms,相对于单核 ODE 仿真平均实现约 ~ 38,000 × 的加速。由于模型输入仅包括输入波形和电路身份索引,而不包含元件参数,因此其输出应理解为给定拓扑在训练分布上的平均响应近似。完整数据集消融进一步表明,训练中引入的谱损失项并未提升该场景下的平均精度,LSTM 与 TCN 骨干在完整数据规模上的表现也较为接近。因此,本文的主要价值不在于某一特定损失设计或架构创新,而在于验证了共享多拓扑神经代理仿真的可行性,以及其相较重复 ODE 求解所具备的显著推理速度优势。对于刚性强、开关性显著的电路,当前方法仍是主要失效场景,而引入显式参数条件化被认为是最重要的后续改进方向。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号