基于机器学习的空间映射技术，用于在数据量较少的情况下提取微波滤波器的参数

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Journal on Miniaturization for Air and Space Systems》：Machine Learning-Driven Space Mapping for Microwave Filter Parameter Extraction With Small Datasets

【字体：大中小】 时间：2026年05月11日 来源：IEEE Journal on Miniaturization for Air and Space Systems 2.1

编辑推荐：

　　摘要：空间映射是一种强大的优化技术，它通过利用替代模型来减少计算工作量。然而，在空间映射框架内进行参数提取仍然可能非常耗时，尤其是对于粗略模型级别的复杂结构。本研究介绍了一种基于卷积神经网络（CNN）的参数提取方法，该方法可以无缝集成到空间映射工作流程中。我们使用敏感性分析来识别

　　摘要：空间映射是一种强大的优化技术，它通过利用替代模型来减少计算工作量。然而，在空间映射框架内进行参数提取仍然可能非常耗时，尤其是对于粗略模型级别的复杂结构。本研究介绍了一种基于卷积神经网络（CNN）的参数提取方法，该方法可以无缝集成到空间映射工作流程中。我们使用敏感性分析来识别对优化结果影响最大的参数，从而构建出紧凑而信息丰富的训练数据集。所得模型能够很好地适应生成数据中表示的各个频率范围，并在有无交叉耦合的微带滤波器设计上进行了验证。与传统电路级优化相比，所提出的方法节省了大量的时间：对于单个设计，时间节省了2.0到2.7倍；对于多个设计，时间节省了8.0到10.7倍。这些结果表明，学习驱动的参数提取可以缓解空间映射中的一个关键瓶颈，为更快、更可扩展的微波滤波器设计铺平了道路，同时在粗略和精细模型级别上都保持了准确性。

第I部分引言
传统的微波滤波器设计和优化方法通常需要大量的计算资源，而且可能耗时且计算成本高昂，尤其是在处理微波滤波器的复杂非线性结构时[1]。在微波滤波器设计中，人工智能（AI）技术的集成正在迅速改变传统方法[2][3][4][5][6][7][8][9]。作为AI的一部分，机器学习（ML）已被用于通过人工神经网络（ANN）[10][11][12][13]、卷积神经网络（CNN）[14][15][16]和极端学习机（ELM）[17]等方法来创建滤波器设计[18][19]。与早期的基于ANN[12][13]和随机森林的方法不同，后者在中心频率（f0）和带宽百分比（%BW）发生变化时需要重新训练，或者预测精度较低，CNN模型通过采用形状识别概念，在几何尺寸和微波滤波器响应之间建立了联系，使它们能够有效地理解输入和输出量之间的关联。SM（空间映射）在微波滤波器设计中继续是一个重要的进步，因为它在粗略模型和精细模型之间架起了一座桥梁，实现了更快的优化并减少了计算工作量。尽管粗略模型评估的成本较低，但在SM框架内的参数提取（PE）仍然可能非常耗时，并且对解的非唯一性敏感；解决这一非唯一性问题超出了本研究的范围，而文献中报道的逆向建模方法[20]将其作为未来研究的一个重要方向。

本研究介绍了一种方法，该方法利用在小型数据集上训练的CNN模型在SM优化框架内对粗略模型进行PE，以节省PE时间。所提出的方法利用CNN优秀的模式识别和回归能力来准确模拟几何尺寸与滤波器响应之间的复杂关系。该方法可以无缝集成到 aggressive space mapping (ASM) 和 implicit space mapping (ISM) 优化中，显示出效率和性能的显著提升。本研究将重点放在两种特定类型的优化上：ASM和ISM。几何参数由 x = [L, S]T 表示，其中L和S分别是长度和空间参数，而预设参数 xp = [εr, H]T 表示介电常数和基板高度。数据在特定的 f0 和 %BW 下生成，之后开发并实施CNN模型用于SM中的PE。这些模型不仅在指定的 f0 和 %BW 下进行测试，还应用于生成频率范围内的其他 f0 和 %BW 值，以验证其鲁棒性。此外，本研究中的输入数据包括微波滤波器响应，这些响应根据需要用来预测几何参数和预设参数。所有在研究中使用的几何参数都以密耳（千分之一英寸）为单位表示。此外，SM通过利用计算效率高的粗略模型来近似精细模型的行为，有效地解决了优化计算密集型模型的挑战。这减少了通常所需的仿真时间[21][22][23][24][25][26]。通过SM创建的替代模型通过迭代优化来最小化效用函数，以实现与精细模型性能的对齐，而精细模型则被选择性地使用来加速整个过程[27][28][29][30][31][32][33]。优化主要使用粗略模型，直到满足所需的规格[34]。

本研究的一个重要贡献是使用敏感性分析来识别最具影响力的设计参数并确定优化所需的最小数据量。通过改变每个参数并使用均方误差（MSE）评估其影响，CNN模型在小型粗略模型数据集上进行训练，并直接嵌入到ASM和ISM框架中以实现快速PE。与我们在[16]中之前基于CNN的工作不同，那项工作专注于独立的参数预测，本研究将敏感性引导的数据集设计集成到ASM和ISM中，包括目标域ISM，实现了系统化和收敛的空间映射优化。本研究将CNN模型作为一种变革性的解决方案引入微波滤波器设计优化挑战中。通过利用CNN识别复杂模式和进行精确预测的能力，所提出的方法显著提高了SM框架的效率和鲁棒性。传输零点的集成进一步确保了锐利的选择性和不需要的信号的抑制，从而实现了高性能和精确的滤波器设计。这种方法在适应各种微波滤波器配置（包括交叉耦合滤波器）的复杂设计要求的同时保持了效率。

本文的其余部分组织如下。第二部分介绍了使用ASM技术的所提出滤波器设计，包括敏感性分析的探索、CNN模型描述、实现和鲁棒性。第三部分探讨了使用ISM技术的所提出滤波器设计，包括按微带基板（MSUB）对参数进行分组、敏感性分析、在ISM实现上的CNN模型描述，并以目标域讨论作为结尾。第四部分通过时间分析来分析该方法的时间效率。最后，第五部分强调了主要结论。

第II部分使用ASM技术的所提出滤波器设计
本节介绍了所提出的滤波器设计方法，包括对CNN模型的详细讨论。所提出的滤波器设计方法包括以下步骤：
步骤1：执行PE以确定具有f0和%BW的滤波器响应的起点x?c。
步骤2：对设计参数x进行敏感性分析。
步骤3：定义参数限制并设置数据点。
步骤4a：通过对与滤波器长度相关的设计参数进行粗略模型参数扫描来创建一个小数据集，其中|S11|作为输入，相应的几何参数作为输出，使用ASM技术所需的参数限制。
步骤4b：对与间距参数相关的设计参数重复步骤4a。
步骤5：使用步骤4中的小型数据集开发CNN模型。
步骤6：使用CNN模型执行步骤1中定义的滤波器的ASM技术以进行PE。
图1中的流程图展示了使用ASM方法的所提出的微波滤波器设计，并在后面提供了详细的解释。

为了说明所提出的设计过程，设计了一个无损的三极微带发夹线滤波器，使用介电常数εr为3.5和基板厚度H为20密耳的材料。滤波器设计在f0 = 2.4 GHz和BW为2.5%的条件下进行优化。在粗略模型中，优化了发夹滤波器的长度和空间参数，得到优化后的值L01 = 290.619密耳，L02 = 310.088密耳，S01 = 2.973密耳，S02 = 36.296密耳。

本研究介绍了在具有3极的发夹微波滤波器结构上实施ASM的方法。该方法涉及使用CNN模型进行PE。图2展示了发夹微波滤波器结构的电磁（EM）布局设计。

A. 敏感性分析
在确定给定f0和%BW下的x?c后，作为初步步骤进行敏感性分析。该分析的目的是评估不同参数对滤波器响应的相对影响，并在最小化优化所需数据量的同时指导数据点的分配。该过程包括选择一个参数，以其标称值为中心点，并在其±10%范围内对其进行扰动，以生成三个评估点。然后通过比较在较低和较高扰动下获得的响应与标称响应来计算|S11|的均方误差（MSE）。这种方法有助于识别对滤波器响应影响较大的参数，表明在数据集生成过程中应更加重视这些参数的限制和数据点密度。敏感性分析仅用于排名目的。图3展示了发夹滤波器的敏感性结果，而表1总结了ASM技术的相应定量分析。

图3. 发夹微波滤波器结构的敏感性分析图示：(a) L01的响应；(b) S01的响应；(c) L02的响应；(d) S02的响应。

表1 在ASM上实现的选定微波滤波器结构的定量分析
图3中的分析结果显示，在需要优化的四个几何参数中，L01的敏感性最高，其次是L02。相反，S01在这些参数中的敏感性最低。因此，优化L01和L02将需要比S01和S02更多的数据点。具有较高敏感性的参数需要更多的数据点来准确捕捉其变化并确保可靠的优化。

B. 定义参数限制和数据点
本节描述了所提出方法的第三步。对于ASM技术，尝试了多种组合，当仅在CNN模型上训练长度参数时获得了最佳结果。同样，单独训练间距参数也产生了最佳性能。基于这些发现，本文使用这种方法来实现ASM技术。
参数限制涉及为每个设计参数设置上下界。在进行敏感性分析后确定每个参数所需的数据点数量。最初，对于发夹滤波器结构，L01和L02的上限分别设置为标称值的±10%，分别为340.8和360.7，而下限分别为280.8和300.6。同样，S01和S02的上限分别设置为标称值的±10%，分别为5.5和41.6，而下限分别为2.5和33.4。经验法则是先生成并训练L01和L02的数据集，然后是S01和S02，使用线性间距。这一规则得到了敏感性分析的支持，该分析表明L01和L02是更敏感的参数，需要更多的数据点（7 × 7），而不太敏感的S01和S02需要较少的数据点（4 × 4）。尽管S02的敏感性略高于S01，但由于敏感性差异很小且不影响结果，数据集大小保持不变。同样的原则也适用于L01和L02。
然而，从这个数据集开发的模型在空间映射中的表现不佳，即使预测值在生成的数据集范围内。为了提高性能，数据集被扩展。表2显示了用于训练表现良好的CNN模型的所需数据集，然后将该模型应用于SM中。最终的数据点，L01和L02的数组维度为12×12，S01和S02的数组维度为6×6，总数据点数为（12×12）+（6×6）=180个。表2显示了发夹滤波器结构的几何参数范围。C. 数据集生成和CNN模型开发。本节讨论了所描述方法的第4步和第5步。在设定参数限制和数据点后，使用Keysight Advanced Design System (ADS) Circuit Simulator 2019进行参数扫描模拟，以生成S参数和几何参数的组合。然后使用生成的发夹滤波器数据集来训练两个不同的CNN模型。CNN的输入包括在101个频率点采样的|S11|，而CNN的输出对应于几何参数S01、S02、L01和L02。一个模型预测空间参数，另一个模型预测长度参数。这两个模型都包含七层：前四层是卷积层，后三层是全连接层。卷积层使用大小为5的32、64、64和128个1D核。全连接层分别包含32、32和16个神经元。在每个卷积层之后，应用大小为2、步长为2的MaxPooling1D来减少特征图的空间维度。使用这种数据集配置和CNN模型架构，模型进行2000次迭代。需要注意的是，在本研究中开发的所有CNN模型中，都使用了Adam优化器及其默认的学习率，激活函数为指数线性单元（ELU）。数据集被分为训练集和测试集，比例为80:20，在训练集中，有20%的数据用于验证。模型的均方误差（MSE）结果分别为：L01 = 2.8131%，L02 = 4.2712%，S01 = 1.2041%，S02 = 3.237%。D. ASM技术中的决策过程SM加速了昂贵模型的优化[20][21][22][23]。使用精细模型的传统优化方法，其特征是参数向量x及其响应Rf(x)，虽然准确但耗时[24][25][26][27]。SM通过使用一个精度较低但计算效率更高的粗糙模型Rc(x)，从Rc(x)构建了一个成本效益高的替代模型Rs(x)[28][29][30]。替代模型R(i)s通过最小化效用函数URis(x)进行迭代优化。精细模型Rf(x)很少使用，从而通过减少对资源密集型精细模型的依赖来加速优化[31][32][33][34]。在SM优化[35]中，重点是在精细模型的响应符合所需设计规格之前调整粗糙模型。标准的SM优化方程为：xi+1=arg minxU(Ris(x))(1)。SM的各个方面已经得到了探索，涉及不同的领域和类型的SM[36][37]。在ASM技术[38]中，优化涉及将粗糙模型空间xc映射到精细模型空间xf。ASM算法通过比较电路仿真结果和EM仿真结果来逐步细化替代模型。对设计参数进行调整，以改善粗糙模型和精细模型之间的对齐。在这项研究中，开发了CNN模型用于PE以提高ASM效率。决策过程包括评估CNN的准确性，如果模型不能准确预测参数值和性能指标，则扩展参数限制或增加数据点。如果训练期间的均方误差（MSE）没有充分降低，则生成额外的数据点，并重新训练CNN模型以提高准确性。ASM过程首先优化粗糙模型以近似精细模型的响应。CNN模型被用于PE，集成在ASM框架中，并使用ADS Momentum 2019进行EM仿真。粗糙模型的初始参数定义为x?c，第一次迭代为：x1f=x?c。迭代持续进行，直到满足收敛标准：∥Rf(xnf)?Rc(x?c)∥在这 fine 模型中，这些预先分配的参数是固定的，但在 coarse 模型中，我们可以调整 xpto 以使其响应与 fine 模型匹配。根据 (1)，在 ISM 的背景下，表达式被修改如下 [43]：xip=arg minxp∣∣∣∣Rf(xi)?Rc(xi, xp)∣∣∣∣(4) 在这个方程中，Rf(xi) 表示 fine 模型对当前设计变量 xi 的响应，而 Rc(xi, xp) 表示 coarse 模型在当前设计变量和调整后的预先分配参数 xp 下的响应。当收敛时，ISM 迭代会停止，如 ∥Rf(xn)?Rc(xnc)∥ 1 表示 CNN 方法更快）。“NA” 标记了不适用于传统方法的条目。表 7 总结了所有时间分析。表 7 在微波滤波器设计中 CNN 模型实现和传统 PE 方法的时间比较。所有时间都是在 11th 代 Intel Core i5-1135G7、64 位操作系统、16 GB RAM 的系统上测量的。tx?c 和 tem 对两种方法都是相同的；优势来自 PE/优化。随着数据集的增长，tt 会增加，但由于基于 CNN 的 PE 更快，总时间仍然会减少。对于多个设计，优势显著：Fts4 对于发夹结构约为 10.7，对于准椭圆结构约为 8.0。总体而言，CNN 方法在单滤波器和多滤波器情况下都减少了 PE 时间，同时保持了共享阶段的可比性，显示出稳健和可扩展的速度提升。ASM 和 ISM 原则上都可用于某些滤波器设计问题。在这项研究中，对于主要由 f0 和 %BW 要求定义的问题，推荐使用 ASM，其中反射特性占主导地位，参数集较少。对于涉及反射和传输响应的更复杂的滤波器规格，例如需要显式控制耦合效应或通过同时使用 |S11| 和 |S21| 来控制传输零点的设计，推荐使用 ISM。因此，当适用时，ASM 提供了一个更简单且计算效率更高的选项，而 ISM 为更苛刻的设计目标提供了更大的建模灵活性。

V. 结论
本研究提出了一种基于 CNN 的技术在 SM 框架内的 PE 方法，与传统的电路模型优化方法相比，显著减少了计算时间。通过将 CNN 模型集成到 ASM 和 ISM 技术中，该方法在各种滤波器设计中展示了显著的时间节省能力。以发夹结构为例，单个滤波器设计的 Fts1 为 2.7，而在生成的频率范围内设计四个滤波器时，Fts4 达到了 10.7，其他滤波器设计也观察到了类似的改进。这种方法的一个关键优势是使用小数据集进行训练，通过灵敏度分析和精心选择代表性数据点来实现。这确保了模型轻量且有效，准确地捕捉了滤波器响应、几何参数和预先分配变量之间的关系。模型的鲁棒性使它们能够在不重新训练的情况下应用于不同的 f0 和 %BW 值，从而简化了优化过程。总体而言，这项研究突出了机器学习在解决传统电路模型优化方法的耗时挑战方面的潜力，实现了更快的设计迭代和现代工程工作中复杂任务的可扩展解决方案。未来的一个重要方向是开发基于 CNN 的框架，这些框架明确解决了 SM 优化中 PE 解决方案的非唯一性问题。

联系信箱：

粤ICP备09063491号

热点排行