基于机器学习的空间映射技术,用于在数据量较少的情况下提取微波滤波器的参数
《IEEE Journal on Miniaturization for Air and Space Systems》:Machine Learning-Driven Space Mapping for Microwave Filter Parameter Extraction With Small Datasets
【字体:
大
中
小
】
时间:2026年05月11日
来源:IEEE Journal on Miniaturization for Air and Space Systems 2.1
编辑推荐:
摘要:空间映射是一种强大的优化技术,它通过利用替代模型来减少计算工作量。然而,在空间映射框架内进行参数提取仍然可能非常耗时,尤其是对于粗略模型级别的复杂结构。本研究介绍了一种基于卷积神经网络(CNN)的参数提取方法,该方法可以无缝集成到空间映射工作流程中。我们使用敏感性分析来识别
摘要:空间映射是一种强大的优化技术,它通过利用替代模型来减少计算工作量。然而,在空间映射框架内进行参数提取仍然可能非常耗时,尤其是对于粗略模型级别的复杂结构。本研究介绍了一种基于卷积神经网络(CNN)的参数提取方法,该方法可以无缝集成到空间映射工作流程中。我们使用敏感性分析来识别对优化结果影响最大的参数,从而构建出紧凑而信息丰富的训练数据集。所得模型能够很好地适应生成数据中表示的各个频率范围,并在有无交叉耦合的微带滤波器设计上进行了验证。与传统电路级优化相比,所提出的方法节省了大量的时间:对于单个设计,时间节省了2.0到2.7倍;对于多个设计,时间节省了8.0到10.7倍。这些结果表明,学习驱动的参数提取可以缓解空间映射中的一个关键瓶颈,为更快、更可扩展的微波滤波器设计铺平了道路,同时在粗略和精细模型级别上都保持了准确性。
第I部分 引言
传统的微波滤波器设计和优化方法通常需要大量的计算资源,而且可能耗时且计算成本高昂,尤其是在处理微波滤波器的复杂非线性结构时[1]。在微波滤波器设计中,人工智能(AI)技术的集成正在迅速改变传统方法[2][3][4][5][6][7][8][9]。作为AI的一部分,机器学习(ML)已被用于通过人工神经网络(ANN)[10][11][12][13]、卷积神经网络(CNN)[14][15][16]和极端学习机(ELM)[17]等方法来创建滤波器设计[18][19]。与早期的基于ANN[12][13]和随机森林的方法不同,后者在中心频率(f0)和带宽百分比(%BW)发生变化时需要重新训练,或者预测精度较低,CNN模型通过采用形状识别概念,在几何尺寸和微波滤波器响应之间建立了联系,使它们能够有效地理解输入和输出量之间的关联。SM(空间映射)在微波滤波器设计中继续是一个重要的进步,因为它在粗略模型和精细模型之间架起了一座桥梁,实现了更快的优化并减少了计算工作量。尽管粗略模型评估的成本较低,但在SM框架内的参数提取(PE)仍然可能非常耗时,并且对解的非唯一性敏感;解决这一非唯一性问题超出了本研究的范围,而文献中报道的逆向建模方法[20]将其作为未来研究的一个重要方向。
本研究介绍了一种方法,该方法利用在小型数据集上训练的CNN模型在SM优化框架内对粗略模型进行PE,以节省PE时间。所提出的方法利用CNN优秀的模式识别和回归能力来准确模拟几何尺寸与滤波器响应之间的复杂关系。该方法可以无缝集成到 aggressive space mapping (ASM) 和 implicit space mapping (ISM) 优化中,显示出效率和性能的显著提升。本研究将重点放在两种特定类型的优化上:ASM和ISM。几何参数由 x = [L, S]T 表示,其中L和S分别是长度和空间参数,而预设参数 xp = [εr, H]T 表示介电常数和基板高度。数据在特定的 f0 和 %BW 下生成,之后开发并实施CNN模型用于SM中的PE。这些模型不仅在指定的 f0 和 %BW 下进行测试,还应用于生成频率范围内的其他 f0 和 %BW 值,以验证其鲁棒性。此外,本研究中的输入数据包括微波滤波器响应,这些响应根据需要用来预测几何参数和预设参数。所有在研究中使用的几何参数都以密耳(千分之一英寸)为单位表示。此外,SM通过利用计算效率高的粗略模型来近似精细模型的行为,有效地解决了优化计算密集型模型的挑战。这减少了通常所需的仿真时间[21][22][23][24][25][26]。通过SM创建的替代模型通过迭代优化来最小化效用函数,以实现与精细模型性能的对齐,而精细模型则被选择性地使用来加速整个过程[27][28][29][30][31][32][33]。优化主要使用粗略模型,直到满足所需的规格[34]。
本研究的一个重要贡献是使用敏感性分析来识别最具影响力的设计参数并确定优化所需的最小数据量。通过改变每个参数并使用均方误差(MSE)评估其影响,CNN模型在小型粗略模型数据集上进行训练,并直接嵌入到ASM和ISM框架中以实现快速PE。与我们在[16]中之前基于CNN的工作不同,那项工作专注于独立的参数预测,本研究将敏感性引导的数据集设计集成到ASM和ISM中,包括目标域ISM,实现了系统化和收敛的空间映射优化。本研究将CNN模型作为一种变革性的解决方案引入微波滤波器设计优化挑战中。通过利用CNN识别复杂模式和进行精确预测的能力,所提出的方法显著提高了SM框架的效率和鲁棒性。传输零点的集成进一步确保了锐利的选择性和不需要的信号的抑制,从而实现了高性能和精确的滤波器设计。这种方法在适应各种微波滤波器配置(包括交叉耦合滤波器)的复杂设计要求的同时保持了效率。
本文的其余部分组织如下。第二部分介绍了使用ASM技术的所提出滤波器设计,包括敏感性分析的探索、CNN模型描述、实现和鲁棒性。第三部分探讨了使用ISM技术的所提出滤波器设计,包括按微带基板(MSUB)对参数进行分组、敏感性分析、在ISM实现上的CNN模型描述,并以目标域讨论作为结尾。第四部分通过时间分析来分析该方法的时间效率。最后,第五部分强调了主要结论。
第II部分 使用ASM技术的所提出滤波器设计
本节介绍了所提出的滤波器设计方法,包括对CNN模型的详细讨论。所提出的滤波器设计方法包括以下步骤:
步骤1:执行PE以确定具有f0和%BW的滤波器响应的起点x?c。
步骤2:对设计参数x进行敏感性分析。
步骤3:定义参数限制并设置数据点。
步骤4a:通过对与滤波器长度相关的设计参数进行粗略模型参数扫描来创建一个小数据集,其中|S11|作为输入,相应的几何参数作为输出,使用ASM技术所需的参数限制。
步骤4b:对与间距参数相关的设计参数重复步骤4a。
步骤5:使用步骤4中的小型数据集开发CNN模型。
步骤6:使用CNN模型执行步骤1中定义的滤波器的ASM技术以进行PE。
图1中的流程图展示了使用ASM方法的所提出的微波滤波器设计,并在后面提供了详细的解释。
为了说明所提出的设计过程,设计了一个无损的三极微带发夹线滤波器,使用介电常数εr为3.5和基板厚度H为20密耳的材料。滤波器设计在f0 = 2.4 GHz和BW为2.5%的条件下进行优化。在粗略模型中,优化了发夹滤波器的长度和空间参数,得到优化后的值L01 = 290.619密耳,L02 = 310.088密耳,S01 = 2.973密耳,S02 = 36.296密耳。
本研究介绍了在具有3极的发夹微波滤波器结构上实施ASM的方法。该方法涉及使用CNN模型进行PE。图2展示了发夹微波滤波器结构的电磁(EM)布局设计。
A. 敏感性分析
在确定给定f0和%BW下的x?c后,作为初步步骤进行敏感性分析。该分析的目的是评估不同参数对滤波器响应的相对影响,并在最小化优化所需数据量的同时指导数据点的分配。该过程包括选择一个参数,以其标称值为中心点,并在其±10%范围内对其进行扰动,以生成三个评估点。然后通过比较在较低和较高扰动下获得的响应与标称响应来计算|S11|的均方误差(MSE)。这种方法有助于识别对滤波器响应影响较大的参数,表明在数据集生成过程中应更加重视这些参数的限制和数据点密度。敏感性分析仅用于排名目的。图3展示了发夹滤波器的敏感性结果,而表1总结了ASM技术的相应定量分析。
图3. 发夹微波滤波器结构的敏感性分析图示:(a) L01的响应;(b) S01的响应;(c) L02的响应;(d) S02的响应。
表1 在ASM上实现的选定微波滤波器结构的定量分析
图3中的分析结果显示,在需要优化的四个几何参数中,L01的敏感性最高,其次是L02。相反,S01在这些参数中的敏感性最低。因此,优化L01和L02将需要比S01和S02更多的数据点。具有较高敏感性的参数需要更多的数据点来准确捕捉其变化并确保可靠的优化。
B. 定义参数限制和数据点
本节描述了所提出方法的第三步。对于ASM技术,尝试了多种组合,当仅在CNN模型上训练长度参数时获得了最佳结果。同样,单独训练间距参数也产生了最佳性能。基于这些发现,本文使用这种方法来实现ASM技术。
参数限制涉及为每个设计参数设置上下界。在进行敏感性分析后确定每个参数所需的数据点数量。最初,对于发夹滤波器结构,L01和L02的上限分别设置为标称值的±10%,分别为340.8和360.7,而下限分别为280.8和300.6。同样,S01和S02的上限分别设置为标称值的±10%,分别为5.5和41.6,而下限分别为2.5和33.4。经验法则是先生成并训练L01和L02的数据集,然后是S01和S02,使用线性间距。这一规则得到了敏感性分析的支持,该分析表明L01和L02是更敏感的参数,需要更多的数据点(7 × 7),而不太敏感的S01和S02需要较少的数据点(4 × 4)。尽管S02的敏感性略高于S01,但由于敏感性差异很小且不影响结果,数据集大小保持不变。同样的原则也适用于L01和L02。
然而,从这个数据集开发的模型在空间映射中的表现不佳,即使预测值在生成的数据集范围内。为了提高性能,数据集被扩展。表2显示了用于训练表现良好的CNN模型的所需数据集,然后将该模型应用于SM中。最终的数据点,L01和L02的数组维度为12×12,S01和S02的数组维度为6×6,总数据点数为(12×12)+(6×6)=180个。表2显示了发夹滤波器结构的几何参数范围。C. 数据集生成和CNN模型开发。本节讨论了所描述方法的第4步和第5步。在设定参数限制和数据点后,使用Keysight Advanced Design System (ADS) Circuit Simulator 2019进行参数扫描模拟,以生成S参数和几何参数的组合。然后使用生成的发夹滤波器数据集来训练两个不同的CNN模型。CNN的输入包括在101个频率点采样的|S11|,而CNN的输出对应于几何参数S01、S02、L01和L02。一个模型预测空间参数,另一个模型预测长度参数。这两个模型都包含七层:前四层是卷积层,后三层是全连接层。卷积层使用大小为5的32、64、64和128个1D核。全连接层分别包含32、32和16个神经元。在每个卷积层之后,应用大小为2、步长为2的MaxPooling1D来减少特征图的空间维度。使用这种数据集配置和CNN模型架构,模型进行2000次迭代。需要注意的是,在本研究中开发的所有CNN模型中,都使用了Adam优化器及其默认的学习率,激活函数为指数线性单元(ELU)。数据集被分为训练集和测试集,比例为80:20,在训练集中,有20%的数据用于验证。模型的均方误差(MSE)结果分别为:L01 = 2.8131%,L02 = 4.2712%,S01 = 1.2041%,S02 = 3.237%。D. ASM技术中的决策过程SM加速了昂贵模型的优化[20][21][22][23]。使用精细模型的传统优化方法,其特征是参数向量x及其响应Rf(x),虽然准确但耗时[24][25][26][27]。SM通过使用一个精度较低但计算效率更高的粗糙模型Rc(x),从Rc(x)构建了一个成本效益高的替代模型Rs(x)[28][29][30]。替代模型R(i)s通过最小化效用函数URis(x)进行迭代优化。精细模型Rf(x)很少使用,从而通过减少对资源密集型精细模型的依赖来加速优化[31][32][33][34]。在SM优化[35]中,重点是在精细模型的响应符合所需设计规格之前调整粗糙模型。标准的SM优化方程为:xi+1=arg minxU(Ris(x))(1)。SM的各个方面已经得到了探索,涉及不同的领域和类型的SM[36][37]。在ASM技术[38]中,优化涉及将粗糙模型空间xc映射到精细模型空间xf。ASM算法通过比较电路仿真结果和EM仿真结果来逐步细化替代模型。对设计参数进行调整,以改善粗糙模型和精细模型之间的对齐。在这项研究中,开发了CNN模型用于PE以提高ASM效率。决策过程包括评估CNN的准确性,如果模型不能准确预测参数值和性能指标,则扩展参数限制或增加数据点。如果训练期间的均方误差(MSE)没有充分降低,则生成额外的数据点,并重新训练CNN模型以提高准确性。ASM过程首先优化粗糙模型以近似精细模型的响应。CNN模型被用于PE,集成在ASM框架中,并使用ADS Momentum 2019进行EM仿真。粗糙模型的初始参数定义为x?c,第一次迭代为:x1f=x?c。迭代持续进行,直到满足收敛标准:∥Rf(xnf)?Rc(x?c)∥。当精细模型响应rf(xnf)在由?定义的误差范围内与粗糙模型响应rc(x?c)紧密匹配时,过程结束,表示优化成功并收敛。e. 提出方法的最后一步,即第6步,涉及在asm框架内实施开发的cnn模型进行pe。这些训练有素的模型用于pe。仿真结果显示在图4中,收敛在第三次迭代时实现。asm迭代中提取的值在表3中呈现。图4显示了迭代后的发夹滤波器响应,(a) xc*的响应(红色)和xf1的响应(蓝色);(b) xc*的响应(红色)和xf3的响应(蓝色)。表3显示了发夹滤波器结构的asm迭代。f. 使用asm技术的cnn模型的鲁棒性本节描述了用于asm技术的cnn模型的鲁棒性。这里的鲁棒性指的是单个训练有素的cnn模型在不同f0和%bw值下执行可靠pe的能力,而无需重新训练。为了确保这一点,选择了覆盖最低和最高f0和%bw值的训练参数,以便涵盖该范围内的任何操作点。结果参数界限p1–p4、pmin和pmax定义了足够宽的设计空间以实现鲁棒操作。具体来说,p1和p2代表指定几何参数在两个不同f0和%bw组合下的上界值,pmin和pmax分别表示所有考虑的f0和%bw范围内的参数的最小值和最大值。这些参数确保参数空间足够宽,可以覆盖设计规格内的所有可能变化。表4显示了微波滤波器设计中asm技术的鲁棒性考虑因素。对于发夹滤波器,鲁棒性在多个操作点(f0 = 2.3–2.5 ghz, bw = 2.1%–3.1%)上进行了评估。在模拟的频率范围内,使用|s11|量化了响应级别的鲁棒性,得到的平均绝对误差(mae)约为1.0%–1.8%,介于cnn提取的粗糙(初始)响应和最终收敛响应之间。最初为发夹结构设计的cnn模型被应用于相同数据集中的新的f0和%bw值(f0 = 2.3 ghz和bw = 2.1%)。尽管有这种变化,模型在pe方面表现出色,如其在x3f = [357.722, 377.748, 3.746, 39.727]t处的收敛所示。图5显示了这种收敛的图形表示,相应的mae约为1.3%。cnn模型使用生成的粗糙模型数据集训练一次,在asm迭代期间不需要重新训练;相反,在每次迭代中,cnn模型替代了传统的pe。第三节. 使用ism技术的提出的滤波器设计图6说明了ism设计方法的流程图,以下部分将进一步详细说明。使用ism技术的提出的滤波器设计方法包括以下步骤:步骤1:执行pe以确定滤波器响应的设计参数(x)和f0及%bw。步骤2:将与每个微带基板(msub)相关的参数分组,这是ads软件特有的组件模型。步骤3:对设计参数(x)和与每个msub相关的预分配参数(xp)进行敏感性分析。步骤4:定义参数限制和数据点。步骤5:为每个msub创建数据集。步骤6:为每个msub开发cnn模型。图6显示了使用ism方法的提出的滤波器设计流程图。a. 与每个msub相关的参数分组我们在一个四极准椭圆形滤波器上展示了ism工作流程,该滤波器设计用于f0 = 1 ghz和bw = 4%。准椭圆形结构的em布局如图7所示。步骤1:与x相关的参数包括[l11, l2, s04, l22, s03, s02]t,而与xp = [εr2, h2, εr3, h3, εr4, h4, εr5, h5]t相关的参数包括[819.036, 106.556, 54.176, 829.678, 48.210, 31.274]t和[xp = [3.5, 20, 3.5, 20, 3.5, 20, 3.5, 20]t。步骤2:将与每个msub相关的参数分组。利用ism,为这个滤波器设计了四个msub。相反,这四个msub(msub1、msub2、msub3和msub4)与优化后的参数对齐。msub1的特征参数集为[l11, l2, εr1, h1]t。msub2的参数为[s04, εr2, h2]t。msub3的特征参数为[l22, s03, εr3, h3]t,而msub4使用[s02, εr4, h4]t。结果 xc 为[l11, l2, εr1, h1, s04, εr2, h2, l22, s03, εr3, h3, s02, εr4, h4]t。b. 定义参数限制和数据点在进行了有助于识别需要更多数据点的参数的敏感性分析后,下一步是定义参数限制和数据点。测试了不同的数字,但选定的界限和维度对sm中的pe产生了最有效的结果。步骤4:定义参数限制和数据点。每个msub的尺寸和参数范围如下:msub1的尺寸为[12×10×5×5]t,值为[720, 100, 1.5, 5]t至[920, 195, 6.5, 30]t。msub2的尺寸为[10×10×5]t,范围为[45, 1.5, 5]t至[95, 6.5, 30]t。msub3的尺寸为[14×10×5×5]t,限制为[725, 45, 1.5, 5]t至[925, 75, 6.5, 30]t。同样,msub4的尺寸为[10×5×5]t,范围为[10, 1.5, 5]t至[55, 6.5, 30]t。c.敏感性分析在优化x0c之后,下一步是对x和xp进行敏感性分析,以实施ism技术。计算了精确中心、上限和下限值的mse。本文用于ism技术的滤波器结构的定量分析结果显示在表5中。步骤3:对这种滤波器的分组参数进行敏感性分析,以识别需要更多数据点的参数。d. 数据集生成和cnn模型开发本节描述了所提出方法的第5步和第6步。步骤5:为与每个msub相关的参数生成数据集。步骤6:为每个msub开发cnn模型。在这种结构中,需要注意的是,对于每个msub,在101个频率点采样的|s11|和|s21|与x值一起作为预测xp的cnn输入。同样,在101个频率点采样的|s11|和|s21|与xp值一起作为预测x的输入参数。对于四个msub,生成了四个不同的数据集,总共有四个数据集。在每个msub中使用了两个cnn模型,因此在ism优化过程中共有八个cnn模型。这些数据集使用cnn模型处理,包括五个卷积层(16、32、64、64、16)和大小为5的1d核。此外,网络还包括四个全连接神经元层,分别包含64、32和16个神经元。e. ism技术中的决策过程在训练后,我们使用cnn进行ism循环中的pe。如果它们的预测不准确,我们扩大参数限制并添加更多数据点,然后重新训练。我们重复此过程,直到模型达到pe所需的准确性。ism方法[40][41][42]是一种鲁棒的sm形式。它使用一个运行速度快但精度较低的粗糙模型来构建替代模型。形式上,粗糙模型为rc:x×xp →rm,其中rm是m维输出空间。x是设计变量空间,xp是预分配参数空间。我们用x∈x表示设计变量向量,用xp∈xp表示预分配参数。 提出方法的最后一步,即第6步,涉及在asm框架内实施开发的cnn模型进行pe。这些训练有素的模型用于pe。仿真结果显示在图4中,收敛在第三次迭代时实现。asm迭代中提取的值在表3中呈现。图4显示了迭代后的发夹滤波器响应,(a) xc*的响应(红色)和xf1的响应(蓝色);(b) xc*的响应(红色)和xf3的响应(蓝色)。表3显示了发夹滤波器结构的asm迭代。f. 使用asm技术的cnn模型的鲁棒性本节描述了用于asm技术的cnn模型的鲁棒性。这里的鲁棒性指的是单个训练有素的cnn模型在不同f0和%bw值下执行可靠pe的能力,而无需重新训练。为了确保这一点,选择了覆盖最低和最高f0和%bw值的训练参数,以便涵盖该范围内的任何操作点。结果参数界限p1–p4、pmin和pmax定义了足够宽的设计空间以实现鲁棒操作。具体来说,p1和p2代表指定几何参数在两个不同f0和%bw组合下的上界值,pmin和pmax分别表示所有考虑的f0和%bw范围内的参数的最小值和最大值。这些参数确保参数空间足够宽,可以覆盖设计规格内的所有可能变化。表4显示了微波滤波器设计中asm技术的鲁棒性考虑因素。对于发夹滤波器,鲁棒性在多个操作点(f0=2.3–2.5 ghz, bw=2.1%–3.1%)上进行了评估。在模拟的频率范围内,使用|S11|量化了响应级别的鲁棒性,得到的平均绝对误差(MAE)约为1.0%–1.8%,介于CNN提取的粗糙(初始)响应和最终收敛响应之间。最初为发夹结构设计的CNN模型被应用于相同数据集中的新的f0和%BW值(f0 = 2.3 ghz和bw=2.1%)。尽管有这种变化,模型在PE方面表现出色,如其在x3f = [357.722, 377.748, 3.746, 39.727]t处的收敛所示。图5显示了这种收敛的图形表示,相应的mae约为1.3%。cnn模型使用生成的粗糙模型数据集训练一次,在asm迭代期间不需要重新训练;相反,在每次迭代中,cnn模型替代了传统的pe。第三节. 使用ism技术的提出的滤波器设计图6说明了ism设计方法的流程图,以下部分将进一步详细说明。使用ism技术的提出的滤波器设计方法包括以下步骤:步骤1:执行pe以确定滤波器响应的设计参数(x)和f0及%bw。步骤2:将与每个微带基板(msub)相关的参数分组,这是ads软件特有的组件模型。步骤3:对设计参数(x)和与每个msub相关的预分配参数(xp)进行敏感性分析。步骤4:定义参数限制和数据点。步骤5:为每个msub创建数据集。步骤6:为每个msub开发cnn模型。图6显示了使用ism方法的提出的滤波器设计流程图。a. 与每个msub相关的参数分组我们在一个四极准椭圆形滤波器上展示了ism工作流程,该滤波器设计用于f0=1 ghz和bw=4%。准椭圆形结构的EM布局如图7所示。步骤1:与x相关的参数包括[L11, l2, s04, l22, s03, s02]t,而与xp=[εr2, h2, εr3, h3, εr4, h4, εr5, h5]t相关的参数包括[819.036, 106.556, 54.176, 829.678, 48.210, 31.274]t和[xp=[3.5, 20, 3.5, 20, 3.5, 20, 3.5, 20]t。步骤2:将与每个msub相关的参数分组。利用ism,为这个滤波器设计了四个msub。相反,这四个msub(msub1、msub2、msub3和msub4)与优化后的参数对齐。msub1的特征参数集为[l11, l2, εr1, h1]t。msub2的参数为[s04, εr2, h2]t。msub3的特征参数为[l22, s03, εr3, h3]t,而msub4使用[s02, εr4, h4]t。结果 xc 为[l11, l2, εr1, h1, s04, εr2, h2, l22, s03, εr3, h3, s02, εr4, h4]t。b. 定义参数限制和数据点在进行了有助于识别需要更多数据点的参数的敏感性分析后,下一步是定义参数限制和数据点。测试了不同的数字,但选定的界限和维度对sm中的pe产生了最有效的结果。步骤4:定义参数限制和数据点。每个msub的尺寸和参数范围如下:msub1的尺寸为[12×10×5×5]t,值为[720, 100, 1.5, 5]t至[920, 195, 6.5, 30]t。msub2的尺寸为[10×10×5]t,范围为[45, 1.5, 5]t至[95, 6.5, 30]t。msub3的尺寸为[14×10×5×5]t,限制为[725, 45, 1.5, 5]t至[925, 75, 6.5, 30]t。同样,msub4的尺寸为[10×5×5]t,范围为[10, 1.5, 5]t至[55, 6.5, 30]t。c.敏感性分析在优化x0c之后,下一步是对x和xp进行敏感性分析,以实施ism技术。计算了精确中心、上限和下限值的mse。本文用于ism技术的滤波器结构的定量分析结果显示在表5中。步骤3:对这种滤波器的分组参数进行敏感性分析,以识别需要更多数据点的参数。d. 数据集生成和cnn模型开发本节描述了所提出方法的第5步和第6步。步骤5:为与每个msub相关的参数生成数据集。步骤6:为每个msub开发cnn模型。在这种结构中,需要注意的是,对于每个msub,在101个频率点采样的|s11|和|s21|与x值一起作为预测xp的cnn输入。同样,在101个频率点采样的|s11|和|s21|与xp值一起作为预测x的输入参数。对于四个msub,生成了四个不同的数据集,总共有四个数据集。在每个msub中使用了两个cnn模型,因此在ism优化过程中共有八个cnn模型。这些数据集使用cnn模型处理,包括五个卷积层(16、32、64、64、16)和大小为5的1d核。此外,网络还包括四个全连接神经元层,分别包含64、32和16个神经元。e. ism技术中的决策过程在训练后,我们使用cnn进行ism循环中的pe。如果它们的预测不准确,我们扩大参数限制并添加更多数据点,然后重新训练。我们重复此过程,直到模型达到pe所需的准确性。ism方法[40][41][42]是一种鲁棒的sm形式。它使用一个运行速度快但精度较低的粗糙模型来构建替代模型。形式上,粗糙模型为rc:x×xp>?。当精细模型响应rf(xnf)在由?定义的误差范围内与粗糙模型响应rc(x?c)紧密匹配时,过程结束,表示优化成功并收敛。e. 提出方法的最后一步,即第6步,涉及在asm框架内实施开发的cnn模型进行pe。这些训练有素的模型用于pe。仿真结果显示在图4中,收敛在第三次迭代时实现。asm迭代中提取的值在表3中呈现。图4显示了迭代后的发夹滤波器响应,(a) xc*的响应(红色)和xf1的响应(蓝色);(b) xc*的响应(红色)和xf3的响应(蓝色)。表3显示了发夹滤波器结构的asm迭代。f. 使用asm技术的cnn模型的鲁棒性本节描述了用于asm技术的cnn模型的鲁棒性。这里的鲁棒性指的是单个训练有素的cnn模型在不同f0和%bw值下执行可靠pe的能力,而无需重新训练。为了确保这一点,选择了覆盖最低和最高f0和%bw值的训练参数,以便涵盖该范围内的任何操作点。结果参数界限p1–p4、pmin和pmax定义了足够宽的设计空间以实现鲁棒操作。具体来说,p1和p2代表指定几何参数在两个不同f0和%bw组合下的上界值,pmin和pmax分别表示所有考虑的f0和%bw范围内的参数的最小值和最大值。这些参数确保参数空间足够宽,可以覆盖设计规格内的所有可能变化。表4显示了微波滤波器设计中asm技术的鲁棒性考虑因素。对于发夹滤波器,鲁棒性在多个操作点(f0 = 2.3–2.5 ghz, bw = 2.1%–3.1%)上进行了评估。在模拟的频率范围内,使用|s11|量化了响应级别的鲁棒性,得到的平均绝对误差(mae)约为1.0%–1.8%,介于cnn提取的粗糙(初始)响应和最终收敛响应之间。最初为发夹结构设计的cnn模型被应用于相同数据集中的新的f0和%bw值(f0 = 2.3 ghz和bw = 2.1%)。尽管有这种变化,模型在pe方面表现出色,如其在x3f = [357.722, 377.748, 3.746, 39.727]t处的收敛所示。图5显示了这种收敛的图形表示,相应的mae约为1.3%。cnn模型使用生成的粗糙模型数据集训练一次,在asm迭代期间不需要重新训练;相反,在每次迭代中,cnn模型替代了传统的pe。第三节. 使用ism技术的提出的滤波器设计图6说明了ism设计方法的流程图,以下部分将进一步详细说明。使用ism技术的提出的滤波器设计方法包括以下步骤:步骤1:执行pe以确定滤波器响应的设计参数(x)和f0及%bw。步骤2:将与每个微带基板(msub)相关的参数分组,这是ads软件特有的组件模型。步骤3:对设计参数(x)和与每个msub相关的预分配参数(xp)进行敏感性分析。步骤4:定义参数限制和数据点。步骤5:为每个msub创建数据集。步骤6:为每个msub开发cnn模型。图6显示了使用ism方法的提出的滤波器设计流程图。a. 与每个msub相关的参数分组我们在一个四极准椭圆形滤波器上展示了ism工作流程,该滤波器设计用于f0 = 1 ghz和bw = 4%。准椭圆形结构的em布局如图7所示。步骤1:与x相关的参数包括[l11, l2, s04, l22, s03, s02]t,而与xp = [εr2, h2, εr3, h3, εr4, h4, εr5, h5]t相关的参数包括[819.036, 106.556, 54.176, 829.678, 48.210, 31.274]t和[xp = [3.5, 20, 3.5, 20, 3.5, 20, 3.5, 20]t。步骤2:将与每个msub相关的参数分组。利用ism,为这个滤波器设计了四个msub。相反,这四个msub(msub1、msub2、msub3和msub4)与优化后的参数对齐。msub1的特征参数集为[l11, l2, εr1, h1]t。msub2的参数为[s04, εr2, h2]t。msub3的特征参数为[l22, s03, εr3, h3]t,而msub4使用[s02, εr4, h4]t。结果 xc 为[l11, l2, εr1, h1, s04, εr2, h2, l22, s03, εr3, h3, s02, εr4, h4]t。b. 定义参数限制和数据点在进行了有助于识别需要更多数据点的参数的敏感性分析后,下一步是定义参数限制和数据点。测试了不同的数字,但选定的界限和维度对sm中的pe产生了最有效的结果。步骤4:定义参数限制和数据点。每个msub的尺寸和参数范围如下:msub1的尺寸为[12×10×5×5]t,值为[720, 100, 1.5, 5]t至[920, 195, 6.5, 30]t。msub2的尺寸为[10×10×5]t,范围为[45, 1.5, 5]t至[95, 6.5, 30]t。msub3的尺寸为[14×10×5×5]t,限制为[725, 45, 1.5, 5]t至[925, 75, 6.5, 30]t。同样,msub4的尺寸为[10×5×5]t,范围为[10, 1.5, 5]t至[55, 6.5, 30]t。c.敏感性分析在优化x0c之后,下一步是对x和xp进行敏感性分析,以实施ism技术。计算了精确中心、上限和下限值的mse。本文用于ism技术的滤波器结构的定量分析结果显示在表5中。步骤3:对这种滤波器的分组参数进行敏感性分析,以识别需要更多数据点的参数。d. 数据集生成和cnn模型开发本节描述了所提出方法的第5步和第6步。步骤5:为与每个msub相关的参数生成数据集。步骤6:为每个msub开发cnn模型。在这种结构中,需要注意的是,对于每个msub,在101个频率点采样的|s11|和|s21|与x值一起作为预测xp的cnn输入。同样,在101个频率点采样的|s11|和|s21|与xp值一起作为预测x的输入参数。对于四个msub,生成了四个不同的数据集,总共有四个数据集。在每个msub中使用了两个cnn模型,因此在ism优化过程中共有八个cnn模型。这些数据集使用cnn模型处理,包括五个卷积层(16、32、64、64、16)和大小为5的1d核。此外,网络还包括四个全连接神经元层,分别包含64、32和16个神经元。e. ism技术中的决策过程在训练后,我们使用cnn进行ism循环中的pe。如果它们的预测不准确,我们扩大参数限制并添加更多数据点,然后重新训练。我们重复此过程,直到模型达到pe所需的准确性。ism方法[40][41][42]是一种鲁棒的sm形式。它使用一个运行速度快但精度较低的粗糙模型来构建替代模型。形式上,粗糙模型为rc:x×xp →rm,其中rm是m维输出空间。x是设计变量空间,xp是预分配参数空间。我们用x∈x表示设计变量向量,用xp∈xp表示预分配参数。>在这 fine 模型中,这些预先分配的参数是固定的,但在 coarse 模型中,我们可以调整 xpto 以使其响应与 fine 模型匹配。根据 (1),在 ISM 的背景下,表达式被修改如下 [43]:xip=arg minxp∣∣∣∣Rf(xi)?Rc(xi, xp)∣∣∣∣(4) 在这个方程中,Rf(xi) 表示 fine 模型对当前设计变量 xi 的响应,而 Rc(xi, xp) 表示 coarse 模型在当前设计变量和调整后的预先分配参数 xp 下的响应。当收敛时,ISM 迭代会停止,如 ∥Rf(xn)?Rc(xnc)∥ 所示 (5) 收敛发生在 fine 模型和 coarse 模型在当前迭代中的响应差异小于阈值 ? 时。值得注意的是,在 ism 技术中,每次迭代时,xn=xnf,表示 fine 模型参数被设置为与 coarse 模型参数匹配。 f. 结果 所提出方法的最后一步,即步骤 7,涉及实施为 pe 开发的 cnn 模型。步骤 7:这些 cnn 模型用于 pe,在第四次迭代时收敛,得到最终的参数向量 xc4=[845.910, 133.125, 80.740, 856.328, 45.479, 28.566, 5.500, 10.798, 3.670, 21.696, 5.486, 17.836, 3.284, 18.869]。图 8 展示了初始和最终迭代的仿真结果。图 8. 准椭圆滤波器的两个传输零点的响应:(a) xx0cc(红色和蓝色)的响应和 xx0ff(黑色和绿色)的响应;(b) xx4cc(红色和蓝色)的响应和 xx4ff(黑色和绿色)的响应。 g. 使用 ism 技术进行微波滤波器设计的 cnn 模型的鲁棒性 我们对这些模型进行了全面测试,以验证为准椭圆滤波器设计的 cnn 的鲁棒性。具体来说,这些模型被用于解决 f0=0.98 ghz 和 bw=3.6% 的滤波器要求。在这种情况下,严格的标准 |s21| < -20 db 被应用于两个不同的频率范围:0.9 ghz 到 0.95 ghz 和 1.01 ghz 到 1.10 ghz。为了评估 ism 中的鲁棒性,表 6 显示了最低 f0 和最低 %bw 之间的范围,以及最高 f0 和最高 %bw 之间的范围。因此,在此范围内选择的任何 f0 和 %bw 都将在最低和最高参数值之间。p1–p4、pmin 和 pmax 的含义与第 ii-f 节中描述的相同。对于使用 ism 技术的准椭圆滤波器,鲁棒性在多个工作点(f0=0.95–1.05 ghz, bw=2.3%–5.3%)进行了评估。在模拟的频率网格上,使用 |s11| 和 |s21| 定量化了响应级别的鲁棒性,得到的 mae 分别约为 2.1%–3.1% 和 4.1%–6.6%,分别在 cnn 提取的粗糙(初始)和最终收敛的响应之间。图 8 中观察到的相应 mae 值大约为 |s11| 的 2.3% 和 |s21| 的 4.2%。表 6 显示了微波滤波器设计中 ism 技术的鲁棒性考虑因素。在第三次迭代的最后,获得了值 x3=[881.181, 150.707, 62.390, 892.354, 48.841, 30.970]t,成功满足了规定要求。这种稳健的性能也反映在相应的 xp 值中:x3p=[5.190, 17.621, 3.525, 22.076, 1.637, 18.749, 3.431, 18.700]。设计规格的最终响应显示在图 9 中,|s11| 的 mae 大约为 2.5%。图 9. 在 f0=0.98 ghz 和 bw=3.6% 时准椭圆滤波器结构的响应:xx3ff(红色和蓝色)的响应。 h. 关于 ism 目标域的讨论 在研究中采用 ism 技术的一个主要考虑因素是它适用于满足带外 |s21| 目标规范。为此,我们提出了一种称为目标域的过程,这是一个在此研究中引入的概念,用于根据特定的滤波器性能目标指导 pe。目标域代表了 |s21| 响应的转换版本,简化了识别应满足某些规格的频率范围的步骤。这种转换在模型训练之前完成。在参数扫描阶段,收集 |s21| 响应,并将每个频率点与期望的规格进行评估。转换规则如下:如果频率处的 |s21| 值满足带外抑制规范,则分配值为 1;如果 |s21| 值不满足规范,则分配值为 0。在通带内的频率,如果抑制规范不是问题,则标记为“无关紧要”,并分配值 -1。“无关紧要”的指定表示在这些频率上不必满足特定的抑制标准。将 |s21| 数据转换为目标域后,得到的值被放入一个新的列中,与相应的 xp 并列。然后使用这个组合数据集来训练 cnn 模型来预测 x。目的是使模型学会转换后的频域信息与影响滤波器响应的参数之间的关系。训练完成后,cnn 模型应用于新数据。在这一阶段,模型使用目标域表示的 |s21|,单独或与原始 |s11| 数据一起,来预测必要的设计参数。在实施过程中,|s21| 响应受到目标域目标的约束,这作为预测 xp 和 x 的基础。这种方法确保模型专注于实现所需的带外抑制性能,同时忽略非关键频率范围,从而提高预测准确性和设计效率。这种方法对于在 cnn 训练前的数据准备期间定义的预定义目标特别有益。然而,为了开发适用于所有频率的稳健 cnn 模型,新的 |s21| 特征被构建为将满足指定标准的值设置为 1,而其他值设置为 0。例如,如果阈值设为 ?20 db,则任何低于 ?20 db 的数据点都被分配为 1,而高于该阈值的值被指定为 0。这个包含过滤和定义的 |s21| 值的精炼特征集成为 cnn 模型的一个重要特征。将此特征与 xp 数据集集成后,cnn 模型变成了一个稳健的预测工具,特别适用于低于 -20db 阈值的 pe 目标。此外,第二种方法应用于具有两个传输零点的准椭圆结构,具体设计规范如下:|s21| 需要在 0.9 ghz 到 0.96 ghz 的频率范围内以及 1.03 ghz 到 1.10 ghz 的频率范围内显示低于 ?20 db 的值。在这种方法中,符合规定设计规范的 |s11| 和新派生的 |s21| 与 xp 结合在一起。然后使用这些数据集作为输入到 cnn 模型中以预测 x。值得注意的是,到第三次迭代结束时,设计规范得到了成功满足,得到的值为 x3=[843.596, 124.481, 56.646, 856.428, 42.831, 28.818]。图 10 可视化了这一过程的结果。图 10. 准椭圆滤波器响应及其目标:(a) xx0cc(黑色和棕色)的响应和 xx0ff(红色和蓝色)的响应;(b) xx3ff(红色和蓝色)的响应。给定的规范定义了所需的带外抑制和通带传输水平。然而,如果我们希望在特定频率点引入传输零点,可以通过定义一个额外的目标域来实现这一点。这涉及到在期望的传输零点位置创建 |s21| 的第二次转换,并设置更严格的衰减阈值。通过结合这个精炼的目标域,我们可以使用相同的数据集重新训练 cnn 模型,使其在学习额外约束的同时保留之前的优化知识。这种方法确保模型不仅满足原始的带外抑制和通带要求,还能精确地定位传输零点,从而提高滤波器的选择性和性能。 iv. 时间分析 在这项研究中,离线成本包括在优化之前执行的一次 coarse 模型数据生成和 cnn 训练,而在线成本包括在 asm 和 ism 迭代期间执行的基于 cnn 的 pe 和 fine 模型 em 模拟。我们通过计时每个阶段来比较基于 cnn 的工作流程和传统的电路优化方法:tx?c(起点提取)、tsa(灵敏度分析)、tdg(数据生成)、tdp(数据处理)、tt(cnn 训练)、tpe(参数提取;当需要时分为预测 xx 的模型、设计变量向量 xp 和预先分配的参数向量 xp)以及 tem(em 模拟)。对于 ism,tpe 对两种方法都是共同的;tsa 和 td 可以忽略(通常 <1 秒)。我们还报告了 tpe1(一个滤波器的总 pe 时间)和 tpe4(频率范围内四个滤波器的总 pe 时间)。节省时间的因素是 fts1=Ttradpe1/TCNNpe1 和 fts4=Ttradpe4/TCNNpe4(值> 1 表示 CNN 方法更快)。“NA” 标记了不适用于传统方法的条目。表 7 总结了所有时间分析。表 7 在微波滤波器设计中 CNN 模型实现和传统 PE 方法的时间比较。所有时间都是在 11th 代 Intel Core i5-1135G7、64 位操作系统、16 GB RAM 的系统上测量的。tx?c 和 tem 对两种方法都是相同的;优势来自 PE/优化。随着数据集的增长,tt 会增加,但由于基于 CNN 的 PE 更快,总时间仍然会减少。对于多个设计,优势显著:Fts4 对于发夹结构约为 10.7,对于准椭圆结构约为 8.0。总体而言,CNN 方法在单滤波器和多滤波器情况下都减少了 PE 时间,同时保持了共享阶段的可比性,显示出稳健和可扩展的速度提升。ASM 和 ISM 原则上都可用于某些滤波器设计问题。在这项研究中,对于主要由 f0 和 %BW 要求定义的问题,推荐使用 ASM,其中反射特性占主导地位,参数集较少。对于涉及反射和传输响应的更复杂的滤波器规格,例如需要显式控制耦合效应或通过同时使用 |S11| 和 |S21| 来控制传输零点的设计,推荐使用 ISM。因此,当适用时,ASM 提供了一个更简单且计算效率更高的选项,而 ISM 为更苛刻的设计目标提供了更大的建模灵活性。
V. 结论
本研究提出了一种基于 CNN 的技术在 SM 框架内的 PE 方法,与传统的电路模型优化方法相比,显著减少了计算时间。通过将 CNN 模型集成到 ASM 和 ISM 技术中,该方法在各种滤波器设计中展示了显著的时间节省能力。以发夹结构为例,单个滤波器设计的 Fts1 为 2.7,而在生成的频率范围内设计四个滤波器时,Fts4 达到了 10.7,其他滤波器设计也观察到了类似的改进。这种方法的一个关键优势是使用小数据集进行训练,通过灵敏度分析和精心选择代表性数据点来实现。这确保了模型轻量且有效,准确地捕捉了滤波器响应、几何参数和预先分配变量之间的关系。模型的鲁棒性使它们能够在不重新训练的情况下应用于不同的 f0 和 %BW 值,从而简化了优化过程。总体而言,这项研究突出了机器学习在解决传统电路模型优化方法的耗时挑战方面的潜力,实现了更快的设计迭代和现代工程工作中复杂任务的可扩展解决方案。未来的一个重要方向是开发基于 CNN 的框架,这些框架明确解决了 SM 优化中 PE 解决方案的非唯一性问题。?>