基于生成式人工智能的多维数据建模方法，用于生成具有变异性特征的合成电特性数据，适用于互补型场效应晶体管（Complementary Field-Effect Transistors）

《Expert Systems with Applications》：Generative AI Driven Multi-Dimensional Data Modeling for Variability Aware Synthetic Electrical Characteristics Generation in Complementary Field-Effect Transistors

【字体：大中小】 时间：2026年05月11日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　Sagarika Dash | Yiming Li 国家阳明交通大学平行与科学计算实验室，1001 Ta-Hsueh Rd., 新竹，300093，台湾 **摘要** 生成式人工智能（Gen AI）已成为解决半导体器件研究中数据稀缺和计算挑战的一种变革性范式。现代半

　　Sagarika Dash | Yiming Li
国家阳明交通大学平行与科学计算实验室，1001 Ta-Hsueh Rd., 新竹，300093，台湾

**摘要**
生成式人工智能（Gen AI）已成为解决半导体器件研究中数据稀缺和计算挑战的一种变革性范式。现代半导体设计依赖于高质量的大规模器件数据的可用性。这一需求难以满足，因为三维数值模拟和实验测量在计算上非常复杂且耗时。为应对这一挑战，本研究提出了一个生成式AI框架，用于高效且可扩展地生成合成数据，以分析先进纳米尺度器件中的工艺变异效应。该框架采用混合条件GAN架构，其中基于LSTM的生成器用于捕捉序列依赖性，而1D-CNNdiscriminator则确保生成数据的局部结构真实性。所提出的对抗性框架能够高保真地生成在不同工艺变化下的堆叠纳米片CFET的电学特性。实验结果表明，合成数据与模拟数据之间存在高度一致性，这一点通过误差指标、对抗性损失以及使用主成分分析（PCA）和t分布随机邻居嵌入（t-SNE）进行分布分析得到了验证。在所有评估指标中，该框架的平均误差率约为0.5%，证实了生成数据的真实性和可靠性。我们还对传统的均匀GAN架构与所提出的混合模型进行了比较分析，结果表明混合设计的性能更优越，这一点通过单调性评估、最近邻距离和回归指标得到了验证。所提出的框架为下一代半导体器件的变异分析和设计探索提供了高效可靠的数据驱动解决方案。

**1. 引言**
为了维持摩尔定律，半导体器件不断向亚1纳米技术节点缩小，从而在器件密度、速度和能源效率方面取得了显著提升。然而，这种激进的缩放加剧了短沟效应、寄生电容和漏电流问题，这是由于电静力栅极控制的减弱（Huang等人，2020年）。为了解决这些限制，全栅（GAA）晶体管架构已成为下一代逻辑和存储器器件的有力候选者（Kola, Li, & Butola, 2024年）。GAA器件使用纳米线（NW）或纳米片（NS）通道实现，与FinFET相比提供了更好的电静力控制和可扩展性，从而在更低功耗下实现了更高的性能（Chou & Li, 2025年）。特别是基于NS的GAA晶体管具有更宽的有效通道宽度、更高的驱动电流，从而在深度缩放下提高了开启电流（ION）、更陡的亚阈值斜率以及更好的电静力完整性（Nagy等人，2020年）。扩展GAA概念后，互补场效应晶体管（CFET）架构在一个鳍片中垂直堆叠n-FET和p-FET器件，显著减少了横向器件间距，并通过设计技术协同优化提高了面积效率和逻辑密度。这种紧凑的3D集成方案被认为是亚1纳米技术节点的一个有前途的解决方案。在CFET配置中，基于NS的实现相比基于纳米线的实现具有更高的驱动电流、更好的亚阈值性能以及在类似制造条件下的更大设计灵活性（Li, Zhao, Lu, & Zhang, 2023年）。尽管有这些优势，CFET架构在高级节点引入了显著的变异挑战。纳米片几何形状、栅极长度和金属功函数的变化日益影响器件性能和产量，其中功函数波动（WKF）和随机掺杂波动（RDF）是变异的主要来源（Kola & Li, 2025年）。这些效应导致关键指标（如阈值电压（VTH）、开启电流（ION）和关断电流（IOFF）的波动，降低了电路可靠性。因此，准确建模这些工艺变异效应（PVEs）至关重要。虽然3D数值器件模拟提供了详细的物理洞察（Kola & Li, 2023年），但其高昂的计算成本使得大规模统计分析不切实际，从而催生了更高效建模方法的需求。

尽管取得了这些进展，大多数基于机器学习（ML）的方法仍依赖于需要大量标记数据的监督学习方法，并且仅限于在已知数据分布范围内的插值。它们无法为训练集中未明确涵盖的场景有效生成新的、真实的器件数据。为了克服这些限制，ML最近成为传统器件建模的强大数据驱动替代方案（Chen, Sacchi, Dey, Blanco, Halder, Leray, Gendt, 2024年; Dash, Li, Sung, 2023a; Dash, Li, Sung, 2023b）。ML技术能够学习输入工艺参数与输出电学特性之间的复杂非线性关系，从而无需昂贵的计算模拟即可快速准确地预测器件行为。多项研究证明了ML在分析纳米尺度晶体管中的工艺变异效应（PVEs）以及预测变异条件下的器件特性方面的有效性（Butola, Li, Kola, 2023a; Butola, Li, Kola, Akbar, Chuang, 2023c; Mitard, Kocak, Chiarella, Sheng, Demuyck, Horiguchi, 2025; Yang, Li, Kola, 2023; Zhu, Ding, Tao, Zhao, Tang, Zhang, Lu, Yu, 2023）。然而，大多数基于ML的方法仍然依赖于需要大量标记训练数据的监督学习方法。在半导体器件建模中，获取此类数据集具有挑战性，因为器件模拟和实验测量在计算上非常复杂且耗时。为了减少对大型数据集的依赖，我们之前的工作探索了迁移学习技术的应用（Dash & Li, 2025年）。迁移学习使得可以从源数据集获取的知识转移到相关目标任务中，从而减少训练所需的数据量。不过，这种方法只有在存在具有相似特征分布的多个数据集时才有效。在实际的半导体器件建模场景中，这样的可比数据集往往很少，这限制了迁移学习的适用性。

为解决这一限制，生成对抗网络（GAN）已成为数据驱动建模中的变革性解决方案。GAN是一类ML框架，在生成式人工智能中成为主流方法，通过让两个神经网络在对抗过程中相互竞争来学习和生成真实数据（Goodfellow等人，2020年）。据我们所知，本研究提出了首个基于cGAN的建模框架，用于分析和生成GAA Si NS CFET的合成ID?VG特性。所提出的架构包括一个基于LSTM的生成器和一个基于1D-CNN的discriminator。LSTM生成器有效捕捉了ID?VG特性中的序列依赖性和时间相关性，而CNN discriminator则提取局部空间特征来区分真实器件数据和合成样本。在训练过程中，生成器接收基于PVE参数的随机噪声向量以生成合成ID?VG曲线，而discriminator学习将这些样本分类为真实或合成。这种对抗性学习过程使模型能够学习工艺参数与器件响应之间的复杂非线性映射。由于生成器基于PVE标签进行条件化，所提出的框架被构建为一个条件GAN（Chrysos, Kossaifi, & Zafeiriou, 2020年）。使用一系列全面的统计、基于回归和特定于GAN的指标评估了所提框架的性能，以评估生成器件数据的真实性和准确性。统计评估包括相对标准差（RSD）（Chatfield, Marquart-Wilson, Dobson, & Farewell, 2025年）、Kullback-Leibler（KL）散度（Pérez-Cruz, 2008年）和Wasserstein距离（Panaretos & Zemel, 2019年），以量化真实数据和合成数据分布之间的相似性。基于回归的误差指标用于评估预测准确性，而额外的GAN特定指标用于验证模型的生成能力和稳定性。此外，还将模拟和生成的ID?VG曲线一起绘制出来，以直观检查它们的对齐情况，证明所提框架的有效性。我们还分析了所提框架所需的计算时间与传统3D器件模拟的比较，以展示在半导体行业中采用Gen AI的实际好处。结果表明，基于Gen AI的数据生成显著减少了模拟时间和计算资源需求。此外，生成高质量合成数据的能力有效缓解了物理约束器件建模中的数据稀缺问题。

**本研究的主要贡献总结如下：**
• 提出了一种基于条件生成对抗网络的新型生成式人工智能框架，用于在多维工艺变异效应下生成具有变异意识的合成ID?VG特性的互补场效应晶体管，实现了具有变异意识的合成数据生成。
• 在cGAN框架中设计了一种混合LSTM-CNN架构，其中基于LSTM的生成器捕捉来自序列器件特性的时间依赖性，而基于CNN的discriminator确保生成数据的结构一致性和统计真实性。
• 所提出的生成框架引入了基于物理意义工艺参数的多维条件化方案，使模型能够学习复杂的变异效应。
• 集成了包括统计、物理感知和视觉评估在内的全面验证框架，如误差评估、相关性分析和降维，证实生成数据准确保留了关键电学特性和变异指标，包括VTH、ION和IOFF。
这种将生成式AI与半导体器件建模相结合的方法为亚1纳米CFET技术的变异感知设计、快速技术协同优化和高效性能预测提供了新的途径。后续章节将提供详细讨论。

本文主要旨在展示基于cGAN的生成式AI方法生成合成数据样本的有效性。文章结构如下：第2节回顾了GAN在各种平台的应用相关研究。第3节详细描述了GAA Si NS CFET的器件结构。第4节介绍了生成式AI概念以及GAN和cGAN算法。第5节讨论了数据探索，并描述了所提出的cGAN模型。第6节讨论了不同类别的评估方法。第7节详细分析和讨论了使用所提方法获得的结果。最后，第8节总结了本文并概述了未来的研究方向。

**2. 文献综述**
机器学习和深度学习（DL）模型本质上是数据驱动的，需要大型、多样的数据集才能实现稳健和泛化的预测。然而，在半导体领域，通过3D数值模拟获取此类数据集仍是一个主要瓶颈，因为每次模拟在计算上都非常昂贵且耗时。为了解决这一挑战，许多研究探索了基于AI和ML的技术来减少3D数值模拟的时间和成本（Li, Wu, Rzepa, Karner, Xu, Wu, Wang, Yang, Luo, Wang, Li, 2025; Mamun, Pala, Shawkat, 2025）。在我们之前的工作中，我们也研究了先进的ML和DL方法来提高数据效率，使用显著更少的训练样本实现准确的器件级预测（Butola, Li, Kola, 2023b; Dash, Li, 2025）。这些现有的基于监督的机器学习方法主要用于输入参数与电学特性之间的确定性映射。尽管这些方法可以实现高预测准确性，但它们在生成多样化样本和捕获工艺诱导变异的完整统计分布方面的能力有限。因此，它们在大规模随机分析和具有变异意识的数据生成方面的效果较差，而这对于先进CFET器件的设计和优化至关重要。

因此，最近在Gen AI方面的进展为数据建模和合成引入了变革性范式。与依赖预定义分布假设的传统生成方法不同，基于Gen AI的GAN可以隐式学习复杂的高维数据分布并生成高度真实的合成样本。由于其强大的数据生成能力，GAN已成功应用于多个领域，包括图像合成和超分辨率（He, Zheng, Shen, Guo, Zhou, 2020; Liao, Huang, Zheng, Lu, 2022）、医学图像分析（Haritha, Babu, 2025; Inam, Kanwal, Hajjej, Alluhaidan, 2026; Yang, Xiang, Kong, Zhang, Yao, 2025）、自然语言处理（Ko?, ?zyurt, & Iantovics, 2025）、农业（Fu等人，2025）、材料设计（Dan等人，2020）、网络领域（Guo, Zhao, Lyu, & Zhao, 2025）以及一些工业应用（Zhang, Wang, Wang, Yuan, Wu, Kim, Bai, 2026a; Zhang, Li, Yang, Zhou, 2026b）。这些成功案例突显了GAN作为强大数据生成和增强框架的有效性，可以显著提升ML和DL模型的性能。

在半导体行业中，生成式AI主要被用于数据获取特别昂贵和耗时的应用中的合成数据生成。然而，现有的基于GAN的研究主要集中在基于图像的任务和分类任务上，如晶圆缺陷检测（Poniatowski等人，2025）、布局模式生成和光刻优化（Kareem, Kwon, & Shin, 2020）以及制造中的故障诊断（Fan & Chen, 2025）。虽然这些应用程序自然地与针对图像生成和模式识别优化的GAN架构相契合，但GAN在模拟设备级数值和序列数据（如ID-VG特性和工艺性能相关性）方面的潜力仍未得到充分探索。与此同时，半导体技术正从平面FET快速发展到诸如CFET等先进架构。这种演变增加了结构复杂性以及对工艺变化的敏感性，进一步加剧了数据稀缺性和建模挑战。在这种背景下，基于AI的建模对于高效的CFET设备设计和优化变得至关重要。基于GAN的生成建模通过同时解决两个关键挑战提供了有希望的途径：减轻3D数值设备仿真的计算负担，并缓解机器学习和深度学习模型的数据稀缺问题。GAN通过学习工艺参数与电气响应之间的内在关系，能够生成与真实设备行为高度一致的合成数据。这样的合成数据集通过保护数据隐私，同时显著减少了对大规模3D数值仿真的依赖性，从而提高了预测准确性和泛化能力。

在一些最近的研究中，AI和ML技术被应用于CFET设备建模。在(Butola等人，2023c)中，提出了一种基于LSTM的神经网络来预测工艺变化对GAA Si NS CFET电气特性的影响。类似地，在(Kola等人，2024)中使用了一个ANN模型来分析WKF和PVE的综合效应，而在(Butola等人，2023a)中则使用了一个动态加权ANN(DW-ANN)来研究PVE引起的性能下降。尽管这些方法显著提高了建模效率，但它们仍然受限于高质量3D数值设备仿真数据的可用性。

相比之下，当前的工作通过利用基于cGAN的生成建模来克服这些限制，提供了一个可扩展的、数据效率高的、与行业相关的解决方案。通过为先进的CFET设备生成真实的合成数据，这种方法在现实世界的半导体应用中提供了物理上的好处，包括降低仿真成本、提高资源效率、增强数据隐私以及加速设备设计周期。在下一节中，我们将讨论本研究中考虑的设备细节。

3. GAA Si NS CFET的结构
基于计算机辅助设计(TCAD)的3D数值半导体设备仿真是计算密集型的，需要深入的设备物理专业知识，这限制了高级设备建模研究的可扩展性和数据可用性。该框架为半导体建模和AI驱动的数据融合提供了互惠的好处，支持可扩展的设备分析，同时推进了基于物理的生成建模。相关的仿真细节可以在之前的工作(Kola等人，2024)中找到。GAA Si NS CFET和基线CMOS（带有独立的n-/p-FET）是按照IRDS 2021高性能技术规范设计的(Liu & Gaudiot, 2023)。这款双通道垂直堆叠的GAA Si NS CFET具有20nm的栅极长度LG、25nm的NS宽度和5nm的NS高度HNS。标称设备参数包括通道间的分离LSEP为10nm，n/p设备分离DSEP为20nm，源/漏极延伸长度Sext为5nm和Dext为5nm。通道和源/漏极区域的掺杂浓度分别为4.8×10^18 cm^-3和1×10^20 cm^-3。栅极堆栈由SiO2/HfO2/TiN组成，有效氧化层厚度(EOT)为0.6nm。设备仿真使用Intel? CFET测量数据进行了校准，以实现高保真度。校准包括调整WNS、HNS、TOX、源/漏极剖面、金属-栅极功函数、迁移率参数以及在使用非平衡格林函数方法验证的3D量子校正传输框架内的电子有效质量(Li, Chang, Lai, Chao, & Chen, 2015)。相同的建模框架也被用来模拟CFET工艺变化效应。根据(Li等人，2015)中的方法，六个关键设备参数LG、TOX、HNS、WNS、LSEP和DSEP进行了随机变化，生成了1000个设备样本。参数分布定义为LG为20±2nm，LSEP为10±1nm，WNS为25±2.5nm，HNS为5±0.5nm，Sext/Dext为5±0.5nm，TOX为0.6±0.06nm。对于每个设备，在VD值为0.05V和0.7V时模拟了ID-VG特性。阈值电压VTH是通过n-FET的5×10^-7A和p-FET的6.5×10^-7A恒定电流标准提取的。所有用于模型训练和验证的数据集都是使用基于物理的3D TCAD设备仿真在内部生成的，确保了数据的物理准确性和完全可控性，这是我们研究的基础输入。下一节将介绍基础算法，随后将详细描述所提出的框架。

4. GAN的基础
Goodfellow等人在(Goodfellow等人，2020)中提出了一种通过对抗过程估计生成模型的新方法，这种方法广泛被称为生成对抗网络(GAN)。如今，GAN已成为一种强大的深度学习框架，用于数据生成和分布学习。GAN由两个神经网络组成：生成器和鉴别器，它们以对抗的方式进行训练，其中生成器创建合成数据，而鉴别器评估其真实性。通过这种最小-最大博弈，GAN能够在没有明确假设的情况下学习复杂的、高维度的数据分布。为了进一步控制数据生成过程，条件GAN通过在生成器和鉴别器上添加辅助信息（如类别标签或设备参数）来扩展这一框架。这种条件设置允许有针对性和物理意义的数据合成，使得GAN和cGAN架构非常适合模拟半导体设备中的随机变化。在半导体领域，获取大量的仿真或实验数据在计算上非常昂贵，GAN提供了一种有前景的方法来增强数据集、加速建模工作流程并提高模型泛化能力。这使得GAN成为解决半导体设备建模和分析中数据稀缺性和高计算成本问题的宝贵工具。GAN的训练遵循生成器G和鉴别器D之间的双人最小-最大博弈，表示为：
在这里，方程(1)中，D旨在正确分类真实样本x和生成样本G(z)，而G学习生成能够欺骗D的真实数据。这种对抗优化使GAN能够在没有任何先验假设的情况下隐式地模拟真实数据分布。

为了增强数据生成的可控性，cGAN引入了一个额外的条件变量y，将目标函数修改为：
通过在方程(2)中加入条件变量y，cGAN允许生成符合特定类别或属性的数据，使其特别适用于有针对性的合成任务，例如基于类别条件的半导体设备数据生成。条件GAN模型的基本架构在图1中进行了说明。

下载：下载高分辨率图像(414KB)
下载：下载全尺寸图像
图1. 用于合成ID-VG数据的条件生成对抗网络架构。生成器接收一个随机噪声向量Z以及一个条件标签Y，并根据输入参数生成合成设备特性。鉴别器同时接收真实样本和生成样本以及相同的条件Y，并学习区分真实数据和合成数据。受GAN损失控制的对抗训练过程推动生成器和鉴别器达到平衡状态，确保生成的数据既真实又在统计上一致。

5. 提出的生成AI模型
5.1. 数据准备
数据在整个建模过程中起着核心作用。总共使用了1000个3D数值仿真设备样本来训练所提出的条件GAN模型，随后该模型被用来生成1000个合成设备样本。根据建模需求，可以增加合成样本的数量，但过多的数据生成可能会降低样本的多样性和质量。因此，在本研究中，生成的合成样本数量保持与真实的3D数值设备仿真样本数量相等，以确保数据的一致性和可靠性。六个PVE参数作为条件输入提供给生成器，相应的ID-VG特性作为输出目标生成。参数空间使用高斯分布策略进行采样，以确保覆盖所有变异条件。每个样本对应于在固定栅极电压点上离散化的ID-VG曲线。在训练之前，输入特征和输出特性都经过了预处理，以解决格式上的不一致性和数据集中的广泛动态范围问题。作为输入特征的工艺参数使用MinMax缩放进行归一化，以将其值限制在[0,1]范围内。漏极电流(ID)作为主要的输出和鉴别器的输入，其值在亚阈值区域特别小，而在超过阈值区域则变化较大。为了缓解这种不平衡并稳定模型训练，应用了对数变换，然后再进行归一化。预处理后，数据集变得适合建模。由于数据集规模有限，数据被分为80%的训练集和20%的测试集。测试集严格保留下来，仅用于最终评估，以确保对模型性能的无偏评估。没有使用单独的验证集，以避免进一步减少训练数据。相反，超参数是通过基于训练稳定性、收敛特性和训练过程中观察到的评估指标的网格搜索来选择的。由于TCAD仿真的计算成本很高，因此多维参数变化确保了捕捉先进半导体设备中关键变异性的足够多样性。所提出的生成框架的端到端工作流程包括TCAD数据生成、预处理、条件噪声整合、对抗模型训练、合成数据生成和全面评估，如图2所示。

在生成器中，随机噪声向量和条件PVE参数一起作为输入共同提供，以生成合成ID-VG特性。鉴别器接收1000个真实样本和1000个生成样本的连接作为输入。鉴别器通过计算生成器和鉴别器的对抗损失来评估合成数据的真实性。当生成器和鉴别器的损失不平衡时，在训练过程中迭代更新相应的网络，直到达到稳定的平衡状态，表明生成的合成设备特性既真实又在统计上一致。

5.2. 架构
5.2.1. 生成器
在我们提出的混合cGAN架构中，生成器G被设计为一个深度LSTM网络(Yu, Si, Hu, & Zhang, 2019)，它接受随机噪声Z和六个PVE参数p作为输入。选择基于LSTM的生成器的原因是它具有捕捉长程时间依赖性的强大能力，非常适合生成平滑、连续且物理意义强的ID-VG曲线。对于n-FET和p-FET设备采用不同的配置，是因为它们在载流子传输（电子与空穴迁移率）、阈值电压分布和电流幅度方面存在固有的物理差异。因此，它们的ID-VG特性在动态范围、斜率行为和非线性方面有所不同。为了确保稳定的训练和准确的建模，应用了设备特定的归一化和超参数调整。这些调整帮助模型更好地捕捉每种设备类型的独特统计和物理特性。n-FET的生成器架构由两个堆叠的LSTM层组成，分别有128个和64个单元，接着是一个有64个单元的密集层，以及一个有36个神经元的输出层，对应于36个栅极电压网格点。所有层使用双曲正切(tanh)激活函数，并采用正交核初始化器和L1L2核正则化。生成器使用均方误差损失函数进行训练，并采用Adam优化器（学习率=0.0015，优化器动量(β1)=0.5）。正交初始化器通过降低梯度消失的风险和提高收敛速度来帮助稳定训练过程，这一点尤其宝贵，因为生成对抗网络（GAN）的训练本质上是不稳定的且计算要求较高。p-FET生成器的设计与此类似，它包含两个分别拥有256个和128个单元的LSTM层，随后是一个拥有20个神经元的密集层和一个拥有36个神经元的输出层。隐藏层使用tanh激活函数，而输出层使用线性激活函数，同时保持相同的初始化和正则化策略。

5.2.2. 鉴别器
n-FET的鉴别器架构由三个层次的1D CNN网络组成（Purwono等人，2022年），其中一个卷积层后面跟着两个分别拥有64个、32个和6个神经元的全连接层。输出层包含一个神经元，用于生成二进制决策，指示输入样本是真实的还是合成的。所有隐藏层都使用ReLU激活函数，而输出层使用Sigmoid激活函数。鉴别器采用与生成器网络相同的核初始化和正则化策略。鉴别器的损失通过均方误差（MSE）损失函数进行评估，学习率为0.002，β1=0.5。在GAN训练期间，首先训练生成器，同时固定鉴别器的权重，以实现对抗性最小-最大目标的稳定优化。随后，在GAN框架内联合训练生成器和鉴别器。对于这个对抗性训练阶段，n-FET和p-FET模型的MSE损失函数的学习率均为0.00015。两种设备之间的唯一架构差异在于生成器网络，如下所述。p-FET鉴别器的架构还包括一个拥有60个滤波器的卷积层，后面跟着两个分别拥有32个和16个神经元的密集层，以及一个与n-FET鉴别器相同的单神经元输出层。所有隐藏层使用ReLU激活函数，输出层使用Sigmoid激活函数。鉴别器的学习率保持在0.002，β1=0.5，与n-FET配置一致。网络使用正交初始化器来增强梯度流动。p-FET的整体GAN训练策略与n-FET模型类似。我们在图4中提供了所有这些细节的图示展示，包括设备结构。

为了确保模型配置的公平和系统选择，我们使用网格搜索策略优化了超参数。评估了多种关键参数的组合，最终选择是基于在选定的评估指标上实现稳定收敛和最佳性能。我们还添加了所选超参数的详细摘要，这些摘要已汇总在表1中，以方便理解和重现。

下载：下载高分辨率图片（685KB）
下载：下载全尺寸图片

图4. 提出的cGAN架构。(a) CFET设备的示意图，展示了六个工艺变化效应（PVE）参数以及用作模型输入的噪声，(b) 生成合成输出样本的生成器结构，(c) 用于区分真实性和合成性的鉴别器网络，(d) 对抗性训练工作流程，其中生成器和鉴别器交替更新以达到稳定平衡。

表1. 用于训练所提模型的超参数

| 网络 | 生成器 (LSTM) | 鉴别器 (1D CNN) |
|-------------|-----------------------|---------------------------|
| | (128, 64, 64, 36) | (256, 128, 20, 36) |
| | | (64, 32, 6, 1) | |
| | | (60, 32, 16, 1) |
| 噪声维度 | 100 | 100 |
| | | |
| 激活函数 | tanh | tanh | ReLU (密集层), Sigmoid (输出层) |
| | | |
| 优化器 | Adam | Adam | Adam |
| | | |
| 学习率 | 0.0015 | 0.0015 | 0.002 |
| 核正则化 | L1 | L2 | L1 |
| | | L2 | L1 |
| 核初始化 | 正交 | 正交 | 正交 |
| 损失函数 | MSE | MSE | MSE |
| 编代次数 | 2500 | 2500 | 2500 |

5.2.3. GAN训练
除了独立的生成器和鉴别器架构外，还构建了一个统一的GAN训练框架以促进对抗性学习。在这个框架中，生成器合成ID-VG曲线，然后由鉴别器评估其真实性。在对抗性优化过程中，选择性冻结鉴别器权重，同时更新生成器参数，使生成器能够逐步学习真实的数据表示。这种交替训练策略稳定了两个网络之间的对抗性最小-最大交互。GAN训练网络使用均方误差损失函数和Adam优化器进行优化，学习率降低到0.00015，以确保收敛速度和训练稳定性之间的平衡。通过将独立的鉴别器训练与联合GAN优化解耦，提出的策略缓解了模式崩溃（Kossale, Airaj, & Darouichi, 2022）等常见问题，并促进了向平衡状态的稳定收敛，其中没有一个网络在对抗过程中占主导地位。

此外，深度GAN架构容易遇到梯度消失或爆炸的问题（Ding, Jiang, & Zhao, 2022），特别是当初始化不当或使用了不适当的激活函数时。从理论角度来看，GAN训练被构建为一个非凸的非凹最小-最大优化问题，这通常会导致训练动态不稳定、振荡行为以及解决方案缓慢或无法收敛。这种不稳定性的一个众所周知的后果是模式崩溃，即生成器无法捕捉到完整的数据分布，而是产生了有限、低多样性的样本。为了减轻梯度不稳定性，采用正交权重初始化来促进对抗性训练期间稳定梯度的传播（Xia等人，2022年）。在半导体设备数据集中，这些挑战更加突出，因为数据分布通常是高维的、高度非线性的，并且由于设备级仿真的成本过高而采样稀疏。在这种条件下，GAN训练对超参数（包括学习率、优化器动量、批量大小、正则化策略和潜在噪声维度）非常敏感，即使是微小的扰动也会显著影响收敛稳定性和生成保真度。这些固有的限制激发了提出的条件生成信息整合框架，该框架旨在在提高数据效率和分布式覆盖度的同时，稳定对抗性学习，以便对可变性的半导体设备进行建模。所提出的基于LSTM-CNN的cGAN的详细训练过程在算法1中呈现。

下载：下载高分辨率图片（773KB）
下载：下载全尺寸图片

算法1. 在PVEs下基于LSTM-CNN的cGAN训练算法

5.2.4. 均质模型与异质模型
为了解决GAN训练在高维和稀疏采样半导体数据集中的敏感性，提出的条件生成信息整合框架结合了多种架构变体，以提高学习鲁棒性和表示能力。在这个框架内，系统地研究了均质和异质深度学习模型，以了解架构设计对可变性感知设备建模的影响。均质模型由一种类型的神经网络层在整个架构中重复使用。具体来说，基于CNN的GAN模型用于捕获ID?VG序列中的局部空间模式，而基于LSTM的GAN模型用于学习设备特征中的长期时间依赖性和全局趋势。相比之下，异质模型整合了不同类型的网络，以利用它们的互补优势。所提出的混合LSTM-CNN架构结合了LSTM层的顺序学习能力和CNN层的特征提取效率，从而更有效地建模全局和局部变化。这种架构驱动的比较分析嵌入在条件GAN框架中，为实现半导体设备建模的稳定训练和改进的分布学习提供了关键见解。

6. 评估指标和验证方法
本节介绍了用于评估所提出的基于cGAN的合成数据生成模型的性能、真实性和可靠性的综合评估框架。与传统的回归问题不同，评估生成模型需要验证不仅仅是逐点的准确性，还包括分布一致性、结构保真度和内在特征依赖性的保持。在这项研究中，我们采用了统计性能度量、机器学习有效性指标和GAN特定的评估标准。

6.1. 统计性能度量
第一层次的评估关注真实数据集和合成数据集之间的基本统计一致性。由于所提出的cGAN的目标是复制真实的ID?VG特征分布，因此验证数据的根本统计属性得到保持是至关重要的。为此评估，计算了相对标准差（即每个电气特征的标准差（σ）与平均值（μ）的比率（RSD=(σμ)×100%），对于真实数据集和生成数据集都进行计算。这些统计数据的密切比较可以表明潜在数据分布的中心趋势和变异性以及我们模型的效率。此外，还计算了错误率（ER）（Tofallis, 2008），以评估模拟设备数据和GAN生成样本之间的差异。ER是基于真实数据集和合成数据集之间的方差差异计算的，作为数据质量和模型性能的指标。采用1%的ER阈值作为可接受准确性的基准。这些指标在进行更高级的统计和GAN特定评估度量之前提供了分布对齐的初步验证。

6.2. 回归错误度量
尽管GAN是生成模型，但它们在下游建模任务中的实用性也需要验证。因此，使用标准的回归性能度量来量化生成的合成数据与真实数据逐点的接近程度。对于这一评估，我们考虑了平均绝对误差（MAE）、均方误差（MSE）和均方根误差（RMSE）（Botchkarev, 2019, Dash, Li, 2025）。这些度量广泛应用于基于回归的设备建模中，提供了生成样本的预测保真度和数值准确性的定量衡量（Dash, Li, Sung, 2023a, Yang, Li, Kola, 2023）。我们还考虑了R2分数，以更好地理解我们模型的拟合优度。

6.3. GAN特定评估指标
虽然回归度量评估了逐点的相似性，但它们不足以评估GAN生成数据的分布质量和结构真实性。因此，使用了额外的GAN特定指标，这些指标分为定量分布度量和视觉评估技术。对于定量测量，我们计算了Kullback-Leibler散度（KL散度）、Jensen-Shannon距离（Menéndez, Pardo, Pardo, & del C., 1997）、Wasserstein距离和皮尔逊相关系数（r）（Schober, Boer, & Schwarte, 2018）。同样，对于视觉评估，我们考虑了绘制PCA和t-SNE来观察视觉分布的重叠和局部邻域一致性（Anowar, Sadaoui, & Selim, 2021）。下面详细解释了每种评估技术。

6.3.1. Kullback-Leibler散度
KL散度衡量真实数据和合成数据之间的概率分布差异。它衡量使用合成分布近似真实分布时丢失的信息量。KL散度的数学定义为：
(3) DKL(x∥y) = ∑p∈P×p(log(x(p))log(y(p))，
其中x(p)和y(p)分别表示真实数据和合成数据的概率分布，定义在相同的样本空间P上。较低的KL散度值表示两个分布之间的匹配度更高。在GAN评估的背景下，KL散度提供了全局分布相似性的严格定量度量。

6.3.2. Jensen-Shannon距离
JS距离用于定量评估真实数据和GAN生成的ID?VG特征的概率分布之间的相似性。与KL散度不同，JS距离是对称的、有界的且数值上稳定的，提供了可靠的分布一致性度量。它使用KL散度来计算一个对称的标准化分数。在GAN评估中，较低的JS距离表示生成器有效地捕获了真实设备特征的全局分布和局部变异性。这对于半导体数据尤为重要，因为在门电压点之间存在强烈的物理相关性。因此，接近零的值表示生成样本的高保真度和多样性。形式上，两个分布P和Q之间的JS距离定义为：
(4) JS(P∥Q) = 1/2KL(P∥M) + 1/2KL(Q∥M),
其中
(5) M = 1/2(P+Q)。

6.3.3. Wasserstein距离
Wasserstein距离，也称为地球移动距离（EMD），通过测量将一个分布转换为另一个分布所需的最小成本来量化两个概率分布之间的差异。与基于散度的度量（如KL或JS散度）不同，它明确考虑了数据空间的几何结构，非常适合连续值设备特征。其数学定义为：
(6) Wp(P,Q) = (infγ∈Π(P,Q)∫X×X∥x?y∥pdγ(x,y))1/p，
其中X是度量空间。p≥1表示Wasserstein距离的阶数（通常p=1）。Π(P, Q)是所有具有边际P和Q的联合概率分布的集合。γ(x, y)表示将概率质量从x移动到y的运输计划。∥x?y∥是点x和y之间的地面距离。

6.3.4. 皮尔逊相关系数
皮尔逊相关系数是一种统计度量，用于量化两个连续变量之间的线性依赖程度。在基于GAN的生成建模中，它被用来评估合成生成的数据在多大程度上保留了真实数据中存在的统计趋势和结构关系。为了评估GAN生成数据的质量，皮尔逊相关系数提供了洞察力，以了解合成曲线是否遵循与真实器件响应相同的方向行为、形状一致性和相对变化。这种区别对于半导体器件特性尤为重要，因为在相邻栅压下的电学量由于潜在的物理机制而内在相关。(7)r=∑i=1N(yi?yˉ)(y^i?y^ˉ)/∑i=1N(yi?yˉ)2，其中yi和y^i分别表示第i个真实样本和合成样本，yˉ和y^ˉ是它们的对应平均值，N是样本的总数。接下来是视觉检查，它能直观地显示合成数据在高维特征空间中与真实数据的一致程度。采用两种互补的降维技术，如PCA和t-SNE，下面将对其进行解释。6.3.5. 主成分分析（PCA）PCA是一种线性降维技术，它将高维数据投影到正交方向上，捕获最大方差。在GAN评估中，PCA用于评估全局分布对齐情况。如果合成样本在PCA空间中占据与真实样本相同的区域，并且具有可比的扩散和方差方向，这表明GAN成功地学习了数据的支配性统计模式。相反，分离的簇或不匹配的方差结构则表明生成性能不足。6.3.6. t-分布随机邻居嵌入（t-SNE）t-SNE是一种旨在保留局部邻域结构的非线性降维技术。与PCA不同，t-SNE强调细粒度的结构相似性，并且对微妙的分布差异敏感。表现良好的GAN在t-SNE空间中产生的合成样本与真实样本混合在一起，表明保留了局部密度结构和变异性。结合使用PCA和t-SNE可以全面评估模型的质量。PCA验证合成数据是否捕获了全局方差和主要特征方向，而t-SNE则验证了局部邻域关系和器件特定变化的保留情况。两种表示方式的一致性确认了生成合成数据的稳健性、多样性和物理真实性。6.4. 均质和异质模型性能评估的指标：为了全面评估均质（CNN、LSTM）和异质（LSTM-CNN）模型的性能，采用了统计和物理意识的指标。这种综合评估框架确保生成数据不仅在统计上与真实器件特性一致，而且在物理上也是有意义的。6.4.1. 最近邻距离最近邻距离（NND）被用作统计相似性指标，以量化合成数据和真实数据分布之间的接近程度（Le, Dawkins, & McKinney, 2020）。对于每个生成的样本，计算其与最近真实对应样本的距离。较低的NN距离值表示更高的保真度和与真实数据分布更好的对齐，而较大的距离则表明泛化能力较差。此外，NN距离的分布（最小值、平均值和最大值）提供了对不同模型中生成样本稳定性和多样性的洞察。6.4.2. 单调性分数为了补充统计评估，引入了单调性分数作为一个物理意识验证指标（Saad, Choudhary, Fatima, & Panigrahi, 2025）。该指标评估生成的ID?VG特性是否遵循晶体管的基本物理行为，其中漏电流随栅压单调增加。较高的单调性分数表示更好地遵循物理定律，而较低的值表明生成曲线中存在非物理波动。7. 结果与讨论本节展示了所提出的cGAN模型的性能评估。如前所述，评估分为三个互补的类别进行。第一类侧重于统计分析，这是数据真实性的主要指标。首先，从生成的合成数据中提取的关键电学特性的相对标准差（RSD）与从真实3D数值模拟器件数据获得的RSD进行了比较。具体来说，对n-FET和p-FET器件的导通电流（ION）、关断电流（IOFF）和阈值电压（VTH）的RSD值进行了详细比较，结果使用图5中的直方图进行说明。合成数据在ION变异性方面与真实数据非常吻合，表明模型成功保留了对工艺变化的驱动电流敏感性，这主要受通道几何形状和有效迁移率的控制。同样，VTH的RSD趋势也被很好地再现，证明了生成模型捕捉到了影响通道静电和栅控的潜在变化机制。在大多数情况下，这些参数在生成样本中的统计分布与真实器件分布非常接近。主要在IOFF的情况下观察到了明显偏差，因为它对工艺波动和漏电机制更为敏感。由于fin型器件的底部通道结构，p-FET的关断电流变异性明显大于n-FET，见（Kola & Li, 2023）的图1。此外，计算出的误差率分别为n-FET的0.55%和p-FET的0.59%。在这两种情况下，误差都低于1%，表明所提出的模型生成的合成数据具有很高的可靠性和可信度。总体而言，这些结果证实了所提出的cGAN有效地捕捉了器件特性中存在的固有统计变异性。这种强一致性提供了生成数据物理真实性和保真度的初步证据。下载：下载高分辨率图像（211KB）下载：下载全尺寸图像图5. 对真实3D数值模拟数据和cGAN生成的合成数据在关键电学参数方面的相对标准差比较。展示了（a）关断电流IOFF、（b）导通电流ION和（c）阈值电压VTH的RSD，对于n-FET和p-FET器件都是如此。合成数据和真实数据之间的RSD值在所有指标上都非常接近，证实了所提出的cGAN准确捕捉了由工艺变化引起的器件间变异性，同时保持了统计保真度。表2. 比较n-FET和p-FET器件的真实数据和生成数据的回归性能指标。指标n-FET（真实值 vs 生成值）p-FET（真实值 vs 生成值）MAE1.04×10^-68.48×10^-7MSE4.85×10^-123.05×10^-12RMSE2.20×10^-61.74×10^-6R2分数96.41%93.65%表3. 评估n-FET和p-FET器件分布相似性和生成准确性的GAN特定定量指标。指标KL散度JS距离WS距离皮尔逊相关误差率n-FET0.22990.04000.02250.98220.55%p-FET0.23370.02730.0180.96850.59%在统计分析之后，评估的第二阶段侧重于基于回归的性能指标，这些指标被认为是机器学习效能的衡量标准。这些指标定量评估了生成合成数据与真实器件模拟数据之间的数值一致性。具体来说，计算了MAE、MSE、RMSE和R2，如前一节所定义。n-FET和p-FET器件的回归性能在表2中进行了总结。在所有指标中，所提出的cGAN模型分别实现了低误差值和强R2分数，分别为96.41%和93.65%。这表明真实和合成ID?VG特性之间的强预测一致性，并确认了生成数据准确再现了工艺变化与电学响应之间的潜在功能关系。除了标准回归指标之外，还采用了GAN特定的评估措施来评估生成样本的稳定性、真实性和多样性。成功的GAN训练的一个主要指标是生成器和鉴别器损失函数的行为。在一个理想训练的GAN中，这两个网络达到了动态平衡，其中一个网络不支配另一个。如图6所示，在早期训练阶段，生成器和鉴别器的损失 initially 表现出不稳定和振荡行为，这是对抗学习的典型特征。然而，随着训练的进行，两个损失趋于一个可比较且稳定的范围，表明模型达到了平衡的对抗状态。这种收敛证实了稳定的训练，并表明生成器已经学会产生真实的合成样本，鉴别器不再容易将其与真实数据区分开来。下载：下载高分辨率图像（287KB）下载：下载全尺寸图像图6. 所提出的cGAN对于（a）n-FET和（b）p-FET器件的训练损失演变。对于n-FET，生成器和鉴别器的损失分别用蓝色和红色表示；对于p-FET，它们用绿色和橙色表示。训练结束时生成器和鉴别器损失趋于稳定平衡，表明了平衡的对抗学习和模型的稳定收敛。为了进一步评估真实和合成数据集之间的统计和结构相似性，计算了相应的真实和生成ID?VG数据点之间的KL散度、JS距离、WS距离和皮尔逊相关系数，结果在表3中说明。所有这些分布距离指标都量化了合成数据的统计分布与真实数据之间的匹配程度。非常低的距离值表明生成样本不仅类似于单个数据点，还忠实地保留了整体统计结构，包括分布、形状和变异性。因此，低的分布距离是模型学会了数据生成过程的强有力证据，而不仅仅是拟合点值。同样，观察到n-FET和p-FET的相关值分别为0.9822和0.9685，表明cGAN成功保留了不同栅压下电流值之间的内在依赖性。下载：下载高分辨率图像（487KB）下载：下载全尺寸图像图7. 对（a）n-FET和（b）p-FET器件的真实3D数值模拟和cGAN生成的ID?VG特性的相关性分析。数据点沿对角线的强线性对齐表明了高的皮尔逊相关性，证实了所提出的cGAN准确保留了原始器件特性的统计依赖性和趋势行为。除了定量评估之外，还进行了视觉检查，以评估在降维特征空间中真实样本和生成样本之间的对齐情况。如前所述，使用了PCA和t-SNE等降维技术。图8展示了组合数据的PCA投影，捕捉了主导方差方向。真实样本和合成样本在PCA空间中的大量重叠表明，所提出的cGAN有效地学习了ID?VG曲线的全局分布特性。n-FET和p-FET器件的不同PCA分布源于它们内在的电学特性，其中n-FET ID?VG曲线表现出更高的变异性和动态范围，导致PCA分布更广；而p-FET曲线更受限且相关，导致方差主要由单一主成分主导。图9展示了t-SNE可视化，强调局部邻域关系。真实样本和合成样本的强烈混合证实了生成样本保留了真实器件数据中固有的细粒度结构变化和局部相似模式。下载：下载高分辨率图像（643KB）下载：下载全尺寸图像图8. 通过所提出的cGAN生成的真实和合成ID?VG特性的PCA可视化比较。对于n-FET，如图（a）所示，真实样本用蓝色表示，合成样本用红色表示，显示出强烈的重叠和分布一致性。对于p-FET，如图（b）所示，真实数据用绿色表示，合成数据用橙色表示，表明真实样本和生成样本之间的极好对齐。下载：下载高分辨率图像（641KB）下载：下载全尺寸图像图9. 通过所提出的cGAN生成的真实和合成ID?VG特性的t-SNE可视化。对于n-FET，如图（a）所示，真实和合成样本分别用蓝色和红色表示；对于p-FET，如图（b）所示，真实数据用绿色表示，合成数据用橙色表示。样本的强烈混合表明合成数据保留了真实器件特性的局部结构关系。最后，直接比较了真实的和合成的ID?VG曲线，以定性地评估图10中的点对点一致性。大多数合成曲线在整个栅压范围内紧密跟随其真实对应曲线，仅在少数情况下观察到轻微偏差。这种偏差在生成建模中是预期的，并表明模型正在学习对底层数据分布的忠实近似，而不是记忆单个样本。重要的是，这种行为确保了生成的数据能够捕捉到原始数据集的潜在结构和变异性，同时避免了过拟合，从而使其适合用于数据增强和变异aware建模，而不会影响数据的原始性。下载：下载高分辨率图像（678KB）下载：下载全尺寸图像图10. 3D数值模拟的真实数据与cGAN生成的合成ID?VG特性的良好对齐，显示真实曲线和生成曲线之间有很强的吻合度。红色曲线对应于p-FET，而蓝色曲线代表n-FET。总体而言，综合回归指标、对抗性损失行为、相关性分析和视觉检查共同表明，所提出的cGAN模型生成的合成ID?VG特性在统计上、结构上和物理上都与真实的3D器件仿真数据一致。最后，评估了所提出的数据生成框架的计算效率。使用最近邻（NN）距离和单调性得分来评估 homogeneous 和 heterogeneous GAN 模型的性能，分别评估统计保真度和物理一致性。如图11(a)所示，混合LSTM-CNN GAN模型在n-FET和p-FET器件的最小值、平均值和最大值上都始终实现了最低的NN距离，表明其与真实数据分布的对齐度更高。相比之下，homogeneous模型表现出更高的NN距离，尤其是在最大范围内，这表明其在捕捉数据变异性方面的能力有限。其中，CNN模型的表现优于LSTM，突显了局部特征提取的重要性；然而，两者都不及混合架构。下载：下载高分辨率图像（461KB）下载：下载全尺寸图像图11. (a) 不同GAN架构的最近邻距离比较，用于评估n-FET和p-FET器件的最小值、平均值和最大值，以评估真实数据与生成数据之间的统计保真度；(b) homogeneous（CNN, LSTM）和 heterogeneous（LSTM-CNN）GAN模型在n-FET和p-FET器件上的单调性得分比较，突出显示了生成的ID?VG特性的物理一致性的提高以及所提出的cGAN模型的优越性能。图11(b)中的单调性分析进一步证实了这一趋势。混合模型在n-FET和p-FET器件上都取得了完美的1.0分，确保了ID?VG特性的物理一致性。CNN模型表现出中等程度的单调性（n-FET为0.481，p-FET为0.874），而LSTM模型的表现较差（n-FET为0.046，p-FET为0.031），表明与预期物理行为的显著偏差。这些结果表明，异构LSTM-CNN模型生成的数据在统计上准确且在物理上有意义，能够可靠地提取关键器件参数，如VTH、ION和IOFF。传统的3D数值器件仿真通常需要1300小时来生成1000个真实的CFET器件样本。此外，构建仿真案例本身就需要超过2周的时间作为仿真过程的第一步。整个过程使得器件仿真既耗时又昂贵。在这种情况下，使用GAN模型生成合成数据样本只需要4-5小时的初步训练，一旦模型完全训练完毕并输出稳定，就可以在几分钟内生成所需数量的样本。在本研究中，使用所提出的混合模型生成1000个合成样本仅需264.03秒（n-FET）和344.05秒（p-FET），相当于每个器件不到10分钟。这一生成时间的显著减少凸显了所提出方法的实际优势，实现了高效的数据生成，降低了计算成本并加快了周转速度，这对于工业应用中的大规模器件探索非常有益。此外，对不同模型计算效率的比较显示，异构LSTM-CNN模型的性能显著优于homogeneous架构。混合模型需要264.03秒（n-FET）和344.05秒（p-FET），而CNN模型需要437.41秒（n-FET）和517.63秒（p-FET），LSTM模型则需要1711.52秒（n-FET）和1662.11秒（p-FET）。这些结果表明，所提出的异构架构不仅提高了建模精度，还实现了更高效的计算效率。此外，还进行了消融分析以评估所提出框架内各个架构组件的贡献。基于CNN的模型有效地捕捉了局部空间模式，而基于LSTM的模型关注长距离时间依赖性。然而，单独使用这两种模型都存在局限性。相比之下，混合LSTM-CNN模型整合了这两种能力，能够同时学习全局和局部特征。评估指标表明，混合模型在n-FET和p-FET器件上都始终实现了较低的NN距离和更高的单调性得分，表明分布对齐度和物理真实性的提高。这些发现证实了LSTM和CNN组件的结合在提升模型性能方面起着关键作用，从而证明了所提出的异构架构的有效性。我们所有的训练都在一台配备Intel? Core? i9-13900K处理器和64 GB RAM的高性能工作站上完成。这种配置确保了高效的训练，同时代表了常见的研究硬件。数据集是使用Sentaurus TCAD工具通过求解量子力学校正的漂移-扩散模型生成的。所提出的生成模型使用TensorFlow框架和Keras高级API实现，使得模型开发、训练和评估更加高效。8. 结论本文提出了一个基于Generative AI的框架，用于建模和分析先进CFET中的工艺变化效应。通过采用基于LSTM的生成器和1D-CNN鉴别器的混合cGAN架构，所提出的方法成功学习了PVE与相应的ID?VG特性之间的复杂非线性关系，从而生成了高保真的合成器件响应。与需要大量标记数据和广泛3D数值器件仿真的传统ML模型不同，所提出的生成框架通过合成保留了真实器件统计和结构特性的真实ID?VG曲线，显著减少了对手昂贵的3D器件仿真的依赖。使用分布相似性、成对相关性、PCA和t-SNE分析的全面评估表明，生成的合成数据紧密跟随真实数据流形，表明有效捕捉了器件的物理特性和变异性趋势。进一步使用所有评估指标的分析显示，尽管GAN生成的数据与真实测量结果保持了强的一致性趋势，但其绝对预测精度仍然有限。尽管如此，真实数据与合成数据之间的高相关性证实了生成样本适用于变异性分析、数据增强和亚1nm CFET技术的探索性设计任务。总体而言，这项研究展示了Generative AI在半导体器件建模方面的实际可行性，提供了一种可扩展且数据效率高的替代传统仿真驱动的工作流程。在未来的工作中，所提出的框架生成的合成数据将与有限的真实器件测量数据结合起来，构建健壮且具有代表性的CFET制造数据集。这种多维数据融合策略有望缓解数据稀缺问题，减少对昂贵仿真的依赖，并提高AI和ML模型的泛化能力。CRediT作者贡献声明Sagarika Dash：写作 - 审阅与编辑、撰写初稿、可视化、验证、方法论、调查、正式分析、数据整理、概念化。Yiming Li：写作 - 审阅与编辑、撰写初稿、可视化、验证、监督、软件、资源、项目管理、方法论、调查、正式分析、数据整理、资金获取、概念化。

热点排行