一种用于湍流反应流中化学计算表格的自适应学习框架

《Computers & Fluids》：An adaptive-learning framework for chemistry tabulation in turbulent reacting flows

【字体：大中小】 时间：2026年05月11日 来源：Computers & Fluids 3

编辑推荐：

　　Kai Niemietz|Clément Scherding|Walter Gemassmer|Taraneh Sayadi|Heinz Pitsch 德国亚琛工业大学燃烧技术研究所，亚琛，52056 摘要：在湍流燃烧的许多应用中，都依赖于某种形式的降阶模型。带有

　　Kai Niemietz|Clément Scherding|Walter Gemassmer|Taraneh Sayadi|Heinz Pitsch
德国亚琛工业大学燃烧技术研究所，亚琛，52056

摘要：
在湍流燃烧的许多应用中，都依赖于某种形式的降阶模型。带有预计算、表格化化学数据的火焰面模型被广泛使用，并且通常表现良好。然而，创建一个合适且准确的表格需要相当的知识和时间。数据驱动模型在减少这一工作量方面显示出了很大的潜力。它们快速、易于使用，并且能够提供高精度。但是，这些模型往往就像一个“黑箱”。此外，将数据驱动模型外推到新的、未知的数据上并不明显；而这在大多数应用中是必需的。

在这项工作中，我们实现了RONAALP算法（结合了离线训练和自适应学习过程的降阶非线性近似方法），以处理动态中的外推事件。离线训练依赖于非线性自动编码器、社区聚类和径向基函数网络的组合，从有限的训练数据中开发出一个高效且紧凑的基模型。自适应学习过程扩展了基模型，以考虑原始训练数据之外的外推情况。该算法是为非平衡高超音速流动开发和验证的。我们已经将算法适配到典型的燃气轮机燃烧中的湍流反应壁面流动。该模型基于廉价的一维层流火焰数据进行了训练，并使用湍流三维直接数值模拟（DNS）数据库进行了评估。

基模型的性能与传统化学表格化方法相当。由于内置的外推过程以及来自应变逆流火焰面和正面熄灭火焰面的额外训练数据，自适应学习提高了预测精度。

1. 引言
下一代燃烧系统的设计和优化将严重依赖于数值模拟。在许多可用的数值框架中，直接数值模拟（DNS）常被用于提供基本的物理洞察[1]。然而，DNS在计算上非常耗时，对于实际工程应用来说是不切实际的，因此低成本建模策略（如降阶模型（ROMs）成为了一种可行的解决方案，因为它们在计算效率和物理精度之间取得了平衡。ROM方法需要定义一组控制变量，以考虑局部热化学状态变化的影响，以及湍流燃烧闭合模型和化学动力学的表示。在这方面，化学表示通常通过使用化学流形和表格技术来实现。化学流形是通过解决具有详细化学和详细传输的一维火焰面来生成的，从而考虑了火焰结构。这些流形在实际计算之前就产生，将详细化学的计算成本转移到了预处理步骤中。成功的例子包括火焰面进展变量（FPV）方法[2]和火焰面生成流形（FGM）[3]，这两种方法都已应用于各种燃烧配置中。

对于更复杂的配置，如火焰-壁面相互作用（FWI）、多相流动、污染物形成或湍流应变，表格化变得更加具有挑战性。Knudsen等人[4]对应变逆流火焰面进行了表格化，以包括湍流应变的影响。Efimov等人[5]开发了熄灭火焰面生成流形（QFM），利用正面熄灭（HOQ）火焰面来改进FWI的建模。Steinhausen等人[6]进一步扩展了QFM模型，以包括由于火焰-涡旋相互作用而产生的与废气之间的相互作用。由于必须捕捉多种物理现象，化学流形的规模显著增加，从而影响了计算成本。此外，随着引入更多物理参数，控制变量可能会变得相关，使得表格查找更加复杂和低效[7]。

在这项工作中，我们将降阶化学模型应用于与燃气轮机燃烧相关的湍流三维DNS数据库[8]。该数据库包含几个复杂建模的因素：域的两侧被等温壁包围，导致FWI；湍流应变影响火焰；新鲜混合物由于循环作用与燃烧气体相互作用。所有这些因素都影响火焰特性和污染物形成，必须在ROM中加以考虑。由于混合物贫瘠和温度低，燃烧过程可能发生局部熄灭，导致一氧化碳（CO）排放增加[9]。导致这种行为的一个机制是与FWI有关的一氧化碳氧化到二氧化碳的过程受到了干扰[10]。非平衡状态的一氧化碳受到动力学控制，使得预测变得困难，因此需要高度精确的模型。虽然存在几种传统的表格化模型，例如[5]、[6]、[7]，但结合多种影响因素仍然是一个挑战，而数据驱动方法可以帮助解决这一问题。

现代深度学习（DL）框架的重大进展，加上全面的DNS数据集的可用性，激发了对数据驱动DL基础表格化方法的探索，这些方法在捕捉强非线性相互作用方面特别有效[11]。多项研究调查了流形识别[12]、[13]以及感兴趣量的表示[14]、[15]，特别是在湍流燃烧系统中进展变量ω?C的源项。Bissantz等人[15]开发了一种自组织人工神经网络（ANN），能够将复杂的火焰面结构映射到低维潜在空间中，包括流形识别步骤。Kumar等人[16]通过先验测试证明，基于自动编码器的ANN可以直接从高保真DNS数据中有效学习低维燃烧流形，提供高效的表格化策略，并实现更快的模拟。同样，Chi等人[17]将ANN集成到有限速率化学DNS求解器中，其中网络在线使用ODE求解器生成的热化学状态进行训练。随着模拟的进行，越来越多的化学源项评估任务被卸载到了ANN上，从而在不影响准确性的情况下显著提高了计算效率。尽管传统ANN架构通常用于此类任务，但卷积神经网络（CNNs）——特别是具有编码器-解码器结构的U-Net——由于能够有效建模燃烧数据中的空间结构而受到关注[18]。例如，Arumapperuma等人[19]应用U-Net架构评估了基于CNN的模型的外推性能，证明了其在不同雷诺数和滤波器配置下的强大泛化能力。尽管这些结果很有希望，但CNN在复杂反应流配置中的应用仍然有限。这在很大程度上是由于在将CNN与实际燃烧系统中典型的非结构化网格或复杂边界条件集成方面存在挑战[20]。因此，基于ANN的模型——特别是那些依赖全局热化学状态而不是空间特征的模型——在许多高保真燃烧建模应用中仍然是一个重要的选择，因为它们具有更大的灵活性和易于集成[21]。

除了灵活性之外，ANN相比传统的表格化和基于CNN的方法还有两个关键优势：降低内存需求和平滑的函数表示[21]。这些优势在高维表格化中尤为重要，而这在复杂的化学和流动问题中通常是必需的。与随维度增加而扩展性能较差的表格化方法不同，ANN在保持精度的同时，所需的内存相对较小。Ihme[21]将这种优势量化为ROM的知识密度，定义为精度与内存需求的比率。更高的知识密度值突显了ANN在捕捉基本燃烧动力学方面的优越效率，而不会产生过大的内存成本。此外，当物理知识被嵌入到训练过程中时，ANN模型的性能进一步提升[11]。例如，Bissantz等人[15]通过在流形边界处修正源项来强制界限性，减少了外推误差。这样的基于物理的约束在ANN模型中更容易实现，因为它们是逐点制定的，每个状态都独立处理——允许直接在输出或损失函数中实施物理定律。此类建模方法的一个核心开放问题是确保其外推超出训练分布。尽管在大数据集上进行详尽训练可以通过覆盖广泛的热化学状态来帮助减轻外推误差，但湍流燃烧的固有的不稳定性和多尺度特性往往导致训练数据中未代表的操作条件[22]，从而在训练数据中代表性不足或物理意义较小的区域降低准确性[18]、[22]。同时，生成这样的全面数据集对于高保真模型来说变得不可行。一种可能的解决方案是采用自适应建模技术，在运行时更新模型，使其能够从新出现的数据中学习。Pope[23]提出的原位自适应表格化（ISAT）算法就是一个例子，它根据误差标准动态增强其表格化数据库。尽管前景广阔，但这种动态训练在平衡适应速度与稳定性以及定义稳健的误差指标方面仍然具有挑战性。

另一种方法是针对问题的不同方面训练多个ANN，如Chatzopoulos和Rigopoulos[24]以及Franke等人[25]所提出的。小型、轻量级的ANN可以快速训练，并更准确地捕捉其子问题的相关特征。这使得它们特别适用于复杂的配置，如湍流FWI，其中需要正确考虑不同的物理现象，如传热、化学反应和湍流。这种方法引入了在FWI建模背景下尚未探索的挑战，因为识别和划分合适的子域并不总是直截了当的。此外，随着问题复杂性的增加，所需的子模型数量可能会迅速增长，导致更大的计算开销。

在这项工作中，采用了第二种方法，即训练多个轻量级ANN来捕捉域中的不同特征。然而，子域的聚类是在低维潜在空间中进行的，从而减少了所需的子模型数量，参见[12]。RONAALP模型（结合了离线训练和自适应学习过程的降阶非线性近似方法）最初是为加速高超音速非平衡边界层流动中的化学计算而开发的，通过用机器学习方法替换化学求解器[26]、[27]。在先验和后验研究中，整体精度得到了保持，同时显著缩短了解决问题的时间。在这里，我们将RONAALP模型应用于湍流反应流动。与之前的应用和大多数文献中的ANN方法不同，该模型的训练数据不是从DNS中提取的。相反，模型是在廉价的、低维的训练数据（一维火焰面）上训练的。然后，该模型在与燃气轮机燃烧相关的湍流三维DNS数据库上进行了评估[8]。

2. DNS数据库和训练数据
2.1. DNS数据库
本研究中考虑的DNS数据库由两个平行的湍流预混射流火焰组成，这两个火焰之间被一层层流的燃烧气体分隔，并被等温壁包围。图1展示了域的草图。该数据库旨在包含与燃气轮机燃烧相关的特征。新鲜气体是甲烷/空气混合物，当量比为φ=0.5，温度为T=673K，压力为p=4atm。射流的体积入口速度为uj=73.5m/s，射流宽度为hj=1.2mm，导致射流雷诺数（Rej=ujhj/ν）为5500，其中ν是反应物的运动粘度。相关参数的总结见表1。采用有限速率化学，使用包含25种物种的骨架甲烷机制[28]，该机制源自Cai等人[29]的完整机制。

横向方向由无滑移的等温壁限定，温度为Tw=1000K，循环区域驱动新鲜气体和（冷却的）燃烧气体之间的混合和相互作用。入口的外边缘是绝热壁，产生了射流中观察到的扩散行为。瞬时温度场如图2所示。火焰沿着冷壁扩散，伴随着显著的FWI。下游，来自墙壁的冷却流体被重新吸入主流动中。DNS的详细描述见[8]。

表1. 仿真参数、初始条件和边界条件。
sL是层流燃烧速度，lF是层流未拉伸火焰中的热火焰厚度。
Lx×Ly×Lz (hj) = 100×12×6μm
Δx×Δy×Δz = (μm) = 20×10×20
φ = 0.5
p (bar) = 4
Tu (K) = 673
Tb (K) = 1782
Tw (K) = 1000
uj (m/s) = 73.5
hj (mm) = 1.2
Rej = 5500
sL (cm/s) = 27.37
μlF (μm) = 205

下载：下载高分辨率图像（285KB）
下载：下载全尺寸图像

图1. 仿真域的草图。颜色表示温度场。流入由两个湍流射流组成，中间有一个层流导流。入口平面的外边界被建模为绝热壁。
改编自[8]。

下载：下载高分辨率图像（182KB）
下载：下载全尺寸图像

图2. 来自DNS的瞬时温度场。火焰因FWI而拉长。靠近墙壁的冷却燃烧气体被吸入火焰下游的主流动中。

2.2.模型输入数据

机器学习模型的一个需要注意的是需要大量的训练数据集。训练数据应尽可能接近最终应用场景，以生成准确的模型。因此，典型的工作流程包括为特定应用生成专门的训练数据。在本例中，我们使用FlameMaster [30]代码生成了一组一维绝热火焰模拟数据。我们使用通过主要产物种类定义的进展变量C，即C=YCO+YCO2+YH2+YH2O。此外，我们还需要考虑等温壁面以及由此产生的热损失，这是通过追踪流体中的焓值来实现的。这种焓值损失必须纳入模型输入数据中。火焰素未燃烧部分的温度会变化，以反映焓值的变化。焓值以不同火焰素与入口条件下的名义焓值之间的焓差的形式列出：Δh=hFL?hu。总共，这产生了大约80个火焰素，每个火焰素有1000个数据点作为模型输入数据。图3展示了一个输入数据的示例。CO的质量分数YCO由进展变量C参数化，焓差Δh也是如此。

3. RONAALP：深度学习框架

本研究中使用的降阶模型由Scherding等人[26][27]开发，用于模拟高超音速非平衡流动。极高的速度和摩擦会导致温度大幅升高，并使空气分子分解。RONAALP模型的引入是为了替代负责大部分计算负载的有限速率化学求解器。在先验和后验分析中，模型的整体准确性都得到了保持。此外，该模型没有产生虚假值或其他错误，并且在超过两次流过时间后解决方案仍然稳定。总体而言，计算时间减少了70%。这里仅提供了简要概述；更多结果、分析和讨论可以在[26][27]中找到。该模型由三个主要部分组成：首先是输入/输出编码器，用于降低输入数据的维度；其次是社区聚类，用于在低维流形中检测不同的聚类；最后是为每个聚类训练单独的替代模型。这三个部分对于生成高质量的输出数据都是必要的，并将在下文中分别进行分析。

3.1. 维度降维

RONAALP方法的第一步是将通常高维的输入空间降维到低维的标准化潜在空间。有许多算法可以实现这一点，例如主成分分析（PCA）或自动编码器（AE）。在这里，我们使用了一种改进的AE变体，称为输入/输出编码器（IO-E）[26]。AE是非线性的参数模型（即深度神经网络），通常比线性方法具有更高的压缩率。AE将高维输入X编码到低维潜在空间Y，然后再解码回输入X的表示X?。模型权重是通过最小化输入和表示之间的L2误差来训练的：min‖X?X?‖2。然而，由于我们关注的是在给定输入X时能够最佳预测输出Z的模型，因此低维表示中包含模型输出预测Z?的信息是方便的。不是通过输入空间训练AE，而是通过输出重构误差（‖Z?Z?‖2）的反向传播来训练IO-E，该误差是输入（‖fX?Z?‖2）的函数。关于IO-E的完整描述和其他维度降维技术的比较，请参阅Scherding等人的工作[26]。与AE一样，这种方法创建了一个两部分模型：编码器和解码器。最终模型中仅使用编码器。尽管IO-E可以用来预测输出，但其准确性并不理想。相反，接下来将使用聚类和替代模型。图4展示了维度降维的一个示例。左图显示了包含进展变量C和焓差Δh的输入层温度场。右图显示了相应的潜在空间表示，其中包含两个参数Y0和Y1。在这种情况下，输入数据已经是二维的，并且保持不变。尽管如此，IO-E仍然压缩了表示并进行了归一化。

3.2. 社区聚类

RONAALP框架的第二个组成部分是社区聚类。在湍流燃烧中，必须考虑许多不同的物理效应，而在整个区域内，主导物理过程可能大不相同，例如冷未燃烧的燃料/空气混合物、热废气或化学主导的火焰前沿。通过将数据聚类 into 不同的社区，可以为每个社区训练单独的详细替代模型，而不是一个需要考虑多种不同物理现象的全局模型。聚类是使用Newman的谱算法[31]在潜在空间中进行的。该算法根据给定的阈值?对数据点进行聚类。阈值通常定义为全局平均距离的一部分。Newman算法相对于k-means的优势在于，聚类的数量不是预先定义的。在复杂的湍流中，很难（如果不是不可能的话）预先确定最能代表物理现象的相关聚类数量。图5展示了聚类的结果。该图显示了算法检测到的两个聚类及其在输入（X）、潜在（Y）和输出（Z）空间中的表示。聚类基于潜在空间表示，包含输入和输出是为了赋予聚类物理意义。输入数据显示两个聚类主要根据进展变量C形成，并且与焓水平有轻微的梯度。正如预期的那样，在进行聚类的潜在空间中，两个聚类形成了明显的、紧凑的区域。在输出空间中，聚类紧密跟随火焰表面：一个聚类位于未燃烧区域，另一个聚类位于燃烧区域。

3.3. 替代模型

最后，使用径向基函数（RBF）网络[32]构建替代模型。为每个聚类训练一个单独的网络，从而能够更准确地表示每个区域的相关物理现象。RBF网络是一类特殊的三层网络。它们支持顺序学习[33][34]以及生长和剪枝[35]，因此适用于自适应学习算法。也可以使用许多其他算法来构建这样的替代模型。RBF在准确性和性能之间提供了很好的平衡，并且训练步骤也很简单。网络有一个隐藏层，包含NR个中心xc和NR个权重ai。RBF插值函数g由以下公式给出：g(x,?)=∑i=1NRai?‖x?xic‖，其中核函数为?。NR个中心xic是通过复合输入/输出空间的k-means确定的，最优权重ai是通过直接求解线性系统找到的，而不是通过迭代方法。

4. 结果

模型必须预测多个流体和化学量，如温度、密度、粘度等。在这里，我们评估了两个对模型性能特别重要的量。首先是进展变量的源项ω?C，在其传输方程中是未封闭的。准确预测ω?C对于正确表示火焰位置和模型的整体稳定性至关重要。对ω?C的系统性预测误差可能导致错误的火焰表面，而非物理值会降低模型的稳定性。这里研究的第二个输出是CO的质量分数YCO，因为它是主要关注量。其他场（如温度和主要物种）的进一步结果可以在附录中找到。

作为评估模型结果的第一步，分别评估了模型的三个组成部分。这使我们能够评估它们各自的贡献和相互作用。图6展示了ω?C和YCO关于C的联合概率密度函数（jPDF）及其条件均值。将DNS数据的jPDF与三个模型组成部分进行了比较。“RBF”表示仅使用了单个替代模型，没有数据预处理。“I/O-E + RBF”包括维度降维，但不包括聚类。“I/O-E + Cluster + RBF”是包含所有组件的完整模型。所有模型变体的输入都是进展变量C和焓差Δh。将DNS数据与RBF进行比较时，虽然分布的整体形状被再現，但值更加集中在一个狭窄的带状区域内。这个狭窄的带状区域对应于入口条件下的层流火焰素解，在结果中这一部分被过度表示。值的集中度影响了条件均值，模型对其有所高估。虽然预测并不完美，但不期望对其模型的稳定性产生负面影响。更高进展变量值下的虚假值对稳定性构成了更大的挑战。在CO质量分数中也观察到了类似的行为。在CO预测中出现了两个在ω?C数据中不存在的差异。首先，模型无法再现中间CO峰的高度。其次，在DNS数据中，CO的形成在燃烧早期就被抑制（C<0.05），导致整个火焰中的条件均值降低。这种降低在模型预测中不存在，模型预测更接近火焰素条件。通过包含I/O-E，虚假值被移除了。潜在空间中更加紧凑的表示减少了混叠误差。然而，在进展变量源项和CO质量分数中出现了负值，这可能对模型的稳定性产生负面影响。条件均值相对于之前的模型公式基本保持不变。使用完整模型后，虚假值和负值都被移除了。将数据分为两个聚类并为每个聚类训练单独的替代模型，使模型能够更准确地捕捉相关物理方面。

作为第一个测试案例，模型的表现相当不错。虽然模型的准确性还有改进的空间，但总体趋势被很好地捕捉到了，全球火焰行为也可以预测。最重要的是，对于ML模型来说，没有观察到意外或非物理的值。

作为评估模型结果的第一步，分别评估了模型的三个组成部分。这使我们能够评估它们的各自贡献和相互作用。图6展示了ω?C和YCO关于C的联合概率密度函数（jPDF）及其条件均值。“DNS”表示仅使用了单个替代模型，没有数据预处理。“I/O-E + RBF”包括维度降维，但不包括聚类。“I/O-E + Cluster + RBF”是包含所有组件的完整模型。所有模型变体的输入都是进展变量C和焓差Δh。将DNS数据与RBF进行比较时，分布的整体形状被重新创建，尽管值更加集中在一个狭窄的带状区域内。这个狭窄的带状区域对应于入口条件下的层流火焰素解，该解在结果中被过度表示。值的集中度影响了条件均值，模型对其有所高估。虽然预测并不完美，但不期望对模型的稳定性产生负面影响。更高进展变量值下的虚假值对稳定性构成了更大的挑战。在CO质量分数中也观察到了非常相似的行为。在CO预测中出现了两个差异，这些差异在ω?C数据中并不存在。首先，模型无法再现中间CO峰的高度。其次，在DNS数据中，CO的形成在燃烧早期就被抑制（C<0.05），导致整个火焰中的条件均值降低。这种降低在模型预测中不存在，模型预测更接近火焰素条件。通过包含I/O-E，虚假值被移除了。潜在空间中更紧凑的表示减少了混叠误差。然而，在进展变量源项和CO质量分数中出现了负值，这可能对模型的稳定性产生负面影响。条件均值与之前的模型公式基本保持不变。使用完整模型后，虚假值和负值都被移除了。将数据分为两个聚类并为每个聚类训练单独的替代模型，使模型能够更准确地捕捉相关物理方面。

作为第一个测试案例，模型的表现相当不错。虽然模型的准确性还有改进的空间，但总体趋势被很好地捕捉到了，全局火焰行为也可以预测。最重要的是，对于ML模型来说，没有观察到意外或非物理的值。在条件均值中，观察到了与之前相同的行为。两种模型都高估了ω?C|C的峰值，尽管RONAALP模型的表现略优于传统的表格方法。这是由于中间值的分布造成的，RONAALP模型中的中间值略低于ChemTable中的分布。两种模型都高估了CO的产量，而对消耗量的捕捉则更为准确。虽然两种模型的表现相似，但机器学习方法的一个额外优势是其易于使用。如果要处理许多火焰状结构，特别是当使用不同配置的火焰状结构（例如自由传播和对流的火焰状结构）时，表格方法可能会非常耗时且复杂。

4.2. 湍流应变
湍流应变影响火焰前沿和整体火焰特性，并且对燃烧化学反应有显著影响，尤其是CO对应变非常敏感[36]。因此，在模拟湍流火焰中的CO时必须考虑应变效应[8]。在LES（大涡模拟）背景下，一个挑战是如何在子网格级别计算应变，因为在那里速度波动并没有被解析出来。Knudsen等人[4]已经表明，H和OH自由基都能够对应变进行参数化；它们对增加的应变都有敏感且单调的反应。在这项研究中，OH更为相关，因为它也是CO氧化的主要反应伙伴：(3) 通过计算具有不同应变率的额外对流火焰状结构，将OH质量分数YOH作为第三个输入参数。应变率的范围是根据DNS数据计算出的湍流应变来选择的；详细信息请参见[8]。Hawkes和Chen[36]推荐对流新鲜与燃烧配置与湍流预混合燃烧最为相关。

与其将未变形的自由传播火焰状结构和变形的对流火焰状结构合并到一个训练数据集中，不如用新的对流火焰状结构数据来更新之前的未变形模型。这种自适应学习方法在添加新数据时表现出更好的稳定性。随着YOH这一额外输入的加入，聚类步骤引入了第三个簇。输入、潜变量和输出空间的三簇表示在图8中展示。此外，还提供了接近入口处的火焰表面的特写视图，以便更详细地观察。新簇用红色表示。在输入数据中，第三个簇包含了低焓值、高进展变量的数据——即冷燃烧区域。该簇也延伸到更高焓值的区域，但不包括完全燃烧的区域，形成了之前簇（未燃烧和已燃烧区域）之间的边界。对于三维输入，潜变量空间仍然保持二维。在输出数据中，第三个簇捕捉到了两个不同的区域：一个覆盖火焰表面的薄区域，以及下游的低温区域，在那里来自靠近 wall 的冷流体被重新吸入主流中（参见图2中的温度分布）。在这两个区域中，OH浓度与周围流体不同：火焰前沿处OH浓度较高，而在冷燃烧气体中OH浓度较低[37]。

包含YOH输入的模型版本的结果显示在图9中。DNS数据与使用未变形火焰状结构的二维模型版本以及使用变形火焰状结构的三维模型版本进行了比较。使用变形火焰状结构的模型能够更好地捕捉到ω?C和YCO值的广泛变化。对于源项而言，这种效果更加明显，条件均值也有很好的一致性。在CO质量分数方面，火焰状结构解周围的较大变化对条件均值的影响较小，条件均值与之前的结果非常相似，只是在峰值附近有轻微改进。

4.3. 以CO作为输入参数
由于这项研究的主要目标是准确预测CO排放量，使用YCO作为湍流应变的标志物会比使用YOH更方便。CO也对应变敏感，尽管不如OH敏感；但是，如果需要另一个传输控制变量，CO提供了额外的优势。在这种情况下，传输变量是CO，而CO源项ω?CO是一个未闭合的项，必须从模型中获取。然而，CO作为输入参数的表现并不好。图10展示了进展变量C与源项ω?C的联合PDF。源项的峰值被显著高估，而条件均值被低估（参见图9）。

图11评估了不同模型版本对CO源项的预测。将DNS数据与未变形基线模型、变形模型以及包含变形火焰状结构的模型进行了比较。结果与进展变量的情况类似。虽然基线模型和变形模型倾向于低估更极端的值，但结果仍在DNS数据的范围内。通过将YCO添加到输入参数中，CO峰值被高估，CO消耗区域（负源项）变得更加广泛。

图12汇总了所有模型版本的条件均值；左侧是进展变量源项ω?C|C的条件均值，右侧是CO源项ω?CO|C的条件均值。在这两种情况下，包含CO输入的模型都低估了峰值，而未变形模型则略微高估了这两个源项。预期CO质量分数与源项之间存在最强相关性并没有成立。相反，包含OH的变形模型更准确地预测了ω?C和ω?CO。

4.4. 外推和更新程序
在几乎所有类型的简化模型中都必须考虑外推问题。在实际应用中，可能会出现训练数据中未包含的热化学状态。在传统的表格方法中，检测外推事件非常简单，且可以以定义好的方式计算外推值。通常使用最接近的值或线性外推[3]，尽管也可以使用更复杂的方法。在机器学习模型中，外推行为更加复杂，因为数据边界和外推方法都没有明确定义。由于许多机器学习模型是非线性的，外推可能没有界限，甚至可能无法检测到[11]。RONAALP方法可以跟踪外推事件，使用户能够检查值的一致性。此外，模型可以通过额外的训练数据来更新，以包含需要外推的热化学状态。第一步是外推检测。在潜变量空间中评估数据点，并计算它们与最近RBF中心的欧几里得距离。靠近中心的数据位于原始训练数据集内，可以对其进行插值；而远离最近中心的数据则被标记为需要外推。阈值取决于潜变量的几何形状，外推阈值是根据原始数据到RBF中心的平均距离计算得出的。外推检测方法采用了Lohninger[38]提出的程序。其次，必须将新数据纳入模型。如果新数据对模型性能有显著贡献，则会在模型中添加一个新的中心；如果没有，则会更新附近参数以反映新数据。与原始训练步骤一样，新的中心是通过k-means算法生成的，但在更新步骤中使用了顺序k-means算法。由于关于新RBF中心的决策基于外推阈值，新中心的数量由算法自动确定。最后，重新训练每个簇的更新后的RBF。关于外推和更新程序的更多细节请参见[27]。

在这项研究中，主要的外推区域是低焓值区域。绝热火焰状结构在各种未燃烧温度下的训练数据无法达到足够的低焓值来捕捉下游的冷却燃烧气体。图15展示了一个示例，该图显示了温度与焓值的联合PDF。被检测为外推的数据被标记为灰色。

存在几种计算具有高热损失的1D火焰的方法。常用的方法包括燃烧器稳定的火焰（例如[39]、[40]）和正面熄灭的火焰（例如[5]、[41]）。在这里，我们遵循Efimov等人[5]的方法，计算一个向等温壁传播并逐渐熄灭的1D火焰。火焰的边界条件被设定为与DNS数据中的条件相匹配。在各个时间点保存火焰的热化学状态，并用这些额外的训练数据更新模型，这些数据包含显著较低的焓值。图14展示了更新前后DNS数据与模型预测之间的比较。该图再次显示了温度和焓值的联合PDF。在使用HOQ火焰的数据更新后，最低焓值区域的预测明显得到了改善。温度与焓缺陷的联合概率密度函数（Joint PDF）展示了模型预测结果，并标出了外推数据点。5. 结论本研究探讨了一种用于化学建模的新型机器学习框架。RONAALP模型为一个轻量级、计算成本较低的降阶化学建模框架提供了支持。该模型由三个主要组成部分构成：降维步骤、相似数据的聚类以及为每个聚类训练替代模型。RONAALP模型被应用于湍流、反应性及壁面限制流动问题。与最初的非平衡高超音速流动应用相比，该问题具有更高的化学复杂性，但训练数据量却有所减少。与文献中的许多ANN应用不同（这些应用使用DNS数据集进行训练），本研究的训练数据由一维火焰单元组成。该模型在基于直接数值模拟（DNS）的预混湍流甲烷射流火焰数据库上进行了评估，该数据库旨在模拟燃气轮机燃烧过程，并取得了有希望的结果。基础版本的机器学习模型性能略优于传统的化学表格模型；通过引入额外的逆流火焰数据进一步提升了模型性能。随着输入数据的维度增加和复杂性提升，机器学习模型的优势更加显著。由于采用了自适应学习机制，该模型能够识别外推现象，并可通过添加新的数据顺序重新训练，从而补充必要的热化学状态。当前的研究证明了这种轻量级机器学习框架在复杂湍流流动中模拟化学反应的可行性。由于涉及先验分析的性质，因此无法计算出具体的加速比和其他性能指标。Scherding等人[27]已证明，在非平衡空气中的高超音速流动中，RONAALP模型相较于基于有限速率化学模型的方法能够实现约4倍的加速比（针对五种物质）。对于更复杂的燃烧化学机制，预计可以获得更高的加速比。未来的工作将评估模型的后验性能以及计算指标，如加速比和内存需求。该模型在统计上稳定的燃气轮机燃烧相关数据上进行了验证。其他值得研究的主题可能包括将该模型应用于具有点火和不稳定燃烧效应等其他现象的燃烧系统。例如，可以借鉴Mittal和Pitsch[42]的方法，他们利用不同压力下的火焰单元数据中的压力膨胀项来考虑内燃机中的化学压力依赖性。只要提供足够的训练数据，该模型框架本身具有通用性，这一点通过其在高超音速流动[27]和湍流燃烧中的应用得到了验证。

**CRediT作者贡献声明：**
- Kai Niemietz：撰写原始草稿、验证、方法论设计、概念框架构建。
- Clément Scherding：验证、软件开发、方法论设计、形式分析。
- Walter Gemassmer：撰写与编辑、数据可视化、软件开发、实验研究。
- Taraneh Sayadi：撰写与编辑、项目监督、方法论设计、概念框架构建。
- Heinz Pitsch：撰写与编辑、项目监督、资源管理、资金筹措、概念框架构建。

热点排行