结合时间特征工程和遗传算法优化的混合LSTM-CNN模型用于温度预测 Farrukh Hafeez, Zeeshan Ahmad Arfeen, Touqeer Ahmed Jumani, Muhammad I. Masud, Nasser Alkhaldi, Ameer Azhar, Mohammed Aman, Mehreen Kausar Azam

《Eng》：Hybrid LSTM-CNN Model with Temporal Feature Engineering and Genetic Algorithm Optimization for Temperature Forecasting Farrukh Hafeez, Zeeshan Ahmad Arfeen, Touqeer Ahmed Jumani, Muhammad I. Masud, Nasser Alkhaldi, Ameer Azhar, Mohammed Aman and Mehreen Kausar Azam

【字体：大中小】 时间：2026年05月10日 来源：Eng 2.4

编辑推荐：

　　摘要精确的温度预测系统为管理户外活动、控制电力消耗以及在极端炎热地区确保公共健康和安全提供了重要保障。研究人员开发了一种混合长短期记忆网络-卷积神经网络（LSTM–CNN）模型，该模型利用来自沙特阿拉伯麦加的日时间序列数据来提高短期温度预测的准确度。预测

　　摘要精确的温度预测系统为管理户外活动、控制电力消耗以及在极端炎热地区确保公共健康和安全提供了重要保障。研究人员开发了一种混合长短期记忆网络-卷积神经网络（LSTM–CNN）模型，该模型利用来自沙特阿拉伯麦加的日时间序列数据来提高短期温度预测的准确度。预测任务定义为每日多步骤预测，生成1天、3天和6天后的温度预报。所提出的模型结合了LSTM网络来捕捉长期时间依赖性，并利用CNN来提取短期变化。系统使用时间特征、滞后特征和滚动统计特征来改进数据表示，而遗传算法（GA）优化则负责模型超参数的选择。该框架采用十折交叉验证来测试其性能，确保在所有测试场景下都能保持一致的性能。结果表明，经过GA优化的模型在1天预报中的平均绝对误差（MAE）为0.55°C，在6天预报中的MAE为1.28°C，R2值高达0.98。在基准测试中，该模型优于自回归整合移动平均（ARIMA）、LSTM和Transformer模型，在不同时间间隔内提供了更好的预测结果。这些发现表明，该模型在干旱至半干旱气候条件下展示了准确可靠的温度预测性能。

1. 引言
在应对极端天气条件的影响方面，准确的温度预测至关重要，特别是在像沙特阿拉伯麦加这样的地区，那里的温度变化剧烈[1]。夏季麦加的温度超过45°C。温度预测使当局能够规划降温措施和公共安全策略，并为恶劣天气做好充分准备，因为与热相关的疾病在这些环境中是一个严重问题。进行准确预测的挑战远非简单，温度预测是一个已建立的研究领域[2]。当极端高温与温度变化结合时，预测变得更加困难，并增加了户外环境中的安全风险。麦加的夏季温度超过45°C，且白天的温度还会更高。预测极端高温事件对于确保物流和安全措施的准备至关重要，因为高温会导致与热相关的压力、脱水和中暑[3]。预测这些极端事件最可能发生的时间和地点，可以提前采取预防措施。传统的温度预测模型通常基于较简单的环境，因此无法捕捉环境动态的全部复杂性[4]。温度预测的另一个挑战是理解不同气象变量之间的相互作用。温度受到三种不同时间尺度的影响，包括日常温度变化、季节性变化以及风速、湿度、太阳辐射和气压等特定天气条件。传统模型往往忽略了这些相互依赖性，从而导致预测结果不准确[5]。在许多地区，温度与湿度有关，而在像麦加这样的干燥沙漠气候中，高温通常伴随着较低的湿度。有效的预测应考虑这种关系，以避免错误预测[4]。

基于物理的、统计的和神经网络/深度学习模型常用于天气预测。这些方法根据太阳辐射、风速、湿度、降水量和云量等物理特性来计算未来温度[5]。基于物理的模型利用来自多个来源的传感器测量数据来计算温度，这些数据因地点而异。这些模型在长期温度时间序列预测方面表现更好，而在短期预测方面则表现较差。自回归整合移动平均（ARIMA）使用时间序列分析来预测短期和长期的变化[6]。ARIMA是一种流行的线性统计方法和时间序列预测及回归分析工具。ARIMA无法充分捕捉强烈的季节性是其主要弱点之一，因为温度具有强烈的季节性模式[7]。
最近的研究在AIoT系统中应用了带有优化的混合深度学习，包括用于工业故障预测的两阶段模型[8]和基于粒子群优化的泄漏电流分类框架[9]。这些研究进一步支持了将深度学习与优化技术相结合的有效性。由于最近研究中的进展，研究人员调查了CNN-LSTM方法在温度预测中的应用[10]。CNN-LSTM模型在时间序列研究和环境预测任务中表现出强劲的性能，这促使研究人员将其应用于温度预测问题[11]。例如，最近的研究在AIoT系统中应用了带有优化的混合深度学习，包括用于工业故障预测的两阶段模型[11]和基于粒子群优化的泄漏电流分类框架[12]。这些研究进一步支持了将深度学习与优化技术相结合的有效性。Gong等人[13]提出了一种用于温度预测的CNN-LSTM模型，其中CNN提取空间特征，LSTM捕捉时间依赖性。该模型通过使用先进的网络系统实现了更好的预测效果，因为它处理了天气数据。这项研究专注于架构设计，但排除了包括滞后和滚动统计在内的高级特征工程方法。Uluocak和Bilgili[14]开发了用于日常气温预测的LSTM-CNN和GRU-CNN混合模型。研究发现，在需要识别非线性温度变化时，混合模型比单一深度学习模型表现得更好。为了优化超参数，需要合理使用遗传算法，但遗憾的是，这项研究并未涵盖这一点。Wang和Wang[15]引入了一种经过GA优化的CNN-LSTM混合模型用于天气预测。当遗传算法与模型参数选择方法结合使用时，预测准确性得到了提高。该研究侧重于优化方法，但没有测试哪种特征工程技术能够提供最佳模型性能结果。Zhang等人[16]开发了一个基于CNN和LSTM的框架，该框架利用空间和时间特征提取来预测能源系统温度变化。该模型在模拟复杂温度变化方面优于其他模型。这项研究仅针对某一特定领域，其结果不适用于极端寒冷气候条件下的情况。Yasavoli等人[17]创建了一个混合深度学习系统，该系统结合了CNN和循环网络来预测未来温度。该模型在不同的数据集上测试时产生了可靠的预测结果。然而，该研究没有提供特征重要性的全面评估，也没有包括遗传算法等优化方法。Yu等人[18]提出了一种GA-CNN-LSTM混合模型用于湿度及温度预测，其中CNN提取局部特征，LSTM捕捉时间依赖性，而GA优化超参数。与传统方法相比，该模型展示了改进的预测准确性。然而，该研究侧重于模型优化，缺乏详细的特征工程，包括时间、滞后和滚动统计特征。??narer[19]开发了一种混合深度学习模型，该模型结合了CNN和堆叠集成方法来预测全球温度变化。该模型使用CNN从数据中提取特征，而LSTM处理时间信息。这种方法需要更多的计算资源，但没有结合先进的功能工程方法，从而降低了系统的可解释性和效率。

关于CNN-LSTM温度预测的研究在开发新的预测系统方面取得了进展，但仍需要改进特征提取方法，因为大多数研究主要集中在模型架构上。时间、滞后和滚动统计特征的集成仍然有限。此外，遗传算法与高级特征工程之间的相互作用尚未得到充分探索。大多数研究在中等条件下评估其方法，而在极端天气条件下的性能仍未得到充分测试。因此，需要一个结合混合建模、特征工程和优化方法的综合框架。
为了解决这些限制，本研究提出了一种增强了时间、滞后和滚动统计特征工程的CNN-LSTM框架，并使用GA进行自适应超参数调整，以提高极端气候条件下的温度预测准确性。本研究的主要贡献包括以下三个主要发现：
- 开发的混合LSTM-CNN框架通过捕捉长期时间模式和短期变化来预测多个未来时期的每日温度。
- 引入了一种全面的时间特征工程方法，该方法使用滞后特征和滚动统计措施来改进日常时间序列数据的温度预测。
- 该系统应用基于GA的优化进行自动超参数调整，从而提高了预测性能和模型的泛化能力。
- 在极端气候条件的日常气象数据测试中，所提出的框架比基线模型表现出更好的预测准确性。

本文有三个主要部分组织内容。方法论部分解释了混合框架的开发和GA优化过程。结果和讨论部分展示了不同预测时期的性能结果。文章最后提出了重要的发现和对未来研究的建议。

2. 研究方法
本研究提出了一种结合LSTM和CNN模型的混合方法，这些模型经过了GA优化和时间特征工程的增强。温度时间序列数据的收集过程始于研究人员从麦加获取环境数据。初始的数据预处理阶段包括缺失值替换，团队在开始缩放、选择特征以及提取时间特征、滞后特征和滚动统计特征之前进行了这一操作，这些操作将提高模型性能。模型设计使用LSTM预测长期趋势，并应用CNN来识别数据中的短期模式。混合模型使用GA进行超参数优化。研究将GA作为LSTM-CNN模型的外部优化工具，如图1所示。GA创建候选超参数集（包括学习率、批量大小和层数），研究人员通过训练LSTM-CNN模型来测试这些参数集。预测误差结果通过MAE和RMSE计算得出，并用于适应度函数。GA选择过程通过交叉和变异操作来选择最佳超参数设置。最终使用GA优化的超参数训练LSTM-CNN模型，从而实现了更好的预测准确性和泛化性能。模型评估过程使用标准指标（包括MAE、RMSE和R2）来评估多个预测时间框架的性能。研究通过多步骤预测框架执行其预测任务，使用日常时间序列数据来预测1天、3天和6天后的温度值。

2.1. 数据集描述
本研究使用NASA通过其网站提供的数据集来分析麦加的温度时间序列数据和环境数据，数据集的时间范围从1995年5月持续到2024年5月。该数据集基于每日观测，包括地面以上2米处的最高和最低温度、表面短波辐射、相对湿度以及风速等各种气象参数。数据集还允许分析长期温度趋势，包括最高值、最低值和平均值的局部变化，以及相关的环境因素（如湿度、风速和辐射），这些因素对于预测复杂的温度模式至关重要。数据集提供了1995年5月至2024年3月间麦加的每日最高温度记录（T2M_MAX）。时间序列显示了主要的季节性温度变化，导致在气温最高的月份温度峰值超过40°C。变量包括地面以上2米处的最高温度（T2M_MAX）、最低温度（T2M_MIN）、平均温度（T2M）、相对湿度（RH2M）、风速（WS2M）和表面短波辐射（ALL-SKY_SFC_SW_DWN）以及表面压力（PS）。麦加的最高温度通常在19.17°C到48.66°C之间，最低温度（T2M_MIN）在7.36°C到32.58°C之间。T2M温度的范围在13.29°C到39.50°C之间。相对湿度水平从5.48%开始，最高达到84.09%，风速范围在1.13 m/s到7.77 m/s之间。这些变量突出了该地区极端温度和相对较低湿度的特征。表1总结了数据集的主要统计特性。表1. 研究中使用的关键气象变量的描述性统计。最高的年度温度可用于估计麦加的温度分布。这表明存在相当高的变异性，有些年份在炎热月份显示出超过45°C的极端峰值。捕捉这些季节性波动的能力使该数据集非常适合建模温度模式。图2展示了最高温度测量值，显示了年度变化。麦加（1995–2024年）最高温度趋势分析。使用相关矩阵探索变量之间的关系对于确定气象数据集中的变量关系非常有用。图3所示的相关矩阵显示了一些气象变量之间存在强相关性。T2M_MAX代表目标变量，并未作为输入特征包含在内；相关性分析仅用于理解变量之间的关系并指导特征选择。这些数据可以广泛用于未来的温度预测，特别是因为它显示了T2M_MAX与T2M_MIN以及T2M_MAX与T2M之间的强相关性，这些相关性分别将最高温度和最低温度与平均温度联系起来，表明温度模式是可以预测的。温度与RH2M（湿度）之间的负相关性表明较高的温度与较低的湿度相关，这在像麦加这样的干旱地区通常是常见的现象。数据集还包括其他重要变量，如辐射和风速。辐射（ALLSKY_SFC_SW_DWN）与温度呈强正相关，而风速与温度的相关性不显著，但仍提供了有关当地天气条件的有用信息。图3显示了关键气象变量之间的相互关系。对数据集进行的统计测试用于确定其进行时间序列建模的能力，从而能够做出精确的温度预测，并研究主要气象要素之间的关系。进行了增广的Dickey–Fuller（ADF）测试以评估T2M_MAX（最高温度）序列的平稳性。表2的结果表明，T2M_MAX序列是平稳的，测试统计量为-8.14，显著低于1％、5％和10％的临界值。由于p值为1.03 × 10^-12，非平稳性的零假设被拒绝，从而确认温度数据可以在无需差分的情况下用于预测。表2显示了T2M_MAX序列的增广Dickey–Fuller（ADF）测试结果。T2M_MAX与其他气象因素（如RH2M（湿度）和ALLSKY_SFC_SW_DWN（地表短波辐射）的皮尔逊相关分析显示，T2M_MAX与RH2M之间存在强负相关（-0.74），表明最高温度的升高对应相对湿度的降低；T2M_MAX与ALLSKY_SFC_SW_DWN之间存在强正相关（0.73），表明温度的升高对应地表辐射水平的升高。这两种相关性在p < 0.001的情况下都是显著的，从而确认了这些发现具有统计学意义。表3列出了T2M_MAX与选定变量之间的皮尔逊相关系数。

2.2. 数据预处理
数据预处理对于确保数据集的有效准备以进行准确的温度预测至关重要。处理缺失数据是第一步，其中使用相应列的平均值填充缺失值。由于数据集中的缺失值比例非常小，因此采用均值插值作为一种简单高效的方法；然而，承认更高级的时间序列插值方法（例如插值）可能更好地保持时间依赖性，并可能在未来的工作中进行探索。图4描述了数据预处理的工作流程。这确保了数据中没有缺失值，并保持了数据集的完整性以用于建模。

2.3. 时间特征工程
时间特征工程被应用于温度预测模型以提高准确性。该过程首先对原始温度数据进行预处理，然后扩展特征集以捕捉长期趋势和短期波动。基线模型仅使用了预处理后的温度信号，其中时间t的温度表示为...（原始方程未在文本中提供）。为了捕捉季节性模式，添加了时间特征。由于数据集使用日间隔，这些特征包括td（一周中的天数）和tm（一年中的月份）。模型更新为...（后续方程未在文本中提供）。系统使用滚动统计特征来跟踪长期趋势，同时减少短期变化，使用滚动均值（μ(t,w)）和滚动标准差（σ(t,w)，这两者都需要窗口大小(w)进行计算。最后，结合滞后特征、时间特征和滚动统计量，完整的模型公式为...（后续公式未在文本中提供）。该模型能够进行更准确的温度预测，因为它可以识别季节性天气模式和时间基天气关系，这需要滞后指标和当前时间数据以及历史天气模式。研究采用了7的滞后阶数（n），使模型可以使用前七天的数据作为输入来跟踪短期时间模式。滚动窗口大小（w）设置为3，用于计算滚动均值和标准差特征，有助于减少短期波动。这些参数是基于经验考虑和日常温度模式的领域知识选择的。为了确保现实的日常预测设置并避免数据泄露，所有输入特征都仅从历史观测值构建。具体来说，使用气象变量的滞后值（例如T2M(t ? 1)、T2M_MIN(t ? 1)、RH2M(t ? 1)、ALLSKY_SFC_SW_DWN(t ? 1)作为模型输入，而目标变量对应于预测时间t + 1（1天）、t + 3（3天）和t + 6（6天）的未来日温度值。输入特征集中不包含同一天的（t）测量值。这确保了严格因果和操作上有效的预测框架。

2.4. 杂合模型超参数优化的遗传算法
在使用遗传算法（GA）进行超参数优化后训练混合模型。此过程确定了最佳的超参数组合，以实现有效的模型初始化和改进的预测性能。系统的关键超参数包括学习率η和批量大小b以及层数L，如图1所示。系统通过创建一个包含不同超参数组合的种群来生成候选解决方案。每个候选方案的评估过程使用包括MAE和RMSE在内的预测误差指标作为适应度标准。该选择过程偏好那些达到较低误差值的候选方案。表现最好的候选方案进入复制过程，通过两个父解决方案之间的交叉产生新解决方案。交叉将两个父解决方案结合成后代...（后续公式未在文本中提供）。交叉后，突变通过应用来自正态分布的小扰动稍微改变后代的超参数...（后续公式未在文本中提供）。优化后，使用选定的超参数训练混合模型。GA在预定义的范围内搜索学习率、批量大小和层数，这些参数是基于经验实验和标准深度学习实践选择的，以确保稳定的训练和高效的收敛。GA在30代中每代运行20个个体。交叉率为0.8，用于组合候选解决方案，而突变率为0.1，用于在种群中引入多样性。超参数搜索空间包括学习率（0.0001–0.01）、批量大小（16–128）和层数（1–3）。如表4所示，GA迭代地探索定义的搜索空间并选择最佳的超参数组合，然后使用这些超参数训练提出的混合模型。模型中使用的架构配置（例如64个LSTM单元、32个CNN滤波器、内核大小=3，如图5所示）是在GA优化之前基于初步实验确定的，并在优化过程中保持不变。这种设计选择限制了搜索空间到关键的训练超参数，同时保持了计算效率。GA配置参数（种群大小、代数、交叉率和突变率）是基于经验考虑和普遍采用的实践选择的。GA识别的最佳超参数配置用于训练最终模型。然而，基于GA的优化引入了额外的计算开销。在当前配置中，GA评估了600个候选模型（20个个体×30代），每个候选模型都需要完整的模型训练。实验在一个标准GPU支持的环境中进行（例如NVIDIA GPU，具有典型的CPU和RAM支持），由于重复评估，完整GA运行的总训练时间明显长于单个基线模型的训练时间。与固定超参数训练和随机搜索相比，GA方法需要更多的计算时间，因为其基于迭代的种群搜索策略。一旦确定了最佳超参数，最终模型只需训练一次，就可以高效地用于实时温度预测，而无需额外的计算开销。

2.5. 提出的混合模型
提出的混合模型结合了LSTM网络和CNN进行温度预测。LSTM组件捕捉长期依赖性和季节性趋势，而CNN捕捉局部模式和短期变化。因此，该模型可以表示温度数据的长期趋势和短期波动。LSTM网络建模时间依赖性，其输出表示为...（原始公式未在文本中提供）。LSTM操作定义为...（后续公式未在文本中提供）。CNN组件从温度数据中提取局部特征，以捕捉短期的波动。CNN层的输出计算为...（后续公式未在文本中提供），其中...（后续公式未在文本中提供）。最终温度预测是通过结合LSTM和CNN的输出得到的...（后续公式未在文本中提供）。LSTM和CNN分支都处理结构为（T × F）的相同输入序列，其中T是时间步数，F是输入特征的数量。LSTM分支能够捕捉长期的时间依赖性，而CNN分支则从相同的输入中提取短期的局部模式。方程（15）中的函数f(·)是通过连接LSTM和CNN分支的输出来实现的，随后是一个全连接（密集）层用于最终预测。LSTM分支使用了64个隐藏单元，而CNN分支应用了32个核大小为3的滤波器，然后进行池化和展平操作。两个分支的输出被连接起来并传递到密集层，如图5所示。模型中的可训练参数总数大约为数万个，具体数量取决于配置。所提出的LSTM-CNN混合模型的架构在图5中进行了说明。该模型以多变量日时间序列数据作为输入，其中T代表时间步数，F代表特征数量。该架构由两个并行分支组成。第一个分支使用两个各有64个单元的堆叠LSTM层。第一个LSTM层返回序列以捕捉数据中的时间依赖性。第二个分支应用了一个一维卷积（Conv1D）层，具有32个滤波器和3的核大小。这之后是一个ReLU激活函数和一个最大池化层（池化大小=2）来提取局部模式。然后展平得到的特征。两个分支的输出通过连接层结合在一起，再通过一个具有32个单元的密集层和ReLU激活函数，最后输出层生成1天、3天和6天的多步预测。

模型训练阶段在研究过程中至关重要，混合模型使用包含时间滞后和滚动统计特征的处理后的数据集进行训练。开始训练时，模型被输入数据，LSTM网络从中学习温度时间序列的长期依赖性。此外，CNN网络还学习局部模式和短期变化。通过在一个模型中优化这两种类型的架构来实现混合优势，因为这种混合可以同时捕捉全局和局部温度模式。在训练过程中，模型经历了多轮前向传播和反向传播以最小化损失函数。学习率、批量大小和迭代次数会根据模型的微调情况进行调整。可以采用早期停止技术来控制模型的过拟合并保持泛化能力。在下一阶段，将使用遗传算法（GA）对超参数进行微调，以提高模型的预测效率。为了分析，温度预测结果将与模型学习的历史信息进行比较。模型将使用各种数据集进行评估——包括训练集、验证集和测试集。

混合模型的性能评估包括多种预测准确性分析指标，如平均绝对误差（MAE）、均方根误差（RMSE）和决定系数（R2），这些指标用于评估模型的预测性能。根据评估结果，对温度预测的准确性和可靠性进行评价。该模型将在实际温度预测任务上与LSTM、CNN和传统的统计基线模型进行比较。

研究需要进行多次实验，以使用不同的模型配置和特征工程方法以及所有可用的评估指标来评估预测性能[14]。通过三种类型的特征——时间特征、滞后特征和滚动特征——来评估不同预测期的准确性，并使用交叉验证来验证结果。1天、3天和6天预测的日误差显示了预测性能随时间跨度的变化。表5展示了在最终超参数优化之前使用10折交叉验证获得的逐层结果。时间序列感知的交叉验证方法使用TimeSeriesSplit函数保持原始时间序列的分割，以便使用训练过程中未包含的即将到来的数据进行模型测试。没有应用随机洗牌。

添加时间特征（如星期几和一年中的月份）显著提高了模型准确性，MAE为0.92°C，RMSE为1.10°C。滞后特征改善了对历史温度数据的捕捉，但仍然导致略微较高的误差，MAE为0.98°C，RMSE为1.18°C。将时间特征与滚动统计相结合进一步提高了性能，MAE降至0.85°C，RMSE降至0.98°C。最终，结合所有特征（包括时间特征、滞后特征和滚动统计）实现了最低的误差，MAE为0.78°C，RMSE为0.88°C。表6总结了这些结果。表7展示了未经优化基线模型、随机搜索和遗传算法（GA）在不同预测时间范围内的性能比较。基线模型表示没有进行任何超参数调优的性能，而随机搜索作为一种传统的超参数优化方法，用于与所提出的GA方法进行公平比较。在本研究中，随机搜索从预定义的范围中采样超参数，如学习率（0.0001–0.01）、批量大小（16–128）和层数（1–3），并进行固定次数的迭代。每种配置都使用预测误差指标进行评估，包括MAE、RMSE和R2。表7显示了从基线模型到GA优化模型的逐步改进。

所有模型都在相同的数据集上进行了训练，并采用了相同的预处理步骤和特征集，包括时间特征、滞后特征和滚动特征。数据分割也保持一致，所有模型都应用了10折交叉验证。对于深度学习模型（LSTM、CNN、GRU和Transformer），超参数在相似的范围内进行了调整，以保持平衡比较。模型开发过程使用了标准技术来优化随机森林和XGBoost机器学习模型的性能。统计模型ARIMA和Prophet在实现时需要使用它们标准的模型配置。研究使用相同的实验框架和数据集对所有基线模型进行了测试。所有模型的评估都在相同的评估条件下进行。两种模型之间的测试环境保持不变，以便准确地将性能差异归因于模型设计本身。表8中的基准结果显示了使用GA优化模型的1天预测期。所有模型都接受了公平的比较，因为所有模型都应用了相同的输入特征，这使得它们之间的测试具有可比性，尽管较简单的模型可能无法处理复杂的特征集。

表7展示了基线模型（未经优化）、随机搜索和遗传算法（GA）在不同预测时间范围内的性能比较。基线模型表示没有进行任何超参数调优的性能，而随机搜索作为一种传统的超参数优化方法，用于与提出的GA方法进行公平比较。随机搜索在固定次数的迭代中从预定义范围内采样超参数。表7显示了从基线模型到GA优化模型的逐步改进。结果表明，随机搜索通过降低MAE和RMSE以及提高R2来改善性能。GA在所有预测时间范围内实现了最佳的整体性能，具有最低的误差值和最高的R2。随机搜索在尝试之间不进行反馈采样，而GA则通过进化操作在每一代中改进候选参数，使其更接近最优超参数。所有模型都在相同的预处理步骤和特征集上进行了训练。数据分割也保持一致，并且所有模型都应用了10折交叉验证。对于深度学习模型（LSTM、CNN、GRU和Transformer），超参数在相似的范围内进行了调整，以保持平衡的比较。模型开发过程使用了标准技术来优化随机森林和XGBoost机器学习模型的性能。统计模型ARIMA和Prophet在其实现时需要使用它们的标准配置。研究使用相同的实验框架和数据集对所有基线模型进行了测试。所有模型的评估都在相同的评估条件下进行。两种模型之间的测试环境保持不变，以便将性能差异准确地归因于模型设计本身。

表8展示了与其他预测模型的基准比较。比较基准显示，所提出的模型取得了最佳性能，MAE为0.55°C，RMSE为0.62°C，超过了所有其他模型。尽管LSTM模型的表现也不错，MAE为1.2°C，RMSE为1.5°C，但在捕捉局部模式方面不如所提出的模型。CNN模型稍微落后，MAE为1.3°C，RMSE为1.6°C，因为它无法有效建模序列依赖性。GRU模型的MAE和RMSE分别为1.0°C和1.3°C，使其成为LSTM的较快替代品，但仍不如提出的混合方法。Transformer模型表现良好，MAE为0.75°C，RMSE为1.0°C，得益于自注意力机制；然而，其性能仍不如提出的混合模型。XGBoost和随机森林也表现良好，MAE分别为1.0°C和1.2°C，尽管它们都无法捕捉温度数据的复杂序列模式。ARIMA和Prophet的性能最低，MAE分别为1.5°C和1.1°C，因为这些模型难以处理非线性依赖性和复杂的时间关系。表8中的相对改进分析（使用GA优化模型的1天预测周期）显示，所提出的模型在MAE上减少了63.33%，在RMSE上减少了65.56%，相比传统模型有所改进。这些结果表明，深度学习模型在捕捉时间序列内的复杂模式方面更有效，特别是在温度预测中。所选的基准模型包括广泛使用的经典和深度学习方法，包括基于Transformer的架构，提供了一个具有代表性的比较框架。

图6显示的1天预测表现出较强的性能，R2值约为0.96，MAE和RMSE值较低，反映了高精度。图7显示的3天预测范围内，预测准确性开始下降，R2值在0.89到0.92之间变化，MAE和RMSE的增加反映了不确定性的增加。图8显示的6天预测范围内，性能进一步下降，R2值在0.85到0.90之间变化，MAE和RMSE值最高，表明长期预测更加困难。图6显示了1天的预测性能。图7显示了3天的预测性能。图8显示了6天的预测性能。LSTM、CNN和混合模型的相关性分析确定了它们相对于实际值的预测温度值的有效性。图9、图10和图11显示了LSTM、CNN和混合模型的预测温度值与实际温度值之间的相关性。混合模型在模型中的相关性最高，预测值与真实值非常接近，从而支持了结合时间和空间属性的好处。相比之下，LSTM模型的相关性中等，反映了其捕捉序列模式的能力。CNN捕捉了局部模式，并有助于表示数据集的结构。模型性能的差异表明，结合具有不同优势的架构可以提高深度学习结果。表9显示了LSTM模型的预测和观测温度值。图10显示了CNN模型的预测和观测温度值。图11显示了预测和观测温度值之间的关系。图12和图13显示了研究整个期间的温度模式，展示了实际测量值和预测估计值。蓝线表示实际记录的温度，红色虚线表示从训练数据中获得的预测值。模型训练过程能够检测温度模式，研究人员通过将预测结果与实际测量值进行比较来评估模型准确性。该模型准确地表示了年度周期内及其21年评估期间发生的所有温度模式。模型展示了准确的历史数据匹配，使其能够预测未来的温度模式。该模型在2015年至2024年期间显示出预测准确性的下降，但其在训练和测试过程中的运行能力仍然保持稳定，这证明了其预测温度变化的能力。图12展示了训练阶段的观测温度和预测温度；图13展示了测试阶段的观测温度和预测温度。通过图14可以观察到均方误差（MAE）的变化情况，该误差反映了模型每年的性能表现。图表通过颜色渐变显示了误差分布情况，其中误差较大的区域超过了1.2的阈值，用红色标出。在气象模型中，任何超过1.0°C的温度误差都被视为显著误差。模型通过将误差控制在1.0°C以下，成功反映了温度变化情况，因为大多数误差都落在这一范围内。图14显示了每年的预测误差分布，并用颜色渐变表示MAE的大小。图15通过皮尔逊相关系数（Pearson correlation coefficients）来评估各个变量与目标变量T2M_MAX之间的关系，而不是使用基于模型的特征重要性方法（如SHAP或排列重要性）。相关分析表明，T2M_MIN与目标变量T2M_MAX之间的相关性最强，其次是RH2M和ALLSKY_SFC_SW_DWN（地表短波辐射），这些因素对温度变化有重要影响；而WS2M变量的相关性较低，表明它与温度变化的相关性较弱。研究结果表明，直接与目标变量相关的物理变量对温度变化预测有更大的影响。图中显示T2M_MAX作为预测目标，它既作为自相关基线，又不作为输入特征使用，从而避免了数据泄露。图15展示了变量之间的相互关系，以及模型如何从输入数据中提取特征的重要性。分析显示，LSTM–CNN混合模型通过其混合设计成功地捕捉了时间依赖性和局部温度变化。交叉验证结果显示，模型在不同测试数据集上的表现一致，表明其具有很强的泛化能力。随着预测周期的延长，预测误差会增加，因为预测过程中的多个步骤会导致不确定性累积增加。图14中的逐年误差分布分析表明，在极端夏季条件和自2015年以来的几年里，某些时期的MAE值较高。气候变化和极端温度事件以及气象模式的变化造成了非平稳条件，使得预测任务更加困难。在环境稳定的情况下，模型的表现最佳；但在环境突然变化时，其准确性会下降。与以往的研究结果相比，所提出的模型表现更好。现有方法由于结合了独立模型和混合架构，且缺乏完整的特征工程和优化技术，因此预测误差较大。所提出的框架通过较低的MAE值（1天预测时为0.55°C）和较高的R2值（0.98）展示了更出色的预测能力。LSTM–CNN混合模型之所以表现优异，是因为它可以同时处理多种数据特征：LSTM组件捕捉长期时间依赖性和季节性趋势，而CNN组件提取短期局部模式和波动。该模型通过互补的学习机制改进了温度动态的表示，优于单一模型。目前的研究使用了来自极度干旱地区的麦加数据，该地区具有稳定的季节性天气模式。这种气候条件对结果有影响，导致其与气候变化较大的地区的结果不同。NASA POWER再分析数据来自模型，其大气波动比地面测量数据小，可能会对测量精度产生不利影响。通过添加基于站点的数据集，验证过程将扩展到不同的气候区域，以检验该框架在不同环境中的适用性。

4. 结论：研究表明，所提出的LSTM–CNN混合模型在多个时间间隔内有效预测温度。该模型在1天预测方面的表现优异，MAE值为0.55°C，并且在所有验证测试中都保持了稳定的预测结果。时间特征、滞后特征和滚动特征的结合以及基于遗传算法（GA）的优化提高了预测准确性。然而，该模型也存在局限性：GA优化会增加计算负担，在资源有限的环境中可能带来挑战。此外，评估仅限于一个极度干旱的地区（麦加），需要进一步在不同气候条件下进行验证以评估其泛化能力。总体而言，所提出的方法为干旱气候条件下的温度预测提供了一个可靠的框架。

热点排行