长短期记忆（LSTM）递归神经网络预测变气候区流感样疾病流行趋势

《Immunity, Inflammation and Disease》：LSTM-Based Recurrent Neural Network Predicts Influenza-Like-Illness in Variable Climate Zones

【字体：大中小】 时间：2026年02月24日 来源：Immunity, Inflammation and Disease 2.7

编辑推荐：

　　这篇综述探讨了LSTM神经网络在跨气候区域流感（ILI）趋势预测中的应用与局限性。研究通过分析夏威夷、佛蒙特州和内华达州的数据，发现尽管气候变量与ILI仅存在弱至中度相关，但模型在跨区域预测中表现稳定，表明季节性模式（而非绝对气候值）是驱动ILI趋势的关键因素，这对通用性传染病预测模型的开发具有重要参考价值。

1 引言

流感样疾病（ILI）是每年导致高发病率和死亡率的重要原因，对公共卫生政策和基础设施构成持续挑战。在新型冠状病毒病2019（COVID-19）大流行背景下，流感的负担和影响变得更为复杂。研究表明，COVID-19与ILI具有流行病学上的相似性，例如季节性周期。尽管大流行初期的封锁措施暂时降低了ILI的发病率，但其已恢复至大流行前的水平，并将继续造成显著的疾病负担。理解驱动季节性流感传播的因素对于改进预测模型和制定前瞻性公共卫生干预措施至关重要。

多项环境变量，包括温度、湿度、紫外线指数和太阳辐射，与ILI发病率的季节性变化相关。地理气候差异，如热带、温带和干旱带之间的差异，已被证明会导致流感流行和高峰时机的不同模式。这表明，可能需要特定气候的模型来准确预测区域流感趋势。为验证此假设，本研究选取了代表三种不同、均质气候原型的美国州份：提供均匀热带数据集的夏威夷、代表温带四季气候的佛蒙特州，以及75%面积为干旱气候、代表沙漠气候的内华达州。通过聚焦这些区域，本研究旨在探索当地气候变异性对流感趋势的影响，并测试在一个环境中训练的预测模型应用于另一环境的泛化能力。

除了气候变量，许多其他因素也促成了流感的传播，包括人类出行模式和空气污染，这在开发预测流感趋势的工具时带来了挑战。

人工神经网络是疾病建模的有效架构，能够捕捉与多种传染病相关的非线性关系。递归神经网络，特别是长短期记忆架构，已成为预测流感的日益重要的工具。LSTM节点通过包含恒定误差转盘和“遗忘门”来解决神经网络中常见的梯度消失或爆炸问题。这两种特性使LSTM节点能够在保留其时间依赖记忆的同时偶尔重置。它们特别擅长捕捉时间相关的序列数据中的模式，例如股票价格趋势、天气和疾病发病率。这一优势使其适用于疾病预测，尤其是在考虑协变量天气数据时。

基于先前的工作，本研究应用LSTM递归神经网络来预测美国三个不同气候区域的ILI率。主要目标是确定区域气候变量如何影响这些模型的性能，以及在一个气候区域训练的模型在跨区域应用时是否保留预测效用。本研究假设，由于不同的季节性变化，在某一区域训练流感和气候数据的模型在应用于具有不同气候特征的另一区域时表现会不佳。

2 材料与方法

这些模型使用Python v3.9.13、TensorFlow v2.10和Keras API设计构建，并在Windows 11上本地运行。

2.1 数据收集与准备

流感数据从美国疾病控制与预防中心获取，为佛蒙特州、内华达州和夏威夷的每周未加权ILI百分比。数据时间跨度为2010年第40周至2023年第34周。在同一时间段内从Visual Crossing获取天气数据，包括温度、风速、紫外线指数、太阳辐射、降水和湿度。

数据使用Excel和Python进行准备。数据清理和编译后，使用z-score归一化进行标准化，创建了4周滞后的时间序列，并将其重塑为三维数组以供模型使用。为避免数据泄露，每个训练和测试集的数据均独立归一化。选择此时间滞后是因为在早期验证测试中，它优于滞后-1、-12、-16和-52周。

2.2 模型

构建了三个相同的模型，旨在预测下一周（+1周）的ILI值。一般模型架构先前已有描述和验证。超参数通过手动测试进行调整，并使用性能最佳的值。

简而言之，该模型构建了可变输入形状、双向500节点输入层、两个双向500节点LSTM隐藏层和可变形状的密集输出层。

训练了三个模型实例。每个区域数据集的前600周用于训练，74周保留用于最终测试。每个模型在其各自训练数据的80%上进行训练，20%用于训练验证。通过计算每次预测误差以及每个同区域测试集的均方误差来评估各区域的基线模型性能。进行Kruskal-Wallis H检验以确保三个模型在基线时的误差无显著差异。

为评估泛化能力和区域气候影响的差异，使用训练好的模型来预测来自其他两个区域中每个区域的400-600周数据。总体模型性能使用MSE进行评估和比较。

3 结果

3.1 各区域季节性流感趋势相似

各区域之间的ILI模式基本相似。夏威夷在约第200周有一个异常高的振幅峰值，但所有三个区域的数据均显示出相似的季节性。所有三个区域都显示出强烈的流感趋势季节性，其中夏威夷的绝对ILI值最大。气候数据也遵循相似的模式。夏威夷在全年温度、太阳辐射和紫外线指数的整体振幅变化较小。所有三个区域仍显示出基本的季节性模式。

3.2 各区域气候变量与ILI相关性不同

在所有三个区域，温度与ILI呈中度负相关（佛蒙特州 = -0.54，内华达州 = -0.56，夏威夷 = -0.44）。湿度在内华达州呈中度相关（0.47），在夏威夷与ILI呈弱相关（0.22）。佛蒙特州的ILI与湿度不相关。在所有三个区域，降水和风速均呈弱相关。太阳辐射和紫外线指数在佛蒙特州（-0.34， -0.36）和内华达州（-0.53， -0.55）显示出中度相关，但在夏威夷仅呈弱相关（-0.15， -0.18）。

3.3 基线模型在所有区域表现相似

当预测同区域测试数据的ILI率时，所有三个模型在基线时表现相似。佛蒙特州模型可实现0.353的MSE，夏威夷模型为0.099，内华达州模型为0.216。误差分布在模型之间大致均匀，Kruskal-Wallis H检验显示它们在统计上没有差异（p值 = 0.0794）。

3.4 模型能同样好地预测跨区域数据

在更大的跨区域数据集上进行测试，通常产生与基线性能相似的MSE。夏威夷和内华达州训练的模型性能略有下降，但仍处于基线合理范围内。最佳预测性能由佛蒙特州训练的模型预测夏威夷数据实现（MSE 0.179）。这比佛蒙特州基线性能有显著提高。实际上，两项跨区域预测都改善了佛蒙特州模型的MSE。内华达州训练的模型在两个测试集上的表现与基线相似。最差的预测性能发生在使用夏威夷训练的模型预测内华达州数据时。然而，该性能仍与基线性能相当。

尽管模型性能之间存在细微差异，但总体而言，每个模型的表现非常相似，并且都在基线性能的范围内。

4 讨论

本研究旨在评估LSTM神经网络对不同气候区域ILI的预测能力和泛化性。研究发现，在一个区域（例如佛蒙特州）训练的模型可以预测其他区域（例如夏威夷和内华达州）的流感趋势，其性能与它们的基础测试集相当。尽管温度、湿度、太阳辐射和其他气候变量存在显著差异，但这种跨区域性能的一致性表明，这些环境因素可能不是季节性流感趋势的主要驱动因素。

先前研究表明，气候变量确实改善了模型性能。然而，当模型在具有修改季节性的合成数据上训练时，预测会显著失效。结合当前结果，这表明季节性结构，而非绝对气候值，主导着ILI趋势。有趣的是，所有三个区域的ILI数据都非常相似。这与先前研究显示热带气候流感模式更平缓、季节性变化较小的结论有些相悖。虽然温度和湿度等气候变量以及气候区域先前已被证明与流感季节性相关，但我们的模型之间几乎没有观察到性能差异。这提出了一个可能性，即时间因素，如行为改变、学校日程或同步的出行模式，可能比绝对气候值更具影响力。

所有三个模型在基线时表现相似。MSE和误差分布存在一些变异性，但这是可以预期的，因为所有三个模型都在略有不同的测试集上进行了验证。这表明该模型对训练数据中气候因素的变化具有鲁棒性，并且气候变量的变化幅度对模型性能的重要性低于其变化模式。例如，尽管佛蒙特州每年的温度波动达76^°F，而夏威夷仅为15^°F，但两个区域都产生了相似的预测结果。

这里呈现的结果将气候变量定位为流感趋势的相关指标，而非机制性驱动因素。值得注意的是，最强的气候-ILI相关性出现在季节更明显的佛蒙特州和内华达州。相比之下，夏威夷显示出较弱的关联，尽管其季节性ILI值具有可比性。这就提出了一个问题：流感遵循季节是由于环境压力，还是由于人类活动的同步模式。在实验室环境中，有证据表明气候变量确实会影响流感的传播和扩散。但由于疾病传播和现代出行模式的复杂性，气候在现代人群中可能不那么重要。也就是说，在考虑年度流感传播和负担时，基于人口的因素比气候因素重要得多。

因此，这对流感建模具有实际意义。研究结果表明，即使在气候条件不同的其他区域，经过数据丰富、监测水平高的地区训练的时间序列模型也可以应用，而不会出现显著的性能损失。这在公共卫生基础设施有限或流感报告不一致的环境中可能很有价值。

4.1 局限性

本报告存在几个局限性。新冠（COVID-19）现在已经存在，并且实际上无法从ILI数据集中与流感分离。由于预计这种情况在未来几年将持续，我们避免尝试系统性地校正其影响。然而，COVID-19的存在，特别是其在大流行期间对流感模式的影响，可能会影响此处提出的结论。

数据也仅限于在重叠时间段内可用且以相同时间尺度记录的每周流感和天气数据。虽然包括超过目前可用的12年数据可能会提高性能，但程度可能不大。

此外，所选的区域（单个州）并非其气候区的完美代表。ILI率是全州范围记录的，而气候数据通常来自一个或少数几个气象站汇总。这在数据中产生了固有的噪声和不精确性。州内部也并非均一，可能因地点、海拔和其他环境因素而在气候和天气模式上存在差异。

最后，本报告未考虑可能影响流感传播的其他潜在变量。根据呈现的结果和现有文献，似乎存在其他驱动流感趋势的重要因素，包括花粉、出行、室内环境变量和其他并发疾病。

4.2 未来应用

本文的结果可以通过几种方式应用或扩展。实际上，我们已经证明了这种建模方法对气候和流感数据的变化具有鲁棒性。这允许将一个在流感报告质量高、一致且气象站可靠的区域训练的模型，应用于没有这些资源的区域。因此，可以做出预测并评估潜在的流感负担，而无需定制模型。这在流感数据有限或最近才开始追踪的地区尤其有用。

此外，这些发现可能有助于将建模工作重新聚焦于整合人口层面和行为数据，这些数据可能被证明在驱动流感动态方面更为根本。未来的工作应探索纳入诸如学校日历、出行数据或社交距离模式等变量如何提高预测模型的准确性和可解释性。

这个或类似的模型也可以扩展到基于网络的方法，其中多个在分散城市或州数据上训练的链接模型共同为感兴趣区域的ILI预测提供信息。

5 结论

考虑到本文所呈现建模方法的已知局限性，很难对流感趋势背后的流行病学过程得出强有力的结论。然而，我们的结果可能为实际建模和对流感模式的理论理解提供一些启示。首先，我们证明了LSTM模型对数据变化具有鲁棒性，并且在跨气候区域具有高度的泛化性。这支持了此类模型在短期ILI预测中的实用性，即使在应用于不同地理或气候背景的数据训练时也是如此。其次，虽然温度、湿度和太阳辐射等气候变量在某些区域与ILI呈中度相关，但它们的预测能力似乎并非源于其绝对值。相反，我们的结果表明，这些变量的季节性模式在预测ILI趋势中起着更具影响力的作用。需要进一步的研究来阐明气候与其他人口变量之间的影响。这在决定公共卫生政策、预测流感负担以及制定减轻该负担的策略时尤为重要。

热点排行