《Epidemics》:Enhancing Influenza-Like Illness forecasting: An ensemble approach combining mathematical and deep learning models amidst the COVID-19 pandemic
编辑推荐:
本研究聚焦于COVID-19大流行对流感样疾病季节动态的冲击,为应对传统预测框架面临的挑战,研究人员开展了一项结合机理(n-亚流行病模型)与深度学习(蒙特卡洛Dropout LSTM)的集成建模新方法研究,以提升韩国特定年龄分层的ILI短期预测性能。结果表明,该集成模型在多个评价指标上优于单一方法,为改善疫情防范与响应提供了灵活、数据驱动的适应性框架。
准确预测流感样疾病(ILI)的短期趋势,是公共卫生应对的“前哨”与“指南针”,它关乎医院能否提前应对患者激增、疫苗资源能否精准投放、以及非药物干预(如社交距离)措施能否及时启动。然而,ILI的传播动态复杂多变,受种群免疫力波动、气候、人口流动等多重因素影响,预测本身已是巨大挑战。COVID-19大流行的到来,更让这一挑战雪上加霜。为防控新冠病毒,全球各地广泛实施的戴口罩、保持社交距离、旅行限制等非药物干预措施,在抑制COVID-19传播的同时,也戏剧性地减少了包括流感在内的其他呼吸道病原体的传播,导致ILI病例数量锐减,传统基于疫情前数据的预测模型因此“水土不服”,难以适应这种被疫情重塑的疾病动力学。在这种背景下,亟需一种能够适应大流行期间和之后变化、既可靠又能提供不确定性评估的预测新框架。
传统流行病学模型(如分室模型、数学时间序列方法)基于明确的疾病传播动力学假设,具有可解释性,但往往难以捕捉现实数据中复杂的非线性时序依赖关系。另一方面,深度学习模型,特别是循环神经网络及其变体(如长短期记忆网络),在时序数据建模上展现出强大的预测能力,但它们可能对有限的训练数据敏感,且模型解释性相对较弱。为了克服这些局限性,本研究提出了一种创新的集成建模框架,将机理模型与深度学习模型相结合,旨在整合二者的优势,提高ILI预测的准确性和可靠性。
为开展这项研究,研究人员主要应用了以下几种关键技术方法:首先,数据来源于韩国疾病管理本部自2017年起收集的、按年龄分层的每周ILI发病率数据。其次,建模框架的核心是集成方法,其一是基于n-亚流行病轨迹的机理模型,其二是使用蒙特卡洛Dropout进行不确定性量化的双向LSTM深度学习模型。此外,研究还纳入了ARIMA模型和朴素(Flat-line)模型作为基准进行比较。最后,模型的预测性能主要通过加权区间评分、平均绝对误差等指标进行全面评估,特别强调了对预测不确定性(置信区间)的量化评估。
3. 结果
3.1. 总体及特定年龄ILI预测的加权区间评分
研究评估了包括机理模型、深度学习模型及其混合模型在内的多种模型在四个流行病波次(波次1-4)中的预测性能。汇总结果表明,混合n-亚流行LSTM模型在大多数年龄组,特别是儿童和青少年(0-18岁)中,取得了最低的加权区间评分和平均绝对误差,显著优于单一的机理模型或深度学习模型。例如,在7-12岁年龄组,混合模型的平均WIS为12.33,而ARIMA模型为38.88,单独的Ensemble(W)模型为33.23。年龄分层分析揭示了预测准确性的显著差异,突显了年龄结构化建模方法的重要性。混合框架在捕捉儿童和青少年的动态方面表现出色,但在13-18岁年龄组,由于存在快速连续的多重发病高峰,且历史数据中类似模式较少,其准确性有所下降。
3.2. 预测区间覆盖率与不同预测时段的性能
对预测性能按预测时长(1-4周)的分析显示,对于极短期(一周前)预测,机理模型与基于LSTM的方法在平均WIS上差异不大,但LSTM模型能提供更准确、更窄、响应性更强的预测区间。对于2至4周的较长期预测,深度学习模型在WIS和MAE方面持续优于纯机理方法。在混合配置中,ARIMA-LSTM和n-亚流行LSTM模型在所有四个波次和所有预测时段都取得了最佳的平均分数。n-亚流行LSTM模型在捕捉发病高峰时间方面表现出更优的能力,这归功于其直接整合了n-亚流行预测所编码的流行病动力学信息,但这有时会以预测区间略微变宽为代价。
4. 讨论
这项研究强调了精确的ILI短期预测对有效公共卫生响应的必要性。结果表明,结合机理和深度学习方法的集成模型,在年龄组和流行病波次上始终优于单一模型。这证明了将可解释的流行病结构与数据驱动的时序学习相结合,能够提供更准确的点预测和明确的、量化的预测区间。研究观察到预测性能在不同年龄组和波次间存在显著差异,这凸显了需要灵活、自适应的模型来应对不断变化的传播模式和数据条件。
混合n-亚流行LSTM模型在WIS和MAE上相对于独立的n-亚流行模型和LSTM模型均有显著降低,在儿科和青少年年龄组尤为明显。这表明机理预测提供的结构信息可以被LSTM有效精炼。在动态更平滑的老年组,混合模型带来的改善虽然较小但依然稳定。尽管纯数学模型和统计模型在理解疾病进程方面具有清晰的可解释性,但它们通常难以准确捕捉ILI发病率数据中固有的非线性趋势和短期波动。以蒙特卡洛Dropout LSTM为代表的深度学习模型在捕捉复杂时序依赖方面表现出强大能力,但面对数据变异时可能存在过拟合风险。本研究提出的集成模型有效结合了两种方法的优势,显著提高了预测准确性。
总而言之,这项研究开发的集成框架,通过巧妙融合机理建模的流行病学洞见和深度学习的模式识别能力,为应对COVID-19大流行后复杂的呼吸道疾病预测挑战提供了一个强大、灵活且可靠的解决方案。它不仅提升了预测的精准度,还通过蒙特卡洛Dropout等方法提供了至关重要的不确定性量化,为公共卫生决策者提供了更可信赖的数据支持,对优化医疗资源配置、指导精准干预措施、提升未来新兴传染病威胁的应对准备能力具有重要意义。