《Scientific Reports》:Climatic and governance determinants of malaria transmission in Rivers State, Nigeria
编辑推荐:
本研究针对尼日利亚河流州疟疾防控需求,通过整合气候变量(温度、降雨量、相对湿度)与治理政策变量(以2015年为界划分政策阶段),系统比较了Poisson、准Poisson、负二项回归与SARIMAX模型的预测性能。结果表明,SARIMAX(1,1,0)(1,1,1)12模型在捕捉疟疾发病时空动态方面表现最优,其预测误差(MAE=3957.66,RMSE=5982.50)显著低于传统计数模型,揭示降雨量(β=259.71,p=0.022)和政策阶段(β=-38620.57,p=0.022)是影响疟疾发病的关键因素。研究为热带地区疟疾早期预警系统的构建提供了方法论支持,凸显了多维度因子协同建模的公共卫生价值。
在热带地区,疟疾仍是威胁公共健康的重大挑战,尤其以尼日利亚疫情最为严峻。河流州作为该国疟疾高发区,尽管多年推行防控措施,传播强度仍居高不下。疟疾动态受多重因素驱动:气温影响疟原虫在蚊媒体内的发育速率,降雨为蚊虫孳生创造水体环境,湿度调节蚊虫存活周期。然而,这些气候要素的效应常因地域差异而结论不一。更关键的是,政府防控策略的调整(如资金分配、蚊帐分发、卫生系统效能)可能深刻改变疾病传播轨迹。2015年河流州行政管理体制变革,为量化政策影响提供了自然实验场景。现有研究多聚焦气候变量的独立作用,缺乏对政策因素与气候协同效应的建模,且未系统比较不同统计模型在疟疾预测中的性能差异。
为破解这一难题,Egbom等人在《Scientific Reports》发表研究,首次将气候指标与治理变量纳入统一分析框架,旨在揭示河流州疟疾传播的核心驱动因子,并筛选最优预测模型。研究团队收集了2007至2021年共180个月的疟疾发病数据,结合NASA POWER卫星提取的月均温度、总降雨量、相对湿度,并设置季节变量(湿季4–10月编码为1,干季11–3月编码为0)与政策阶段变量(2007–2015年编码为0,2016–2021年编码为1)。针对因医务人员罢工导致的缺失数据,采用自回归积分滑动平均(ARIMA)模型进行插值,确保时间序列完整。技术方法核心包括:① 利用Poisson、准Poisson、负二项模型处理过度离散的计数数据,通过比较平均绝对误差(MAE)、均方根误差(RMSE)筛选最佳参数模型;② 构建季节性自回归积分滑动平均外生变量(SARIMAX)模型,引入气候与政策变量作为外生预测因子,通过超参数调优确定最优结构;③ 采用增强迪基-富勒(ADF)检验、自相关函数(ACF)与偏自相关函数(PACF)诊断序列平稳性,结合五折时间序列交叉验证评估模型泛化能力。
数据特征揭示疟疾发病时空异质性
疟疾发病数呈现明显正偏态分布(图2),且方差远高于均值(图5),证实数据存在严重过度离散(离散参数=3892.269,p<0.001),传统Poisson回归不再适用。时间序列图(图1)显示2007–2013年发病趋势平缓,2014年后波动加剧,可能与诊断标准变更、罢工事件或政策更迭相关。月均发病高峰出现在1月(约18372例),低谷为12月(约12161例),而10月变异程度最高(标准差≈9701例),暗示季节性暴发风险(图4)。
准Poisson模型优于传统计数回归
在三种计数模型中,准Poisson模型的MAE(5682.45)和RMSE(7394.77)均低于负二项模型(表5),且温度是唯一显著预测因子(β=0.298,p<0.001)。但其预测曲线过于平滑(图6),难以捕捉发病峰值,提示需引入时间依赖性建模。
SARIMAX模型精准捕捉季节与政策效应
通过ADF检验与ACF/PACF图(图9–10)确定序列需经一阶差分与季节差分(d=1,D=1)达到平稳。超参数调优选定SARIMAX(1,1,0)(1,1,1)12为最优结构(表6),其残差通过Ljung-Box检验(p=0.41),满足白噪声假设。结果(表7)显示:
- •
降雨量每增加1单位,发病数上升259.71例(p=0.022),置信区间[38.24, 481.19]全为正,印证降雨通过扩大蚊虫孳生地助推传播;
- •
政策阶段(2016–2021年)关联发病数下降38620.57例(p=0.022),表明后期治理优化可能提升防控效能;
- •
干季(相较于湿季)发病数降低34690例(p=0.017),反映季节本身对传播的独立影响;
- •
季节性移动平均项(MA(12))系数-0.821(p<0.001)提示年度周期性强,异常波动可在一年后自我修正。
模型比较验证SARIMAX预测优势
SARIMAX模型的MAPE(65.14%)、MAE(3957.66)、RMSE(5982.50)均显著低于准Poisson模型(表8),其拟合曲线(图11)更贴合实际发病峰值,尤其在2014年后波动阶段表现稳健。联合图12直观显示,SARIMAX能同步捕捉长期趋势、季节周期与政策突变点,而准Poisson模型仅能反映基础气候效应。
结论与讨论:迈向整合气候-治理的预警系统
本研究证实,河流州疟疾传播受降雨驱动与政策干预的双重调控,而SARIMAX模型通过融合时空自相关性与外生变量,实现了更精准的短期预测。其优越性源于对序列依赖结构的显式建模——例如负自回归项(AR(1)=-0.234)提示月间发病存在反馈机制,而强季节性移动平均项(MA(12))凸显年度循环规律。相较之下,传统计数模型因忽略时序依赖性,难以应对突发疫情。
研究局限性在于模型对2014年后结构性突变的解释力不足,未来可引入断点检测或马尔可夫机制转换模型增强灵活性。此外,遥感数据与社区级社会决定因素的嵌入,有望进一步提升模型分辨率。本成果为尼日利亚落实世界卫生组织(WHO)疟疾消除战略提供了方法论工具,亦为热带地区环境健康决策提供了跨学科范式。