《Spatial Statistics》:Spatiotemporal modeling of COVID-19 cases using human movement and activity index
编辑推荐:
人类活动与跨区域流动对伦敦COVID-19传播的影响研究。采用贝叶斯层次时空模型分析2020年3-12月983个MSOA区数据,发现地理邻近活动模型与通勤流动模型拟合效果相近,空间随机效应显著,时间分层显示 mobility-disease系数从正转为负,验证了细尺度时空建模的有效性。
Poshan Niraula | Edzer Pebesma
德国明斯特大学地理信息学研究所
摘要
人类活动在COVID-19等传染病的传播中起着重要作用,因此在分析传播模式时必须考虑人类活动。由于数据获取限制和隐私问题,通常会汇总不同空间和时间尺度上的传染病传播数据。本研究探讨了COVID-19每周发病率、人类活动指数以及细粒度空间尺度上的区域间流动之间的关系。
我们使用贝叶斯层次时空模型,对2020年3月至12月大伦敦地区的中间层超级输出区域(MSOAs)的COVID-19每周发病率进行了建模。我们构建了两种类型的指标:一种是通过工作通勤流量与目的地活动水平相结合的流动性指标;另一种是通过地理邻近性来权衡活动的空间指标。模型考虑了特定区域的空间随机效应、时间效应以及区级时空效应。两种基于活动的模型都比基线模型有所改进,其中空间随机效应被证明至关重要。使用地理邻近性的模型与使用工作通勤数据的模型表现几乎相同。时间分层显示出了显著的变化:在疫情中等传播阶段,流动性-疾病系数为正;而在年末疫情爆发期间,该系数变为负值。
我们提出了一个模型,用于同时研究人类流动性、人类活动和COVID-19病例,从而提供了关于它们综合效应的新见解。当采用稳健的时空建模方法时,简单的地理邻近性能够与工作通勤数据一样有效地捕捉传播模式。流动性-疾病关系的时间变化强调了在疫情演变过程中进行阶段分层分析的重要性。这些模型成功再现了空间传播模式,验证了它们在小范围区域监测应用中的实用性。
引言
了解COVID-19等传染病的空间和时间传播对于防止其扩散至关重要。空间因素在研究传染病传播过程中起着重要作用,因为感染很容易蔓延到邻近地区,个体可能会将疾病带到他们访问的地方。同样,时间因素也很重要;某一天的感染人数通常与随后几天的感染趋势有关。COVID-19传播的一个主要途径是通过人类活动。病毒通过空气迅速传播,因此如果感染者出现在拥挤的地方,他们很可能会将病毒传染给其他人。此外,感染者从一个地区移动到另一个地区可能会将疾病引入新的区域,并在这些区域内进一步传播。因此,一个地区的COVID-19病例可以被视为人际接触和个体移动的函数。减少人类活动已被证明对控制流行病和大流行病有效;然而,目前缺乏可靠的实时指标来预测疾病传播并指导政策决策。这一空白主要是由于缺乏关于人类活动的定量数据。
位置智能技术的进步现在使得能够分析来自移动设备的数字追踪数据,为疫情分析和其他应用提供了有关人类流动性和行为的宝贵见解。许多研究(Kang等人,2020年;Nepomuceno等人,2022年;Tyrovolas等人,2021年;Kraemer等人,2020年;Tokey,2021年;Slater等人,2022年)已经证明,利用这些数据集,人类流动在COVID-19传播中发挥了重要作用。尽管这些数据集很重要,但由于隐私问题,获取用于理解传染病传播的人类流动性数据却很困难。个体级别的流动数据集非常罕见,样本量通常较小,无法充分捕捉个体之间的互动,而且可能无法在疾病传播情境中进行背景化。因此,描绘大规模人口流动的聚合数据集更为普遍。例如,西班牙的每日起点-终点矩阵(交通与可持续移动部(MITMS),2024年)展示了人们在不同地区之间的流动情况,但没有透露个人细节。同样,英格兰和威尔士在COVID-19期间的工作通勤模式数据集(国家统计局,2023b年),以及美国的步行交通数据集(Advan Research,2025年)提供了估计的流动模式。其他各种指标,如Google趋势(Google,2020年)也提供了有关人口流动的见解。
人类流动性在COVID-19传播中的作用已得到广泛研究,揭示了出行模式如何影响传染病的传播。Kraemer等人(2020年)进行了将人类流动与COVID-19传播联系起来的研究,特别关注了武汉这一焦点。他们的研究发现,武汉早期的移动显著影响了病毒在其他中国省份的传播,尽管当地动态逐渐发挥了更重要的作用。Francetic和Munford(2021年)使用人口普查数据研究了2020年3月至6月英格兰的通勤模式。他们的空间回归分析表明,尤其是涉及公共交通的较高通勤流量与COVID-19死亡率增加相关。这突显了流动性在跨越区域边界传播疾病中的重要作用。
Chang等人(2021年)开发了一个SEIR模型,该模型结合了来自手机数据的动态流动性网络,捕捉了美国主要城市的COVID-19传播情况。模型显示,由于拥挤的兴趣点和较少的流动性减少,弱势群体面临更大的风险,这突显了暴露和传播风险方面的社会经济差异。同样,Coleman等人(2022年)利用StreetLight数据和SafeGraph数据集的起点-终点矩阵表明,美国的低收入和非白人群体面临更高的暴露风险,强调了病毒传播中的不平等现象。同时,在丹麦,Edsberg M?llgaard等人(2022年)分析了移动网络和Facebook Data-For-Good项目的数据,评估了在较宽松的封锁期间的流动性和社会行为。结果表明,旅行限制并不一定与有效的控制措施相关,表明减少流动性的策略还必须考虑各种社会行为才能成功。
Gao等人(2021年)专注于2020年1月至3月的初期爆发阶段,使用了城市指标(如Venables距离和活动密度)进行研究。通过分析不同社会和工作环境中人类活动对COVID-19传播的滞后效应,他们发现某些活动与病毒再生数之间存在滞后关系。尽管他们的研究提供了宝贵的见解,但受到类别选择主观性和时间范围较短的限制。Xi等人(2020年)在中国也探讨了流动性的时间滞后效应,发现流动性变化与COVID-19感染之间存在10天的滞后。在人口密集且城市基础设施更完善的城市中,这种滞后较短。他们的发现强调了紧凑城市区域实施严格流动性限制的必要性,而经济富裕的城市应采取额外的非药物干预措施。
理解传染病传播的另一个重要维度是年龄分层,因为控制疾病传播的接触模式在不同年龄组和学校、工作场所和家庭等环境中存在显著差异(Mistry等人,2021年)。基于年龄的模型对于评估政策干预(如学校关闭)至关重要,表明传播风险和控制措施的影响高度依赖于年龄(Bekker-Nielsen Dunbar等人,2024年)。虽然我们的流动性和活动数据没有按年龄分层,但在未来这些数据可用时,结合特定年龄的传播动态是一个重要的研究方向。
这些研究共同强调了将人类流动性作为疾病传播指标的复杂性。它们强调了采用多方面方法的必要性,这些方法需要考虑人类移动的空间和时间方面,以制定有效的公共卫生政策。虽然将病例引入新区域是众所周知的,但由于规模较小和数据缺乏,了解疾病在本地如何传播仍然很困难。例如,Slater等人(2022年)利用移动数据重新定义了社区结构,将流动性纳入模型以提高预测性能。尽管该方法考虑了区域间的传播,但未考虑这些区域内更小尺度上的传播。人类活动指数数据集(Mapbox,2024年)可以通过测量潜在的接触可能性来帮助理解这些本地传播模式。
基于这一理解,我们旨在通过结合流动性和活动指数来建模COVID-19病例动态。我们还考虑了这些因素随时间的延迟效应。本文提出了一种将区域间人类流动性和活动指标(称为活动指数)纳入时空模型的新方法。通过这样做,我们旨在提高预测性能,并更深入地了解流动性、活动和疾病传播之间的相互作用。
研究区域和COVID-19病例
伦敦是英国的首都和最大城市,是一个历史悠久且充满活力的大都市,以其繁忙的旅游业和作为全球主要商业中心的地位而闻名。该市人口约为890万,面积为1572平方公里(国家统计局,2024年)。它由33个地方政府辖区组成:32个伦敦自治市和伦敦金融城。其中,有12个被指定为内伦敦自治市,其余21个为……
模型
我们指定了一种时空贝叶斯层次模型。响应变量是2020年3月16日至2020年12月28日大伦敦地区983个MSOAs报告的COVID-19病例的每周计数。假设遵循Poisson分布,其中表示大伦敦地区第周的第