利用隐马尔可夫模型(HMM)从动物移动数据中检测疾病进展:一种野生动物疾病监测与“同一个健康”预警的新工具

【字体: 时间:2026年03月01日 来源:Journal of Applied Ecology 4.8

编辑推荐:

  本文介绍了如何利用隐马尔可夫模型(HMM)从动物移动数据(如步长、转角)中推断野生动物(以非洲剑羚为例)的疾病状态(如易感、感染、死亡),为难以直接采样诊断的野生动物种群提供了一种基于行为变化的疾病早期监测与预警方法,具有重要的保护和管理应用价值。

  
1 引言
传染病是动物生活史的重要组成部分,会影响宿主的移动,并导致发病率和死亡率升高。许多病原体会改变宿主行为,包括减少移动。这表明动物追踪数据(如GPS)可能提供一种推断感染状态的方法。然而,直接在野外从自由活动的动物身上收集诊断样本在后勤上非常困难且成本高昂,这限制了我们对疾病与野生动物移动之间复杂关系的理解。近年来,高致病性禽流感(HPAI)H5N1病毒和严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2)在野生动物中的出现,凸显了开发新工具来检测疾病和量化疾病进展的迫切需求。将动物移动与传染病动态联系起来,不仅可以揭示病原体-宿主相互作用发生的时间和地点,还为符合“同一个健康”(One Health)框架的综合疾病生态学研究提供了机会。
隐马尔可夫模型(HMM)在流行病学中常用于从监测数据中检测疾病进展,在移动生态学中也已成熟用于从追踪数据推断动物行为变化。然而,利用HMM从移动数据推断野生动物疾病进展的应用仍然很少见。本研究旨在开发一个建模框架,将动物移动与疾病过程联系起来,使用HMM来推断感染状态,其中感染状态被视为隐藏(未观测)状态,而移动模式(如步长和转角)则作为状态依懒的观测值。
2 材料与方法
2.1 研究系统
本研究以重新引入乍得Ouadi Rimé–Ouadi Achim动物保护区(RFOROA)的非洲剑羚(Oryx dammah)为案例。剑羚是一种大型非洲羚羊,由于过度捕猎等原因,在野外一度灭绝。自2016年起,阿布扎比环境署(EAD)与乍得政府合作,将人工繁殖的剑羚重新引入该保护区。大部分(>95%)重新引入的剑羚佩戴了GPS项圈,以1-4小时的频率收集位置数据。
2.2 大规模死亡事件
2018年8月下旬至11月初,重新引入的剑羚种群发生了一次大规模死亡事件(MME),原因是多种病原体、细菌和寄生虫感染,包括裂谷热(RVF)、小反刍兽疫(PPR)和巴贝斯虫病。2018年雨季异常高的降雨量与昆虫数量激增,为疾病传播创造了有利条件。在研究期间(2018年7月11日至10月1日),有38只剑羚死亡。
2.3 病原体感染
在一次兽医现场任务中,从10只剑羚(5只活体,5只尸体)收集了样本进行检测。所有被采样的剑羚都对多种传染病检测呈阳性,存在共感染现象,且除一例外全部死亡。最终分析中包含了其中6只个体的数据。
2.4 动物移动数据与环境协变量
研究使用了84只剑羚的GPS移动数据。在分析前,排除了释放后24小时内的数据以消除可能的释放应激影响。从移动数据中计算了步长和转角作为主要分析变量。此外,还计算了灌丛覆盖度和释放后时间作为可能影响状态转移的协变量。
2.5 隐马尔可夫模型(HMM)构建
研究使用R语言中的momentuHMM包拟合了一系列HMM。模型假设步长服从伽马分布,转角服从冯·米塞斯分布,其参数依赖于隐藏状态。研究测试了多种模型结构,以反映不同的宿主-疾病动态假设:
  1. 1.
    无约束4状态HMM(SIS模型):包含易感探索(SE)、易感休息(SR)、感染(I)和死亡(D)状态,允许所有状态间(除死亡外)相互转移,代表易感-感染-易感过程。
  2. 2.
    约束4状态HMM(SI模型):基于观察,约束了转移概率,不允许从感染状态恢复,且假设感染只能从休息状态发生,死亡只能从休息或感染状态发生。这反映了研究系统中恢复罕见的情况。
  3. 3.
    约束4状态HMM(SIR模型):包含易感(S)、感染(I)、恢复(R)和死亡(D)状态,假设个体恢复后获得免疫。此模型在研究案例中未识别出恢复个体,但通过模拟数据展示了其潜力。
  4. 4.
    约束4状态分层隐马尔可夫模型(HHMM):包含两个时间尺度,粗尺度(3天)处理流行病学状态(易感、感染、死亡)间的转移,细尺度(每小时)处理易感个体内的行为状态(探索、休息)转移。
2.6 模拟框架与模型验证
研究还通过模拟数据生成了20个体30天的每小时移动轨迹,用于测试SIR模型在恢复情景下的表现。对于剑羚案例,通过将估计的状态依懒分布与经验分布叠加、绘制个体步长时间序列、并使用伪残差和自相关函数(ACF)图来验证模型。同时评估了模型对38只确认死亡个体的分类能力。
3 结果
3.1 无约束(H)HMM(SIS模型)的表现
无约束4状态HMM预测状态间频繁转换,例如个体每天在“易感”和“感染”状态间转换多次,这与研究中观察到的疾病动力学(恢复罕见)不符,表明其状态未能对应真实的流行病学状态。无约束HHMM虽然状态转换频率较低,但仍预测了部分不现实的恢复事件。
3.2 约束(H)HMM(SI模型)的表现
约束4状态HMM估计的状态依懒分布符合预期:易感探索状态对应长步长和小转角(快速、定向移动);易感休息和感染状态对应短步长和无定向转角;死亡状态步长最短。该模型成功捕捉到许多个体移动性的整体下降,并将这些变化归因于从易感状态到感染状态的转移。
模型正确分类了38只确认死亡剑羚中的33只。对于6只经检测呈阳性的个体,模型推断的状态序列与兽医检测时间有较好的对应,其中4只个体在轨迹末期观察到“体重不足”的体况评分。灌丛覆盖度和释放后时间对状态转移概率没有明显影响。约束HHMM的结果与约束HMM相似,但在某些个体(如个体80)的感染和死亡时间推断上存在差异。
3.3 约束HMM(SIR模型)的表现
应用于剑羚数据的SIR HMM未将任何观测分类为恢复状态,这与该案例研究中恢复 unlikely 的情况一致。然而,当应用于模拟数据时,SIR HMM成功恢复了已知状态,在易感、感染、恢复和死亡状态上均取得了很高的F1分数(>0.987),证明了该模型框架在个体可能恢复的场景下的有效性。
4 讨论
本研究证明,基于观察到的疾病情景对结构、状态数量和转移概率进行参数化的HMM,能够从动物移动数据中准确预测感染状态和个体命运。对转移概率矩阵施加合理的生物学约束(如禁止恢复)显著提高了模型性能。研究展示了如何构建HMM来反映不同的流行病学动态(SIS, SI, SIR),并鼓励分析人员根据其研究系统的可用数据和生物学知识来制定模型。
该框架要求患病个体表现出移动行为的变化。本研究侧重于每小时尺度的移动特征,但更粗的汇总尺度或其他数据流(如加速度计、心率)可能有助于检测对移动影响较小的疾病或亚临床感染。模型解释需要仔细检查估计参数,并确保状态标签与有生物学意义的行为状态一致。当部分研究期间动物的感染或行为状态已知时(例如通过直接观察),可采用半监督方法改进模型。
无约束模型(SIS)产生了生物上不可信的频繁状态转换,强调了先验知识和约束的重要性。分层HMM(HHMM)在整合不同时间尺度数据方面具有潜力,但粗尺度时间间隔的选择需要反映疾病动力学。
未来研究方向包括在HMM中纳入随机效应以解释个体异质性,以及将模型应用于结合了移动和病原体数据的多模态数据集。模拟代码可供其他研究系统适配和使用。
4.1 管理意义
HMM对野生动物疾病管理具有直接意义。管理人员可利用可用的检测结果和生物学证据,为观察到的疾病情景开发HMM结构,根据移动数据和现场观察评估模型性能,并基于所选模型进行种群或地点水平的推断。HMM可用于估计感染时间、将感染事件与特定地点和环境条件联系起来,以及理解受影响种群个体间的疾病传播动态。
随着生物记录技术的进步,在更多疑似或确认感染的个体上部署移动传感器成为可能。将这些数据集与更精细时间尺度的诊断样本配对,结合HMM分析,可使保护区和研究人员能够评估受管理种群或个体是否表现出受疾病影响的移动行为,从而允许兽医干预并为预防性护理方案提供信息。总之,HMM为疾病和移动生态学家提供了新的机会,以解决曾经局限于理论或实验方法的问题,是理解疾病-宿主相互作用生态动力学的宝贵工具。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号