《One Health》:Spatiotemporal analysis of plague risk in Tibet: Multi-source data-driven ensemble model development and validation
编辑推荐:
本研究为应对青藏高原高海拔敏感生态系统中鼠疫动态特征不明的问题,构建了基于多源环境变量与集成算法(BIOMOD2)的时空风险预测模型。研究发现,人口分布、降水、最高温和植被指数是驱动西藏鼠疫疫源地时空分异与质心迁移的关键因素,模型在外部验证中表现优异。该成果为高海拔地区自然疫源性疾病的精准防控提供了科学依据。
在历史长河中,鼠疫曾数次席卷全球,造成数以亿计的生命损失。时至今日,由鼠疫耶尔森菌(Yersinia pestis)引发的这种烈性自然疫源性疾病,其自然疫源地依然遍布除大洋洲和南极洲外的各大洲。位于“世界屋脊”的西藏,以其独特的高寒地貌和陡峭的垂直气候梯度,孕育了全球海拔最高、生态最敏感的自然疫源地之一,其核心宿主是喜马拉雅旱獭(Marmota himalayana)。然而,关于西藏地区鼠疫流行对气候变化响应的机制,以及针对该区域的鼠疫预测预警模型,此前缺乏系统性研究。这为当地的公共卫生安全蒙上了一层不确定的阴影:风险究竟分布在哪里?驱动风险变化的环境因素是什么?未来我们又该如何更精准地布防?
为了揭开这些谜题,一项发表在《One Health》期刊上的研究给出了答案。研究人员巧妙地扮演了“环境侦探”的角色,他们整合了2000年至2021年西藏的鼠疫监测数据,并引入了八大环境变量作为“线索”,包括最高温度(TMAX)、降水(PRCP)、归一化植被指数(NDVI)、土地利用与覆盖(LULC)、土壤湿度(SM)、坡度、坡向以及人口空间分布(POP)。面对单一模型可能存在的偏差,研究团队祭出了“组合拳”——利用BIOMOD2平台,融合了包括随机森林(RF)、广义可加模型(GAM)等在内的十种先进算法,构建了一个强大的集成模型(EM)。这个模型不仅分析了2000-2021年整体的风险格局,还像放映电影一样,将时间分成四个阶段(2000–2004, 2005–2009, 2010–2015, 2016–2021),动态模拟了疫源地分布的演变过程。更令人信服的是,他们用完全独立的2022年和2023年监测数据对模型进行了“期末考试”,验证其预测未来风险的能力。
本研究主要采用了以下几种关键技术方法:首先,利用西藏自治区疾病预防控制中心的鼠疫监测系统,获取了2000年至2023年涵盖动物和人的疫源地与病例数据,并进行了时空分层处理。其次,通过多源遥感与地理信息数据平台,收集并处理了气候、植被、地形、土地利用及人口分布等环境变量,并利用相关分析筛选出关键驱动因子。核心建模部分使用了BIOMOD2这一集成建模框架,融合了十种不同的物种分布模型(SDM)算法,通过加权平均构建高性能的集成模型(EM),并采用接收者操作特征曲线下面积(AUC)、真实技巧统计(TSS)和Kappa系数等指标进行模型评估与验证。最后,运用地理信息系统(GIS)技术,基于模型输出的风险图进行空间分析,包括风险等级划分、面积统计以及疫源地分布质心的计算与迁移轨迹分析。
3.1. 西藏鼠疫的流行病学特征
基于2000-2023年的监测数据,分析揭示了西藏鼠疫的基本面貌。期间共报告25例人间鼠疫病例,死亡16例,分离到666株鼠疫耶尔森菌。疫情分布高度不均,54个县(占西藏总县数的72.97%)被确认为自然疫源地,拉萨、日喀则和山南市是主要流行区。疫情呈现明显季节性,动物鼠疫爆发集中在6-8月,人间病例则略滞后于7-9月。患者以男性青壮年牧民为主,主要传播途径为接触患者和接触/处理旱獭,肺鼠疫是最主要的临床型。
3.2. 模型性能与预测准确性
构建的集成模型展现出卓越的预测能力。针对整个时期(2000-2021)的模型内部验证精度很高(AUC = 0.95, TSS = 0.88, KAPPA = 0.82)。更重要的是,用最新阶段(2016-2021)数据训练的模型,在独立的外部验证(2022年和2023年数据)中取得了近乎完美的表现:2022年AUC = 0.98, TSS = 0.92, Kappa = 0.88;2023年AUC = 0.99, TSS = 0.99, Kappa = 0.99。这证明了模型强大的时空外推能力。在众多单一模型中,随机森林(RF)和广义增强模型(GBM)表现突出。
3.3. 自然疫源地的空间分布与变化
模型动态模拟并可视化了过去二十多年西藏鼠疫风险的空间演变图景。在2000-2004年,高风险区(风险概率>750)约4.2万平方公里,呈聚集性分布,主要集中在拉萨东部、日喀则东部、山南西北部和那曲东部。到2005-2009年,高风险区略有扩张,并在昌都地区出现了新的风险集群。然而,在随后的两个阶段(2010-2015, 2016-2021),高风险区面积显著收缩,分别降至约2.3万和2.0万平方公里。模型预测的高风险区与实际监测到的人间病例分布存在良好的空间耦合关系。
3.4. 鼠疫自然疫源地的质心迁移
通过计算各时期疫源地分布图的质心,研究清晰刻画了风险核心区域的移动轨迹。从2000-2004年到2005-2009年,质心向东北方向迁移了79.39公里。紧接着,在2005-2009年到2010-2015年期间,质心向东南方向大幅移动了163.85公里。而在最近阶段(2016-2021),质心又反转方向,向西北迁移了103.03公里。总体来看,质心波动集中在西藏中部地区。
3.5. 时空格局的动态驱动因素
3.5.1. 预测变量的贡献度
通过量化各环境变量的相对贡献,研究识别出驱动鼠疫风险时空分异的关键因子。纵观整个研究期,人口分布(POP)、降水(PRCP)、归一化植被指数(NDVI)和最高温度(TMAX) consistently(持续地)施加了最主要的影响。分阶段看,各因子的主导地位会发生变化,例如在2005-2009年,最高温度(TMAX)的贡献度高达46.98%,成为绝对主导因素。而土地利用(LULC)、坡度和坡向的影响则微乎其微。
3.5.2. 环境驱动因素的解释
进一步分析揭示这些关键驱动因子与鼠疫风险之间的具体关系模式。人口分布(POP)在所有时期均与鼠疫风险呈稳健的正相关关系。降水(PRCP)的影响存在时间异质性,在某些阶段呈显著正线性效应,并伴有负二次项,揭示了非线性的单峰关系(即风险先随降水增加而升高,超过一定值后下降)。NDVI在整个时期和第二阶段也显示出显著的单峰关系。最高温度(TMAX)的影响随时间演变,在最近阶段(2016-2021)表现出显著的非线性单峰关系,风险在约20°C时达到最优。
这项研究通过集成建模框架成功解码了西藏鼠疫风险的时空“密码”。其结论与意义可归纳为以下几点:首先,多算法融合的集成建模策略显著提升了预测精度与稳健性,能够捕捉宿主-环境间复杂的非线性相互作用,这是单一模型难以实现的。其次,研究明确了人口、气候(降水和最高温)和植被是驱动西藏鼠疫疫源地分布与演变的三大核心环境要素,其中人口因素的作用尤为突出且持续。再者,模型动态再现了疫源地高风险区先扩张后收缩、以及分布质心经历“东北-东南-西北”方向迁移的完整过程,这深刻反映了人类活动与气候变化交织影响的复杂图景。例如,质心的东北迁移与最高温的主导作用相关,东南迁移则与人口、降水、植被的协同作用有关,而最近的西北迁移可能暗示了人类活动对旱獭栖息地的干扰与挤压。
这项研究的重要意义在于,它将原本看似静态的疫源地分布,转化为一幅动态的、由环境因子驱动的风险演变地图。这不仅在理论上深化了对高海拔脆弱生态系统下鼠疫生态学的理解,揭示了不同于其他生态区(如内蒙古草原)的独特驱动机制(如在西藏,过多降水可能抑制风险);更在实践上为公共卫生部门提供了强大的决策支持工具。模型卓越的外部验证性能意味着其可用于未来风险预警,而识别出的关键驱动因子和风险变化轨迹,能够指导资源更精准地投向高风险区域和关键控制环节(如人口密集区、降水过渡带、温度阈值区)。研究构建的“环境-宿主-人群”综合分析框架,也为全球其他旱獭相关或类似生态环境下的自然疫源性疾病研究提供了可借鉴的范式。尽管研究存在未包含不可图化风险因子(如自然屏障)、缺乏宿主密度数据等限制,但它无疑为西藏乃至类似地区的鼠疫精准防控点亮了一盏科学的“探照灯”。