委内瑞拉西部恰加斯病媒介长红猎蝽(Rhodnius prolixus)的高空间分辨率集合物种分布模型(Ensemble Species Distribution Modeling)
《GeoHealth》:High Spatial Resolution Ensemble Species Distribution Modeling of Rhodnius prolixus, Vector of Chagas Disease, in Western Venezuela
编辑推荐:
长红猎蝽(Rhodnius prolixus)是委内瑞拉西部皇家棕榈及其他本土棕榈中最常见且数量最多的吸血锥蝽(kissing bug)。长红猎蝽(R. prolixus)是引起恰加斯病(Chagas disease)的寄生虫克氏锥虫(Trypanosoma
长红猎蝽(Rhodnius prolixus)是委内瑞拉西部皇家棕榈及其他本土棕榈中最常见且数量最多的吸血锥蝽(kissing bug)。长红猎蝽(R. prolixus)是引起恰加斯病(Chagas disease)的寄生虫克氏锥虫(Trypanosoma cruzi)的主要媒介。本研究利用物种分布模型(Species Distribution Models, SDMs)估算长红猎蝽(R. prolixus)的栖息地适宜性。基于栖息地适宜性,研究人员估算了恰加斯病传播风险下的人口数量。研究人员拟合了一个空间分辨率为250 m的集合物种分布模型(SDM),使用遥感协变量(处理时间与吸血锥蝽采样时间相同)对长红猎蝽(R. prolixus)的栖息地适宜性进行建模,数据基于2004年至2012年间收集的67个样本(来自41个地点)。该集合物种分布模型(SDM)包括使用六种不同机器学习算法的预测,包括:广义线性模型(Generalized Linear Model, GLM)、多元自适应回归样条(Multiple Adaptive Regression Splines, MARS)、回归树(Regression Trees, RT)、随机森林(Random Forests, RF)、广义增强回归树(Generalized Boosted Regression Trees, GBM)和极端梯度提升(eXtreme Gradient Boosting, XGBOOST)。最终的物种分布模型(SDM)包含了利用变量重要性筛选出的13个变量中的9个。最终集合物种分布模型(SDM)的最佳模型平均受试者工作特征曲线(Receiver Operating Curve, ROC)(±标准差SD)为0.833 ± 0.114。该模型表明,在委内瑞拉安第斯山脉科迪勒拉东坡沿梅里达(Merida)、巴里纳斯(Barinas)、塔奇拉(Tachira)、特鲁希略(Trujillo)和葡萄牙萨(Portuguesa)各州分布着长红猎蝽(R. prolixus)的高栖息地适宜性区域。利用2012年至2018年间收集的独立数据集进行验证显示,较高的适宜性预测了长红猎蝽(R. prolixus)的出现(p < 0.025)。结果表明,集合物种分布模型(SDM)可以为长红猎蝽(R. prolixus)提供高空间分辨率的分布信息,可用于准确估算恰加斯病的传播风险。
本研究聚焦于委内瑞拉西部恰加斯病主要媒介昆虫长红猎蝽(Rhodnius prolixus)的空间分布预测。目前,针对该物种的物种分布模型(Species Distribution Model, SDM)多基于1至8 km的粗粒度空间尺度,且主要依赖单一算法(如MaxEnt),尚未采用集合模型(Ensemble)方法,也缺乏高分辨率(如250 m)的分布式估算,这限制了对恰加斯病传播风险的精确评估。鉴于长红猎蝽(R. prolixus)在委内瑞拉分布广泛且是克氏锥虫(Trypanosoma cruzi)的最重要媒介,加之近年来该国病媒控制计划削弱导致传播风险增加,开展高精度的栖息地适宜性建模对于估计暴露人口及指导防控具有重要意义。该研究论文发表在《GeoHealth》期刊。
研究人员开展了基于遥感环境变量与野外采样数据的高空间分辨率集合物种分布模型(SDM)研究。关键技术方法包括:使用2004-2012年间的67个长红猎蝽(R. prolixus)发生样本(来自41个地点,样本队列源自委内瑞拉西部5个州的棕榈树调查)及同期处理的遥感协变量(空间分辨率250 m);通过变量重要性(置换法,重要性阈值>5%)从13个初始变量中筛选出9个;采用六种机器学习算法(GLM、MARS、RT、RF、GBM、XGBOOST)构建集合模型,利用TSS(True Skill Statistic)>0.7筛选并加权集成;使用2012-2018年独立数据集(5个发生点,10个缺席点)进行验证(单尾Wilcoxon检验);利用峰度(Kurtosis)评估模型不确定性;最后叠加人口网格数据(CIESIN, ~1 km分辨率)在不同栖息地适宜性阈值(0.6, 0.7, 0.8, 0.9)下估算风险暴露人口。
1 Introduction
研究人员介绍了物种分布模型(SDM)的基本概念及其在桥梁物种发生数据、环境条件与潜在分布方面的应用。强调了长红猎蝽(R. prolixus)作为恰加斯病关键媒介的地位及其在委内瑞拉的生态习性(如与棕榈树的关联、海拔分布4-2000 m等)。指出了既往模型在空间精度(多为1-8 km)和算法单一性上的不足,提出了利用高分辨率(250 m)遥感数据和集合模型(Ensemble)方法来提高精度,并旨在基于此估算恰加斯病传播风险人口的假设与研究目标。
2 Study Area and Data
研究人员描述了研究区域(委内瑞拉西部的Barinas, Apure, Cojedes, Trujillo, Merida州,涵盖Llanos地区和安第斯山麓,海拔0-4980 m)及数据来源。昆虫学数据包括2004-2012年采集的95个棕榈样本(简化为41个发生点)和2012-2018年采集的15个验证样本(5发生,10缺席)。遥感数据包括来自Google Earth Engine的MODIS陆地表面温度(LST,1 km重采样)、MODIS植被指数(NDVI和EVI,250 m)、NASADEM高程模型(30 m,衍生坡度、坡向)以及PALSAR森林/非森林分类(25 m),所有图层均重投影至250 m分辨率,并计算了LST、NDVI、EVI的时间序列标准差(SD)和峰度(Kurtosis)以反映环境变异性。伪缺席(Pseudoabsences)通过物种范围包络(SRE)方法生成。
3 Methods
研究人员详细说明了变量选择(基于排列的变量重要性,去除重要性<5%的变量)、模型评估指标(Kappa、ROC、TSS)、集合物种分布模型(SDM)构建(六种算法,10次伪缺席数据集,3次重复交叉验证,80%训练/20%测试,集成TSS>0.7的模型并按TSS加权)、模型验证(独立数据集,单尾Wilcoxon检验)、模型不确定性评估(使用预测值的峰度Kurtosis区分低不确定性/尖峰分布与高不确定性/平峰分布)以及风险人口估算(将250 m适宜性图重采样至1 km并与CIESIN人口网格叠加,按不同阈值二值化后统计交集人口)。所有分析使用R和QGIS完成。
4 Results
从13个环境变量中筛选出9个纳入最终模型,模型性能(平均ROC 0.833 ± 0.114,TSS 0.556 ± 0.215)优于全变量模型。变量重要性显示LST标准差(SD)、LST峰度(Kurtosis)、LST中位数、NDVI相关统计量及海拔等是关键驱动因子。响应曲线表明:长红猎蝽(R. prolixus)偏好温度约30-33°C且温度变化小(低LST SD,高LST Kurtosis/尖峰分布)、NDVI>0.75或特定EVI范围、海拔50-1000 m。高适宜性区域主要分布在Barinas、Tachira和Portuguesa州沿安第斯山东坡,其他州分布较破碎。平均适宜性为0.45 ± 0.28。不确定性图显示安第斯山麓起始海拔(约1000 m)不确定性最高。独立验证证实发生点平均适宜性(0.731)显著高于缺席点(0.519,p=0.025)。风险人口估算显示,2020年随适宜性阈值从0.6升至0.9,风险人口从1,943,934降至82,296人,且各阈值下2000-2020年风险人口均呈增加趋势。
5 Discussion
研究人员讨论了高适宜性区域与既往研究的吻合性,并指出LST、NDVI等变量的临界阈值具有生态指示意义。强调了长红猎蝽(R. prolixus)不仅对环境变量均值敏感,还对其变异性(SD、Kurtosis)敏感,符合施马尔豪森定律(Schmalhausen's law)。海拔是重要的限制因子,当前适宜海拔上限(约1029 m)提示需关注全球变暖下的海拔扩张可能。研究人员指出长红猎蝽(R. prolixus)的高效传播能力及其与贫困居住条件的关联,使得分布变化与社会经济因素共同影响疾病风险;气候变化及新自由主义政策下的生态破坏可能加剧传播。研究也指出了SDM的局限性(如未观测协变量的混淆、验证样本量限制等),并提出未来可结合昆虫丰度、感染率及社会脆弱性数据改进风险评估,利用更高精度人口数据(如夜光数据)及实时同化流程提升应用价值。
6 Conclusions
研究人员得出结论,利用遥感数据生成集合物种分布模型(SDM)是可行的,且考虑环境变量的高阶矩(如SD、Kurtosis)对建模至关重要。长红猎蝽(R. prolixus)倾向于分布在低海拔、中等植被覆盖(或稀疏至密集)、高温且温度变异性低的环境。基于SDM,研究人员估算2020年研究区域内恰加斯病传播风险人口约为82,296至1,943,934人。尽管聚焦优势种长红猎蝽(R. prolixus),未来还需关注其他锥蝽物种及住房质量等社会因素,并依托社会-生态-流行病学背景将估算转化为可操作的防控知识。