基于形态特征与XGBoost机器学习的禽血孢子虫感染非侵入性预测模型研究

《Avian Research》:A novel machine learning model for the prediction of avian haemosporidian infection from morphological data

【字体: 时间:2026年02月03日 来源:Avian Research 1.7

编辑推荐:

  本研究针对传统禽血孢子虫感染检测方法(如显微镜检与分子技术)存在操作复杂、成本高、依赖专业人员等问题,提出一种基于宿主形态特征(如喙长、翅长、体重)结合XGBoost机器学习算法的非侵入性预测模型。通过对北京小龙门林区2009–2024年鸟类环志数据进行分析,模型在8种常见鸟类中平均预测准确率达75.3%,最高超84%,验证了形态特征作为感染指示因子的可行性。该模型为大规模生态监测与疾病预警提供了低成本、高效率的解决方案,工具已开源(https://github.com/RuitianXu/AMHIPT)。

  
在鸟类寄生虫研究领域,禽血孢子虫(Haemosporidian)是一类广泛存在的原生动物寄生虫,可通过吸血昆虫传播至全球数千种鸟类,对宿主生理状态、繁殖成功率甚至种群生存构成威胁。传统检测方法如显微镜检查依赖高质量血涂片和熟练技术人员,而分子技术(如巢式PCR、qPCR)虽灵敏度高但流程复杂、成本昂贵,难以适用于大规模野外监测。近年来,研究发现寄生虫感染可能通过资源分配权衡影响宿主体型特征(如喙长、翅长、体重),但单一形态指标预测能力有限,且物种间差异显著。
为突破检测技术瓶颈,北京师范大学生命科学学院的研究团队在《Avian Research》发表论文,提出基于机器学习的新型预测框架。研究以北京小龙门林区2009–2024年鸟类环志数据为基础,整合形态测量与分子检测结果,利用XGBoost算法构建感染状态分类模型,旨在实现快速、低成本的野外感染筛查。
关键技术方法
研究团队通过雾网捕捉野生鸟类,采集血样并提取DNA,采用巢式PCR扩增线粒体cyt b基因以确认感染状态,阳性样本经Sanger测序验证。形态数据包括喙长、头喙长、翅长、尾长、跗跖长和体重共6项指标。模型训练采用时序分割策略:2009–2021年数据用于训练与内部验证,2023–2024年数据作为独立测试集。通过三轮特征筛选优化模型输入,最终保留重要性最高的形态指标(如喙长、头喙长、体重)。
研究结果
3.1 感染对宿主形态特征的影响
线性回归分析显示,感染个体中仅喙长存在显著年际变化趋势。交互作用模型进一步揭示,黄眉柳莺(Phylloscopus inornatus)和淡黄腰柳莺(Phylloscopus proregulus)中感染状态与年份的交互项显著,表明感染对形态的影响随时间动态变化。曼-惠特尼U检验表明,感染与未感染个体在喙长(p= 0.026)、翅长(p< 0.001)和体重(p= 0.002)上存在显著差异,印证了形态特征与感染状态的关联性。
3.2 模型训练性能
XGBoost模型在8个物种中平均准确率达75.3%,最高为黄腹山雀(Pardaliparus venustulus)的84.1%。特征重要性分析显示,头喙长、喙长和翅长是影响预测的核心指标。模型在三轮训练中均呈现稳定的损失下降曲线,表明收敛良好。
3.3 独立验证结果
使用2023–2024年数据测试,模型对大山雀(Parus minor)和沼泽山雀(Poecile palustris)的预测准确率达100%,但对黄腹山雀的准确率降至50%,提示物种特异性差异可能影响模型泛化能力。2024年数据全部预测正确,证明模型在时序外推中具备可靠性。
结论与意义
本研究首次将机器学习与形态特征结合,实现了禽血孢子虫感染的非侵入性预测。模型通过量化感染对宿主发育的慢性影响,为生态学研究提供了新工具,尤其适用于长期监测项目中的快速初筛。尽管形态特征无法替代分子技术用于寄生虫属级鉴定(准确率仅48.9%),但其低成本、易操作的优势可显著提升野生动物健康评估效率。研究还发现喙长在多个物种中随年份显著下降,提示环境压力可能普遍影响鸟类形态进化。开源工具(https://github.com/RuitianXu/AMHIPT)的发布将进一步推动该方法在保护生物学与疾病生态学中的应用。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号