计算机视觉赋能相机陷阱:构建稳健物种互作数据集以解析互利网络的新方法

《Ecology and Evolution》:A Machine Learning Application to Camera-Traps: Robust Species Interactions Datasets for Analysis of Mutualistic Networks

【字体: 时间:2026年01月25日 来源:Ecology and Evolution 2.3

编辑推荐:

  本综述系统阐述了利用计算机视觉(CV)技术优化相机陷阱数据处理、构建生态互作数据库的创新方法。文章详细介绍了从视频预处理、MegaDetector模型筛选非空影像,到基于Time-lapse软件的行为标注全流程,并量化评估了CV应用中的信息丢失(如最高10%的成对互作遗漏)对网络结构分析的影响。研究表明,尽管存在个体水平偏差,CV辅助构建的群落水平互作网络(PIEij估计)仍能保持较高结构保真度(gcor=0.98),为大规模生态网络研究提供了标准化解决方案。

  

摘要

生态互作的记录与量化对理解生物多样性及生态系统功能至关重要。相机陷阱已成为记录植物-动物互作的关键工具,尤其与计算机视觉(CV)技术结合可高效处理海量数据。然而,当前生态互作数据库的构建仍面临流程标准化不足、信息丢失等挑战。本研究提出一套整合CV技术的标准化工作流,通过视频数据分析优化物种互作频率(PIE)估计,并系统评估CV在不同情境下的局限性,为生态学家提供高效构建稳健互作数据库的方法论支持。

1 引言

物种互作是生态系统的核心驱动力,但其监测常因数据采集劳动密集型特点而受限。相机陷阱技术虽能非侵入式记录动物行为,但在处理复杂生态互作(如食果动物与植物的种子传播互作)时仍存在标准化流程缺失的问题。尽管CV技术在物种识别方面表现出高准确率(如Norouzzadeh等报道超过99%),但其性能受训练数据集偏差、地理局限性等因素影响,且在视频序列行为分析中的应用尚不成熟。本研究首次将CV技术系统应用于相机陷阱视频数据,重点解决植物-动物互作研究中的数据处理效率与标准化瓶颈。

2 方法

2.1 研究设计与数据采集

在多尼亚纳国家公园对10种肉质果植物(共119株个体)进行相机陷阱监测,覆盖刺柏林地、硬叶灌丛等生境类型。采用60台相机(50台Browning Dark Ops,10台Bushnell Trophy cam Aggressor)以视频模式(10秒/段)记录动物访花行为,通过标准化部署方案确保数据可比性。互作频率以种间相遇概率(PIEij)量化,即植物物种i与动物物种j建立互作的概率。

2.2 技术流程创新

预处理阶段:采用CamTrap数据包结构建立三级文本文件体系(deployment.csv, video.csv, observation.csv),实现元数据标准化管理。相机参数设置强调一致性,如统一视频长度(10-20秒)、运动触发延迟(≤1秒)等,并开发自动采样努力量计算代码。
处理阶段
  • 视频帧提取:通过R脚本将视频分割为帧序列以供CV分析
  • 目标检测模型:应用MegaDetector(MDv4)模型,以0.8为置信度阈值筛选含动物视频
  • 行为标注系统:基于Time-lapse软件构建分层行为编码体系(如"摄食""可能摄食""觅食"),通过专家共识机制解决物种鉴定 uncertainty
后处理阶段
  • 事件去重:设定5分钟时间窗合并连续视频,消除时空自相关偏差
  • 采样努力量整合:根据视频文件时间戳自动计算相机工作日,支撑互作积累曲线分析

2.3 验证方法

从138,351段视频中分层随机抽取10%(14,123段)进行人工验证,通过混淆矩阵计算12项性能指标(如F1分数、MCC)。采用二次分配程序(QAP)比较CV辅助网络(Mt)与包含假阴性(FN)数据网络(Mfn)的拓扑结构差异,以汉明距离(Hd)和图相关性(gcor)评估网络相似性。

3 结果

3.1 模型性能评估

CV模型整体准确率达0.92,但存在显著种间差异:油橄榄(Olea europaea)和布氏梨(Pyrus bourgaeana)表现最佳(准确率>0.95),而荞麦叶大戟(Smilax aspera)仅0.85。共767段含动物视频被漏检,其中48%(367段)包含觅食行为,导致三类独特互作丢失(如欧椋鸟-草莓树互作)。主要漏检原因为背景植被遮挡(38%)和动物拟态(12%),如红金翅雀在草莓树丛中因羽色与环境相似导致90%互作记录缺失。

3.2 网络结构稳健性

包含FN补全的网络(gfn)与CV辅助网络(gt)结构高度相似:Hd=831(P<0.0001),gcor=0.9817(P<0.0001)。在群落水平仅丢失3对唯一互作(占总数344对的0.87%),证明CV数据对网络拓扑结构影响微弱。但在个体水平分析中,信息丢失存在空间异质性,如草莓树04号个体丢失50%互作记录。

3.3 置信度阈值优化

通过累积曲线分析发现最优置信阈值存在种间差异:布氏梨为0.25,油橄榄需0.75。马修斯相关系数(MCC)被证实更适合评估不平衡数据集性能,其在不同物种间波动范围(0.34-0.89)较F1分数(0.21-0.86)更能反映模型真实表现。

4 讨论

本研究建立的标准化流程将视频标注效率提升7倍(从3周缩短至3天),首次系统量化了CV技术在生态互作研究中的适用边界。结果表明:
  1. 1.
    群落水平网络分析受信息丢失影响较小,但个体水平研究需结合直接观察等补充方法
  2. 2.
    物种特异性置信阈值优化可有效平衡假阳性/假阴性率
  3. 3.
    基于MCC的模型评估框架更适用于生态学不平衡数据集
尽管存在动物拟态、罕见互作漏检等局限,CV技术仍为大规模生态网络监测提供可行方案。随着MDv5等模型对小型鸟类识别能力的提升,以及与遥感技术的结合,该方法有望支撑《昆明-蒙特利尔全球生物多样性框架》中生态功能评估目标的实现。

作者贡献与资助

巴勃罗·比利亚尔瓦(Pablo Villalva)负责数据 curation、软件开发和实证分析;佩德罗·霍尔达诺(Pedro Jordano)主导项目构思与资金获取。研究受西班牙MICIU(PID2022-136812NB-I00)、LifeWatch ERIC等项目资助,数据与代码已在GitHub平台开源(v1.0.0版本)。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号