计算机视觉赋能相机陷阱：构建稳健物种互作数据集以解析互利网络的新方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Ecology and Evolution》：A Machine Learning Application to Camera-Traps: Robust Species Interactions Datasets for Analysis of Mutualistic Networks

【字体：大中小】 时间：2026年01月25日 来源：Ecology and Evolution 2.3

编辑推荐：

　　本综述系统阐述了利用计算机视觉（CV）技术优化相机陷阱数据处理、构建生态互作数据库的创新方法。文章详细介绍了从视频预处理、MegaDetector模型筛选非空影像，到基于Time-lapse软件的行为标注全流程，并量化评估了CV应用中的信息丢失（如最高10%的成对互作遗漏）对网络结构分析的影响。研究表明，尽管存在个体水平偏差，CV辅助构建的群落水平互作网络（PIEij估计）仍能保持较高结构保真度（gcor=0.98），为大规模生态网络研究提供了标准化解决方案。

摘要

生态互作的记录与量化对理解生物多样性及生态系统功能至关重要。相机陷阱已成为记录植物-动物互作的关键工具，尤其与计算机视觉（CV）技术结合可高效处理海量数据。然而，当前生态互作数据库的构建仍面临流程标准化不足、信息丢失等挑战。本研究提出一套整合CV技术的标准化工作流，通过视频数据分析优化物种互作频率（PIE）估计，并系统评估CV在不同情境下的局限性，为生态学家提供高效构建稳健互作数据库的方法论支持。

1 引言

物种互作是生态系统的核心驱动力，但其监测常因数据采集劳动密集型特点而受限。相机陷阱技术虽能非侵入式记录动物行为，但在处理复杂生态互作（如食果动物与植物的种子传播互作）时仍存在标准化流程缺失的问题。尽管CV技术在物种识别方面表现出高准确率（如Norouzzadeh等报道超过99%），但其性能受训练数据集偏差、地理局限性等因素影响，且在视频序列行为分析中的应用尚不成熟。本研究首次将CV技术系统应用于相机陷阱视频数据，重点解决植物-动物互作研究中的数据处理效率与标准化瓶颈。

2 方法

2.1 研究设计与数据采集

在多尼亚纳国家公园对10种肉质果植物（共119株个体）进行相机陷阱监测，覆盖刺柏林地、硬叶灌丛等生境类型。采用60台相机（50台Browning Dark Ops，10台Bushnell Trophy cam Aggressor）以视频模式（10秒/段）记录动物访花行为，通过标准化部署方案确保数据可比性。互作频率以种间相遇概率（PIE_ij）量化，即植物物种i与动物物种j建立互作的概率。

2.2 技术流程创新

预处理阶段：采用CamTrap数据包结构建立三级文本文件体系（deployment.csv, video.csv, observation.csv），实现元数据标准化管理。相机参数设置强调一致性，如统一视频长度（10-20秒）、运动触发延迟（≤1秒）等，并开发自动采样努力量计算代码。

处理阶段：

•
视频帧提取：通过R脚本将视频分割为帧序列以供CV分析
•
目标检测模型：应用MegaDetector（MDv4）模型，以0.8为置信度阈值筛选含动物视频
•
行为标注系统：基于Time-lapse软件构建分层行为编码体系（如"摄食""可能摄食""觅食"），通过专家共识机制解决物种鉴定 uncertainty

后处理阶段：

•
事件去重：设定5分钟时间窗合并连续视频，消除时空自相关偏差
•
采样努力量整合：根据视频文件时间戳自动计算相机工作日，支撑互作积累曲线分析

2.3 验证方法

从138,351段视频中分层随机抽取10%（14,123段）进行人工验证，通过混淆矩阵计算12项性能指标（如F1分数、MCC）。采用二次分配程序（QAP）比较CV辅助网络（M_t）与包含假阴性（FN）数据网络（M_fn）的拓扑结构差异，以汉明距离（H_d）和图相关性（gcor）评估网络相似性。

3 结果

3.1 模型性能评估

CV模型整体准确率达0.92，但存在显著种间差异：油橄榄（Olea europaea）和布氏梨（Pyrus bourgaeana）表现最佳（准确率>0.95），而荞麦叶大戟（Smilax aspera）仅0.85。共767段含动物视频被漏检，其中48%（367段）包含觅食行为，导致三类独特互作丢失（如欧椋鸟-草莓树互作）。主要漏检原因为背景植被遮挡（38%）和动物拟态（12%），如红金翅雀在草莓树丛中因羽色与环境相似导致90%互作记录缺失。

3.2 网络结构稳健性

包含FN补全的网络（g_fn）与CV辅助网络（g_t）结构高度相似：H_d=831（P<0.0001），gcor=0.9817（P<0.0001）。在群落水平仅丢失3对唯一互作（占总数344对的0.87%），证明CV数据对网络拓扑结构影响微弱。但在个体水平分析中，信息丢失存在空间异质性，如草莓树04号个体丢失50%互作记录。

3.3 置信度阈值优化

通过累积曲线分析发现最优置信阈值存在种间差异：布氏梨为0.25，油橄榄需0.75。马修斯相关系数（MCC）被证实更适合评估不平衡数据集性能，其在不同物种间波动范围（0.34-0.89）较F1分数（0.21-0.86）更能反映模型真实表现。

4 讨论

本研究建立的标准化流程将视频标注效率提升7倍（从3周缩短至3天），首次系统量化了CV技术在生态互作研究中的适用边界。结果表明：

1.
群落水平网络分析受信息丢失影响较小，但个体水平研究需结合直接观察等补充方法
2.
物种特异性置信阈值优化可有效平衡假阳性/假阴性率
3.
基于MCC的模型评估框架更适用于生态学不平衡数据集

尽管存在动物拟态、罕见互作漏检等局限，CV技术仍为大规模生态网络监测提供可行方案。随着MDv5等模型对小型鸟类识别能力的提升，以及与遥感技术的结合，该方法有望支撑《昆明-蒙特利尔全球生物多样性框架》中生态功能评估目标的实现。

作者贡献与资助

巴勃罗·比利亚尔瓦（Pablo Villalva）负责数据 curation、软件开发和实证分析；佩德罗·霍尔达诺（Pedro Jordano）主导项目构思与资金获取。研究受西班牙MICIU（PID2022-136812NB-I00）、LifeWatch ERIC等项目资助，数据与代码已在GitHub平台开源（v1.0.0版本）。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号