降低相机陷阱密度估计的数据处理负担：通过显式建模动物检测过程扩展REST模型

《Methods in Ecology and Evolution》：Reducing data processing effort in camera trap density estimation: Extending the REST model by explicitly modelling animal detection processes

【字体：大中小】 时间：2026年02月08日 来源：Methods in Ecology and Evolution 6.2

编辑推荐：

　　本文创新性地提出了RAD-REST模型（Random Encounter and Staying Time model Relying on All Detections），该模型是对REST（Random Encounter and Staying Time）模型的重要扩展，旨在显著减少野生动物（尤其是地表栖居哺乳动物）种群密度估算中繁重的数据处理工作。通过显式建模动物进入预定义焦点区域的概率过程，该模型允许仅分析部分视频的进入次数和停留时间，同时利用全部视频的捕获率数据，实现了在保持估计无偏性和适当覆盖率的条件下，将分析工作量降低至全视频分析的约6.45%-7.00%（对应CV≤0.2的高精度标准）。作者还开发了用户友好的R软件包‘ctrest’，提供了完整的贝叶斯框架实现。研究表明，RAD-REST模型为实现大规模、多物种的持续性监测提供了高效且成本效益优异的解决方案，是推进保护生物学和生态监测领域方法学的重要进展。

1 引言

准确可靠地估算野生动物种群密度及其空间变异是有效保护和管理的基础。然而，确定监测哪些物种、在何处以及何时进行监测仍然充满挑战。中大型哺乳动物是重要的监测目标，因为它们在生态系统功能中常扮演独特角色，且其大范围的活动模式使其成为景观水平生态变化的有效指示者。然而，在大范围区域内为这些哺乳动物实施全面的监测系统，面临着巨大的技术和财务挑战，这主要源于设备部署、数据收集和分析所需的资源。

相机陷阱在持续监测多种地表栖居哺乳动物方面具有巨大潜力。它们能够实现24小时不间断的数据收集，且侵入性最小，使其甚至适用于夜行性、稀有和难以捉摸的物种。相机陷阱技术的出现使得景观和区域尺度的多物种监测成为可能，促进了大规模公民科学倡议的兴起。与此同时，分析方法也取得了显著进展。值得注意的是，最近的模型即使对于未标记的种群，也能从相机陷阱数据中估算种群密度（每单位面积的个体数）。与传统的监测指标（如相机捕获率或占据率）不同，种群密度允许跨物种和地点进行直接的定量比较，为评估野生动物种群状况提供了更稳健的基础。

然而，要利用相机陷阱在景观或区域尺度上实践多物种密度监测，必须解决几个挑战。与占据率估计或捕获率计算不同，密度估计通常需要额外信息，例如随机相遇模型（REM）中的动物移动速度或相机陷阱距离取样（CTDS）中相机到捕获动物的距离，这些信息的获取需要耗费大量时间和精力。在大时空尺度上进行多物种监测，获取此类辅助信息需要大量成本，使得其与传统的捕获率计算或占据率估计相比更加劳动密集型。因此，减轻数据处理负担对于实现多物种的大规模密度监测至关重要。

随机相遇与停留时间（REST）模型是几种为未标记种群设计的密度估计模型之一，它基于预定义焦点区域内动物的进入次数和停留时间来推导种群估计值。多项研究表明，该模型提供的估计值与独立调查（如人类观察者的距离取样）得出的估计值一致。此外，所需的野外工作仅涉及用相机陷阱记录预定义焦点区域的位置，其他任务可在实验室环境中执行。因此，这种方法可能在大规模多物种密度监测方面具有重要潜力。

目前，将REST模型应用于估算大空间尺度上多物种密度仍面临三个关键挑战。首先，该模型需要测量所有视频中捕获动物进入预定义焦点区域的次数，并至少测量一部分视频的停留时间，这需要分析所有录制的视频。其次，这个过程也会导致丢弃大量从未进入焦点区域的动物数据，这可能使得难以获得可靠的估计值，特别是对于低密度物种。第三，由于该模型最初提出时采用了基于似然性的参数估计方法，被认为过于数学化，给野生动物管理者带来了可及性挑战。

本研究提出了RAD-REST模型（依赖于所有检测的随机相遇与停留时间模型）。该方法通过扩展REST模型解决了前两个挑战。具体而言，相机检测到的动物可能会也可能不会穿过焦点区域。我们通过假设每个视频的进入次数遵循狄利克雷复合多项分布来将其建模为一个随机过程，该分布考虑了个体和地点之间的异质性。重要的是，这种建模方法并不总是需要确定所有图像的进入次数；相反，它允许从随机选择的视频子集中估计预期的进入次数。因此，它可以显著减少数据处理工作量的同时，有效利用所有可用的视频数据。我们采用了完全贝叶斯框架进行参数估计，包括使用具有冯·米塞斯分量的离散无限混合模型来估计活动水平。此外，我们通过将物种作为随机效应以跨物种借用信息，潜在地提高了低密度物种的估计可靠性。为了使模型更易于野生动物管理者使用并解决可及性挑战，我们开发了一个新的用户友好型R软件包‘ctrest’。

2 方法

2.1 模型框架

2.1.1 REST模型

原始的REST模型描述了给定物种的密度D、在“有效调查期间”进入表面积为A的预定义焦点区域的预期进入次数E，以及在该焦点区域内的预期停留时间S之间的关系。“有效调查期间”代表动物可供相机检测的时间段；它由总调查期T乘以动物在地面上活动因而可供相机陷阱检测的预期时间比例P计算得出。

该模型假设相机陷阱的放置相对于动物的移动和行为是随机的。应用中的一个关键挑战是需要测量所有视频中捕获动物进入预定义焦点区域的次数，并至少测量一部分视频的停留时间。

2.1.2 RAD-REST模型

RAD-REST模型通过将进入焦点区域的预期次数分解为两个部分来解决这一挑战：捕获的预期视频总数N，以及被捕获时在焦点区域内的预期进入次数θ。具体地，E = N × θ。关键的是，估计θ不需要测量每个视频的进入次数，而只需要一个随机样本的数据。

这种方法类似于距离取样的简化形式。传统的距离取样假设在距原点（相机位置）给定距离处具有完美检测能力，并将检测能力建模为距离的函数。相比之下，我们的方法使用初步调查来定义一个小的、局部化的区域，在该区域内可以合理地假设完美检测。随后，我们通过计算定义的焦点区域内的捕获率与整个相机检测区域内捕获率的比率，来合并焦点区域外检测的信息。我们方法的一个关键优势是工作量的显著减少。

2.1.3 进入焦点区域

在对RAD-REST模型进行似然参数估计时，每个相机站点的数据——包括所有视频的数量、焦点区域内的进入次数及其停留时间——被视为来自参数概率分布的随机变量。具体地，物种s在相机站点c的视频数量N_{s,c}可被视为遵循负二项分布等非负离散概率分布的随机变量。

考虑从每个相机站点随机选择m个视频，并记录这些视频中动物的进入次数和停留时间。对于检测次数少于m次的站点，应分析所有可用视频。假设K代表所有相机站点中单个视频观察到的最大进入次数，则每个站点的进入次数可以汇总为一个长度为K的频率分布。动物被捕获时进入焦点区域的概率可能因个体行为、体型或运动模式的差异而不同，也可能因相机站点的局部环境条件或相机放置位置而异。为了适应这种过度分散，我们使用狄利克雷复合多项分布对此变量进行建模。

该分布自然地捕捉了进入次数的分类性质以及由个体和地点异质性引起的额外变异性。进入次数的期望值可以计算得出。

2.1.4 停留时间

物种s在相机c第j次通过时在焦点区域内的停留时间S_{s,c,j}是一个正的连续随机变量，假设遵循某种任意的时间概率分布，其中对数正态分布通常拟合良好。可能更合适的是在时间分布的参数中加入站点特定的随机效应，以解释地点间的异质性。对于动物在视频录制结束时仍在停留的右删失数据，可以使用相同概率分布的累积分布函数来评估似然。

2.1.5 动物可及性

动物对相机陷阱的可及性P可以通过视频时间戳信息来估计，这需要做一个相对较强的假设，即“所有个体在一天中的某个时刻都是活跃的”。由于活动模式复杂，无法用单一概率分布表示。一种方法是使用概率分布的混合来近似这些模式。我们拟合了一个具有冯·米塞斯分量的无限混合模型。

确定合适的分量数量K通常具有挑战性。我们采用了断棒过程（SBP），允许模型通过指定一个足够大的值来从数据中估计有效分量数量。SBP用断棒分量V_k来构建混合比例π_k。这些变量遵循贝塔分布。

活跃时间的预期比例是根据估计的概率密度函数估计的。具体地，我们计算了冯·米塞斯混合曲线下的面积与以其曲线最大值为高的矩形面积之比。该比率代表了假设所有个体在峰值活动时间都活跃的情况下，动物活跃的平均时间比例。

2.1.6 密度

最后，我们基于方程E = N × θ 和 D = (N × θ) / (A × P × S) 获得密度估计。通过重新排列方程，相机陷阱捕获的预期视频数量可以表示为使用对数链接函数的线性模型。这里，焦点区域A和调查期T是常数，而预期活动比例P、预期进入次数θ和预期停留时间S可以从数据中估计，密度D则可以类似于线性模型中的截距进行估计。或者，密度可以被视为一个跨相机站点变化的随机变量，并且通过将协变量分配给该分布的参数，可以获得考虑站点间变异程度的估计值。

2.1.7 多物种模型

参数估计可以针对每个物种单独进行，也可以使用所有物种的数据通过为停留时间、进入次数和密度加入物种随机效应来集体进行。在后一种情况下，物种特定参数在应用适当的链接函数后假设遵循正态分布。

由于活动模式存在显著的种间差异，活动时间比例最好分别对每个物种进行估计。

2.2 案例研究

我们将单物种和多物种RAD-REST模型应用于从日本房总半岛收集的经验数据。此应用旨在获取参数值用于后续的数据生成模拟。我们自2018年起使用部署在日本房总半岛的211个相机陷阱持续监测中大型哺乳动物（不包括啮齿类、食虫类和翼手类）。本研究使用截至2021年春季（3月至5月）收集的数据。

相机位置在2公里网格单元内随机选择。在相机部署期间，使用白色绳索划定焦点区域并手动记录其位置。焦点区域被定义为一个边长为1.9米的等边三角形，其放置位置使得最近的顶点距离相机1.9米。使用家犬进行的实验也证实了在该区域内近乎完美的检测概率。采用双观察者方法的野外数据证实了这些发现，通常确认了近乎完美的检测。虽然我们承认由于漏检可能导致密度低估，但基于上述情况，我们假设任何此类影响可能可以忽略不计。相机被放置在胸部高度并向下倾斜以捕捉焦点区域，便于后续测量进入次数和停留时间。

数据收集后，我们识别了所有捕获的目标哺乳动物。我们测量了进入焦点区域的次数和停留时间。我们尽可能从不同的相机位置随机为每种食肉动物选择100个视频，为其他物种选择200个视频，仅包括同一物种连续捕获间隔大于1分钟的视频。此外，对于在房总半岛被相机陷阱检测到的两种物种，即野猪和貉，进行了额外的视频分析，使视频总数达到950个用于后续模拟。

视频分析采用以下程序：将透明塑料片放在计算机屏幕上，使用白板笔描出焦点区域。我们记录动物左后脚进入焦点区域的时间，并使用带有Time v3.2扩展的VLC媒体播放器测量其停留时间。为了评估工作量，我们记录了测量所需的时间。录制开始时动物已经存在于焦点区域内的视频被排除在停留时间测量之外。然而，如果根据上下文线索可以清楚地确定动物的进入，则这些视频被保留用于分析。虽然这种方法可能会给停留时间估计带来一些偏差，但此类情况的比例很小，可以忽略不计。对于单个视频中的多次进入，随机选择一次进入进行停留时间测量。在一些动物对相机有反应的视频中，RAD-REST模型允许我们将这些视频从分析中排除，并测量新随机选择的视频。

我们使用新开发的R软件包‘ctrest’描述了密度估计过程的概要。

2.2.1 停留时间

为了选择预测停留时间的最佳时间分布，我们使用了包中的bayes_stay_selection函数，该函数使用NIMBLE作为MCMC采样器进行参数估计。我们比较了四个候选分布：指数分布、伽马分布、对数正态分布和威布尔分布。基于广泛适用信息准则（WAIC）值选择最佳分布。对于每种物种的每种分布，我们运行了三个MCMC链，每个链进行5000次迭代，燃烧期为1000次迭代。我们应用了因子为2的稀释以减少自相关。停留时间建模的所有模型参数都被分配了非信息性或模糊先验。我们使用R-hat统计量评估了感兴趣参数的MCMC链收敛性，其中低于1.0的值表明成功收敛。

2.2.2 动物可及性

由于这项研究是首次尝试使用冯·米塞斯混合模型估计活动时间比例，我们将我们估计的期望值和95%可信区间（CI）与Rowcliffe等人通过核密度估计获得的结果进行了比较。核密度估计的95%置信区间是基于数据999个自助法重复样本估计值的标准差计算的。我们使用bayes_activity函数通过冯·米塞斯混合模型估计活动比例。最初，我们将最大混合分量数设置为20。然而，我们发现将K减少到大约5并不会显著改变任何物种的估计结果。为了确保足够的模型灵活性，我们保守地将K设置为10用于所有后续分析。对于控制断棒过程中混合比例稀疏性的浓度参数α_s，我们假设其遵循伽马分布。

这个先验通过偏向少数主导分量来鼓励更稀疏的混合，防止估计冗余的混合分量。

2.2.3 密度

使用‘ctrest’包中的bayes_rest函数和bayes_rest_multi函数分别使用原始REST模型和RAD-REST模型进行密度估计。我们生成了三个链，每个链进行20,000次迭代，燃烧期为10,000次，并以5为因子进行稀释。收敛诊断和模型拟合评估采用与停留时间估计相同的程序。为了减轻参数可识别性问题和计算负担，我们在密度估计模型中，将活动时间比例P的估计作为一个独立的模型进行。随后，我们将该模型的后验样本作为活动比例的MCMC样本，逐个迭代地分配给密度估计模型。这是使用NIMBLE的prior_samples采样器实现的。这种方法不仅提高了可识别性和计算效率，而且允许将活动时间比例估计的不确定性传播到种群密度的不确定性估计中。

2.3 蒙特卡洛模拟

我们进行了蒙特卡洛模拟，以根据案例研究结果检验调查工作量与估计精度之间的关系，并为实地应用提供实用指南。使用房总半岛种群的参数中值作为真实值，我们特别旨在（1）检查估计精度如何随分析的视频数量变化而变化，（2）估计野生动物管理应用所需的调查工作量，以及（3）确认在这些现实参数设置下，模型能产生无偏估计且具有适当的覆盖率。

RAD-REST模型是为从大规模调查中进行高效密度估计而开发的。因此，我们模拟了相对大规模调查，相机部署期为3个月（固定），相机数量可变（100、200、400和800）。对于每种相机配置，我们尽可能从不同的相机中随机选择给定数量的视频 per species。分析的视频数量从50增加到950，步长为100，每个视频数量进行一次模拟。当单个视频中出现多次进入焦点区域时，选择第二次进入进行停留时间测量。参数估计遵循与经验数据分析相同的程序。

为了评估获得具有足够精度用于野生动物管理的密度估计所需的调查工作量，我们绘制了密度估计的变异系数（CV）与分析视频数量的关系图。我们考虑了可接受精度的两个阈值：CV为0.2，以及CV为0.35，后者代表了先前相机陷阱密度估计研究中认为可接受的精度水平。然后我们对此数据拟合线性模型，使我们能够评估达到这些阈值（0.2或0.35）所需的视频数量。

该分析基于我们的模型准确量化密度估计不确定性的前提。为了验证这一假设，我们评估了我们估计的覆盖率。由于每次估计需要大量计算时间，评估每个单独模拟的覆盖率是不可行的。由于每个特定设置的模拟数量有限，我们将所有物种和设置（即变化的分析视频数量）汇集在每个模型类型和相机设置内。没有证据表明这种汇集影响了经验覆盖率的评估。我们评估了经验覆盖率是否与名义95%水平匹配。

为了补充基于模拟的分析，并为从业者提供基于真实数据的直觉，我们使用两个焦点物种（野猪和貉）的野外数据检查了密度估计的可信区间如何随分析视频数量的变化而变化。选择这些物种是因为它们有足够大的样本量来进行稳健的子抽样分析。对于每个物种，我们随机子抽样从50到950数量不等的视频，步长为100，并使用与主要分析相同的分析框架估计密度及其95%可信区间。

3 结果

3.1 野外数据分析结果

成功从193个相机获得视频数据。每个相机的采样努力为77.0 ± 25.6 SD 相机日。每个物种的总检测次数如表1所示。小麂的数量最高，为10,273个视频，而日本貂最低，为132个视频。计算进入次数和测量停留时间所需的时间约为每小时100个视频。

通过冯·米塞斯混合模型估计的活动时间比例与Rowcliffe等人通过核密度估计得到的结果基本一致。对于样本量较小的物种，冯·米塞斯混合模型估计的昼夜活动模式曲线比核密度估计的曲线更平滑。然而，两种方法估计的预期活动水平几乎相同。

在焦点区域内停留时间的模型选择中，对数正态分布被选为大多数物种的最佳分布，只有家猫更适合指数分布。对于猫，WAIC差异适中（Δ = 2.6），但为了跨物种的一致性，我们采用了对数正态分布。这个选择是保守的，因为双参数对数正态分布比指数分布产生更谨慎的估计。因此，我们报告所有物种使用对数正态分布的估计结果。

估计的密度反映了检测频率，小麂的密度最高，为40.1 只/km2（95% CI: 24.8–76.0），日本貂最低，为0.25 只/km2（95% CI: 0.15–0.42）。密度估计的变异系数（CV）通常可接受（≤0.35），除了梅花鹿（0.57）和日本野兔（0.47）。这些物种的较高值归因于它们经常在相机前暂停，导致停留时间变异性更大。这两个物种的预期停留时间的CV分别为0.52和0.39，而其他物种的值约为0.2。

3.2 蒙特卡洛模拟结果

蒙特卡洛模拟表明，单物种和多物种RAD-REST模型都提供了可靠的密度估计。两种模型都产生了无偏估计，估计密度（后验中位数）与真实密度的回归系数接近1.0，截距接近0。覆盖性能也非常令人满意，95%可信区间在所有模拟场景中始终达到接近名义95%水平的数值。

虽然原始REST模型表现出更优的估计精度，但RAD-REST模型以显著减少的分析工作量实现了可接受的性能。对于由200个相机组成的网络，原始REST模型对所有物种产生的CV接近0.2，除了野兔和貂。使用RAD-REST模型，仍需分析数百个视频才能保持这种精度水平。然而，RAD-REST模型很容易达到CV为0.35：对于200个相机的阵列，分析每个物种100个视频就足够了，除了一些食草动物（鹿、野兔和麂）。停留时间仅在对进入次数进行计数的视频中至少记录到一次进入的那些视频中进行测量（约占样本的60%–70%）。分析仅需约1小时。估计不确定性的主要因素是停留时间参数。多物种模型比单物种模型表现出更高的精度，特别是在分析较少视频时。多物种模型的这一优势在图S6中更清晰地说明。

在实际数据集的分析中，我们观察到了与模拟分析一致的模式：随着视频数量的增加，密度估计的95%可信区间宽度减小，表明估计精度提高。

4 讨论

4.1 RAD-REST模型的优缺点

我们开发了RAD-REST模型——一个为未标记地表栖居哺乳动物多物种密度估计设计的REST框架扩展——使用完全贝叶斯推断，包括活动时间比例的半参数估计。蒙特卡洛模拟表明，单物种和多物种模型都产生了可靠的密度估计。案例研究进一步表明，RAD-REST模型产生的估计值与使用其他成熟方法获得的估计值相当。我们的梅花鹿密度估计与基于粪便颗粒计数的状态空间模型先前的估计值相符。同样，我们的小麂估计值也是合理的。此外，RAD-REST模型还提供了实际优势。与需要分析所有视频的REST模型不同，RAD-REST模型不需要使用所有视频，允许我们将动物对相机有反应的视频从分析中排除。总的来说，RAD-REST模型是一个实用且稳健的密度估计工具，它适当地传播了所有相关参数估计的不确定性。

我们的模拟还证明，RAD-REST模型是高效多物种监测的可行选择。使用200个相机，分析100个视频足以使12个物种中的10个达到CV为0.35。然而，达到CV为0.2则需要显著更大的采样努力。对于几个物种（如野兔、貂、鼬），200个相机的设计无法获得足够的样本量来达到此阈值，而400个相机的设计使所有物种都能达到此阈值。使所有物种达到CV为0.2，在单物种模型下仅需分析总预期视频（>约40,000）的7.00%，在多物种模型下仅需6.45%。我们的调查覆盖了广阔区域，真实密度在不同地点差异很大，这可能降低了精度；将合适的环境协变量纳入