开发一个定量指标来监测鲸类分布的变化

《Ecological Indicators》:Developing a quantitative indicator to monitor cetacean distributional change

【字体: 时间:2026年05月10日 来源:Ecological Indicators 7.4

编辑推荐:

  文森特·贝努瓦(Vincent Benoit)| 马蒂厄·奥蒂埃(Matthieu Authier)| 安妮塔·吉尔斯(Anita Gilles) 汉诺威兽医学院陆地与水生野生动物研究所,基金会,沃夫特街6号(Werftstrasse 6),25761布苏姆(Büsum),德

  文森特·贝努瓦(Vincent Benoit)| 马蒂厄·奥蒂埃(Matthieu Authier)| 安妮塔·吉尔斯(Anita Gilles)
汉诺威兽医学院陆地与水生野生动物研究所,基金会,沃夫特街6号(Werftstrasse 6),25761布苏姆(Büsum),德国

**摘要**
监测鲸类动物的分布是海洋保护的优先事项。然而,目前的生态系统范围评估缺乏关于分布的指标:鲸类动物的分布图无法满足定量报告的需求。欧盟的《海洋战略框架指令》以及多个专家小组都强调了需要一个定量分布指标。我们测试了多种候选指标,包括“中心度量”(Measures of Centre)和“集中度量”(Measures of Centralisation),以将分布图汇总成政策制定者易于理解的数字。我们模仿了距离采样(Distance Sampling)和密度表面建模(Density Surface Modelling)方法,根据专门的调查数据来估计鲸类动物的分布情况,以评估观测噪声和估计不确定性对这些候选指标的影响。为了理解误差或不确定性带来的影响,我们采用了一种结合模拟和建模的“虚拟生态学”方法。几何中位数(Geometric Median)作为中心度量指标,C50作为集中度量指标,它们保留了分布图中的关键信息,同时对估计误差的敏感度较低。我们的研究结果表明,为了使指标具有政策相关性,必须在指标的信息量与其对估计误差的鲁棒性之间找到平衡,并为其解释设定适当的阈值。在大规模调查的背景下,“虚拟生态学家”方法提供了一种实用的工作流程,用于测试我们提出的指标的准确性、估计第一类错误率(type-I error rates)并校准阈值。我们的研究成果,包括整个工作流程,为建立东北大西洋地区完整的鲸类动物分布指标迈出了第一步。

**1. 引言**
监测和保护鲸类动物及其栖息地是海洋生态学的首要任务。由于鲸类动物处于较高的营养级且分布范围广泛,它们被视为“伞护物种”(Prideaux, 2003; Zacharias and Roff, 2001),这意味着保护它们有助于保护许多共存的物种;同时,由于它们对所栖息和利用的生态系统状态非常敏感,它们也被视为“哨兵物种”(Wells et al., 2004, Moore, 2008)。此外,这些物种特别容易受到环境威胁,面临显著的人为压力(Avila et al., 2018)。渔业中的意外捕获、噪音和化学污染、与船只的碰撞、环境变化以及过度捕捞或栖息地恶化导致的食物可用性或质量下降都对鲸类动物构成威胁(Avila et al., 2018, ICES, 2021)。因此,监测鲸类动物的数量、分布和整体种群状况是优先事项(Correia et al., 2014),以便了解生态系统的健康状况(参见Tett et al., 2013, McQuatters-Gollop et al., 2022)。
《海洋战略框架指令》(MSFD, 2008/56/EC,2017年修订)为欧盟的海洋环境保护建立了框架和目标,并强调了需要指标来评估各种环境状况。作为生物多样性描述符D1的一部分,定义了一个物种分布标准(D1C4),该标准与《栖息地指令》中的范围指标相对应。

**2. 范围度量**
诸如观测分布范围(Observed Distributional Range)或生态潜在范围(Ecological Potential Range)等范围度量已与物种分布模型结合使用,以评估物种的扩散情况(Arcangeli et al., 2023)。然而,由于鲸类动物难以捕捉且移动性强,其分布范围难以评估,现有的监测方法也不适合研究其分布变化。需要在研究区域边缘进行更多调查,以检测其范围的变化。目前的方法主要是为了获得可靠的物种数量估计和分布图(Lacey et al., 2022, Gilles et al., 2023, Gilles et al., 2025)。这些调查生成的输出图仅进行了定性描述,分布模式的变化没有量化或与阈值进行对比。因此,这些图不一定适合向政策制定者报告,尤其是在需要定量变化指标的情况下,如《海洋战略框架指令》所要求的。有必要将分布图汇总为定量指标,以便于沟通并生成可用于政策制定的环境变化评估。这一问题在最近的区域海洋公约评估报告中得到了强调,例如赫尔辛基波罗的海环境保护委员会(HELCOM)和奥斯陆-巴黎东北大西洋海洋环境保护公约(OSPAR),这两个欧洲领先的海洋哺乳动物专家组织。一个可操作的分布指标的最终目标是评估分布变化的值(即正面或负面)。这一评估取决于能否识别种群分布随时间的变化,并将其与种群栖息地的质量联系起来。实现这一目标的第一步是开发一个能够作为预警信号以触发及时管理决策的分布变化指标,正如《海洋战略框架指令》评估指南中所所述。

**3. 挑战**
鲸类生态学的一个挑战是处理由于观测过程的随机性、海洋生态系统的内在变异性、模型设定的不确定性以及与研究区域大小相比数据量少所导致的估计误差。通常情况下,鲸类动物的真实分布无法直接观察到,只能进行估计,而这容易出错。实际上,鲸类动物大部分时间都在水下活动,而观测调查的空间覆盖范围有限(Hammond et al., 2021)。因此,用于描述鲸类动物分布变化的指标必须足够稳健,不应受到估计误差的过度影响。考虑到这一点,我们需要了解基于估计分布计算出的MOC指标的变化是否准确地反映了真实未知分布的变化。在这里,我们测试了不同的指标,探讨它们作为分布变化指标的潜力、优缺点及局限性。所考虑的指标不是基于范围,而是基于分布的中心位置,因为这更符合当前针对鲸类动物的调查设计。这些所谓的中心度量指标(Measures of Centres,MOC),包括重心(Centre of Gravity)、几何中位数(Geometric Median)和Valeriepieris中心(Valeriepieris Centre,详见方法部分),可以汇总分布并检测分布变化。任何分布指标,包括MOC,都旨在将地图上每个像素的一个值合并为一个单一值。这一过程必然会损失一些信息。除了研究地图上的中心位置外,我们还考虑了集中度量(C50),该指标旨在总结地理区域内个体的聚集情况。

**4. 研究方法**
本研究旨在探讨所选指标(MOC和集中度量)在利用视觉调查收集的典型数据对鲸类动物种群分布变化进行建模过程中的表现,并了解估计误差对指标解释的影响。为此,我们通过遵循“虚拟生态学方法”(Zurell et al., 2010)的R语言工作流程进行了测试:(i) 为我们的研究对象——北海的一种小型鲸类动物,模拟其潜在的分布图;(ii) 模拟专门的鲸类动物调查所得到的目击数据;(iii) 基于这些数据,使用距离采样(Buckland et al., 2001)和密度表面建模(Miller et al., 2013)方法建模分布;(iv) 比较模拟得到的分布图和实际估计的分布图,以了解这些指标受此过程的影响。这三个步骤分别是在初始时间t0和分布变化后的时间t1进行的。为了评估指标对分布变化的响应并测试不同输入下的多种情景,我们进行了一系列模拟。还在无分布变化的假设下进行了一系列模拟,以估计经验上的假阳性率。最后,我们将候选指标应用于实际案例,使用SCANS(1994)、SCANS-II(2005)、SCANS-III(2016)和SCANS-IV(2022)对北海港湾鼠海豚(Phocoena phocoena)的调查数据。

**2.1. 符号说明**
我们假设鲸类动物的分布由一组与坐标x, y相关的正值表示。用i表示地图上的一个像素:zi = xi, yi是欧几里得空间R2中的像素坐标,ai ≥ 0表示像素i的丰度,si > 0表示像素i的面积,di = ai·si表示其密度。令A = ∑iai表示总丰度。令Ciρ表示以zi为中心的半径为ρ的圆。欧几里得范数用□表示。

**2.2. 候选指标**
我们测试了不同的指标,这些指标不是基于范围,而是基于分布的中心位置,因为这更符合当前针对鲸类动物的调查设计。研究了三种中心度量指标(MOC),以评估它们总结分布和检测分布变化的能力:
1. **重心(CoG)**是地图上随机选取的一个动物的平均位置(Woillez et al., 2007; Chavez-Rosales et al., 2022):
\(CoG = \frac{\sum_{i} ai \cdot zi}{A}\)。
2. **几何中位数(GM)**是从该点开始到所有像素z的欧几里得距离之和最小的点:
\(GM = \argmin_{\theta \in R^2} \sum_{i} |zi - \theta_i|^2\)。
与CoG相比,GM对数据集中的异常值不那么敏感,它是使用Weiszfeld算法(Weiszfeld and Plastria, 2009)计算得出的。
3. **Valeriepieris圆(VP)**是包含至少一半感兴趣区域内个体的最小半径圆:
\(VP = C_j \rho\),满足 \(\argmin_{\rho \in R^+} \left|\sum_{i \in C_j \rho} |ai - 1\right|^2\)。
这是一个新型指标,由Arthur(2024)在人文地理学和人口统计学中使用,用于确定种群的位置和分布情况。该圆的中心称为Valeriepieris中心(VPC = z_j),是本研究中第三个也是最后一个研究的中心度量指标。Valeriepieris圆的位置是使用Arthur(2024)中提出的算法计算得出的。
对于给定的分布,这三个中心度量指标的位置可能差异很大,不能同样准确地反映种群的实际位置(Arthur, 2024)。
除了中心度量指标外,还研究了一种总结地理区域内个体聚集情况的集中度量指标。这第四个指标称为C50(Arthur, 2024),它源自VPC的半径:
\(C50 = 1 - \frac{R_1}{R}\),其中R1是包含整个研究种群的圆的半径,0.5是一个归一化因子。对于均匀分布的种群,C50接近0;对于集中在一个区域的种群,C50接近1。C50指标是一个很好的种群集中度量指标,因为它包含了与VPC半径相同的信息,但值介于0和1之间,便于解释和比较。

**2.3. 工作流程概述**
“虚拟生态学家”方法(Zurell et al., 2010)使我们能够研究估计误差对候选指标的影响:通过模拟虚拟鲸类动物的分布并模拟观测和建模过程,可以获取真实分布和估计分布。这种模拟工作流程在统计分析软件R版本4.3.3(R Core Team, 2023)中实现。该工作流程(见图1)遵循线迹距离采样方法(Buckland et al., 2001, Miller et al., 2013)。它分为两个主要组成部分:模拟从大规模观测调查中获得的数据,以及像使用真实数据集一样对目标物种的分布进行建模。对于给定的一组输入,这个工作流程会生成一个模拟的(“真实”)分布图和一个估计的分布图,并在两者上都计算感兴趣的指标。重复这个过程(例如,使用不同的输入运行多次模拟)可以研究不同指标可能出现的抽样分布误差;并评估它们在反映真实分布变化方面的准确性。下载:下载高分辨率图片(435KB)下载:下载完整尺寸图片

图1. 说明模拟分布、模拟类似调查的数据以及从数据中估计分布的工作流程的流程图。

2.4. 数据来源
表1中显示的地理参考环境协变量被提取并用于本研究。这些是鲸类分布的重要驱动因素(Redfern等人,2006;Forney等人,2012;Becker等人,2014;Gilles等人,2016;Pigeault等人,2024)。所有空间分析都是在ETR89/LAEA Europe(EPSG:3035)投影坐标参考系统中进行的。这个平面坐标系统以米为单位表示坐标,并允许使用欧几里得几何学计算距离。

表1. 从EMODneta和Copernicusb中提取的环境协变量。
类别 环境协变量
空间分辨率 时间分辨率
来源 生理特征 海深(米) 1/16弧分钟 N/A
EMODnet 坡度(弧度) 1/16弧分钟 N/A
EMODnet 朝向(弧度) 1/16弧分钟 N/A
海洋学 海表温度(°C)平均值和梯度(°C/m)0.083度 每月
Copernicus 涡流动能(EKE;m/s) 0.083度 每月
Copernicus 海洋初级生产力(NPPV;mg m?3 day?1) 0.25度 每月

a https://emodnet.ec.europa.eu/enb
b https://resources.marine.copernicus.eu

2.5. 完整模拟
在覆盖研究区域的网格上模拟鲸类分布,每个网格像素的大小为10公里×10公里,并赋予一个模拟的丰度值。工作流程允许每个环境协变量(表1)以非线性方式影响丰度,这种影响是半随机生成的,这意味着其幅度和整体效应受用户控制,但其形状在给定范围内是随机的。在这项研究中,我们仅使用海深来影响丰度,因为我们重视简洁性和时间效率。也可以添加局部高密度或低密度区域(使用高斯过程的实现,在对数尺度上),对周围单元格的丰度产生乘法影响,具有给定的范围和幅度。最后,生成具有给定幅度的随机(白色)噪声。这个代表每个像素预期丰度的地图通过R包sismow(Queroue,2023)转换为个体地图(Matthiopoulos等人,2023)。个体总数(即丰度A)受用户控制,这也是工作流程中的一个输入(图1)。

“虚拟生态学家”方法的一个目标是模仿实际观测过程收集的数据(Zurell等人,2010)。这里的目标是模拟类似于大规模国际调查SCANS(欧洲大西洋水域和北海的小型鲸类;见Hammond等人,2002;Hammond等人,2013)获得的数据。不同的工作流程输入,包括研究区域(北海)和模拟群体数量(75,000个),平均每个群体大小为1.37个个体(EA=75,000×1.37=102,750),选择这些是为了模拟小型鲸类物种的结果。沿调查线的群体目击情况根据调查线与个体之间的垂直距离进行模拟,模拟的检测概率随之而变化。调查线设计和检测概率模仿了SCANS-IV调查(Gilles等人,2023)。对于每次目击,位置、个体数量和垂直距离(从观察者到目击点)都被存储并分配给沿调查线的线性努力段,形成模拟的数据集。这种数据格式用于密度表面建模(DSM,Miller等人,2013;Miller等人,2019;图1)。DSM是广义加法模型(Wood,2006),可以估计物种的丰度和分布。模拟的数据集按照分析与真实鲸类数据一致的方式进行分析,其中包括使用半正态检测函数的不完美检测模型。我们只在工作流程中考虑半正态检测函数,因为它具有鲁棒性(Gonzales等人,2017)。尽管仅使用海深来模拟分布图,但表1中呈现的所有协变量都在建模过程中可用,模拟了一个真实的案例情景,其中影响分布的协变量组合是事先未知的。对于一个到四个不相关的协变量(即皮尔逊相关系数<0.5的协变量)的每种可能组合,每个模拟都拟合了广义加法模型,总共46个模型。此外,每个模型都添加了位置协变量的空间自相关平滑处理。应用了简单的模型选择过程,使用赤池信息量准则(AIC)得分,该准则允许在模型复杂性和数据拟合之间取得折中(Burnham和Anderson,2002)。使用AIC得分最低的模型来预测研究区域的分布。这是对通常会针对此类数据进行的深入模型选择的简化,但为了在合理的时间内获得结果,这是必要的。

对于MOCs的研究,移动了一个局部高丰度区域(“热点”)来模拟分布的变化。在这些情景下,动物实际分布不变的零假设是不成立的。在我们的虚拟生态学方法中,热点被定义为在较长时间内密度或丰度高于平均水平的局部区域。通过改变t0和t1之间热点的位置,可以模拟随时间变化的分布,而改变强度和范围则可以控制变化的大小。位置的变化始终是相同的,热点大约向南移动了670公里,向西移动了30公里:从挪威海岸移动到英格兰海岸(见图2)。在建模过程之前和之后,使用相同的种子在模拟的数据集上运行了建模,得到了两个估计的分布,也可以进行比较以确定指标的估计变化。MOC指标的位置变化是通过矢量差计算的。“真实”模拟分布中的位置变化(θ)与估计分布中的位置变化(θ?)之间的差异即为估计误差Δ=θ?θ?(图2),最初计算为矢量差,然后转换为距离以简化分析。

测试了不同热点强度和范围的值,以及基线情景以及其他热点强度或范围增加的情景,如表2所示:
对于每个情景,即不同的输入集,在分布变化之前和之后分别运行了100次模拟,每次使用唯一的种子。总共模拟了100×5×2=1000次调查,每次包括数据模拟和分布建模过程。

表2. 不同热点强度和范围的情景。H0表示动物实际分布不变的零假设。
情景 热点强度 热点范围
H0 0 0 真实 100
False 2 0 假设
3 0 30 假设
4 ++ 假设

由于C50是衡量中心化的指标,而不是位置,因此方法略有不同。这里使用的是热点强度和范围随时间的变化,而不是位置的变化。这允许模拟分布中心化的明显变化,同时限制位置的变化,更适合测试C50作为中心化的指标。之前建立的情景以成对的方式进行了比较,每对情景代表不同的分布变化,一个在t0,另一个在t1。否则,误差的计算方法相同(见图2),即真实变化与估计变化之间的差异。

在其余部分,我们对指标、误差和指示器进行了概念性的区分。三个MOCs和C50是指标,分布变化的指示器是在两个不同时间点t0和t1计算的这些指标之间的(矢量)差异(例如ΔC50是一个指示器),而误差是在模拟的“真实”分布上计算的指标与估计分布上的指标之间的差异(最初计算为矢量,然后转换为距离)。

2.6. 在零假设下的模拟
还运行了一个零情景来估计假阳性,即即使实际基础分布没有变化,指标也显示出变化。在这种情况下,动物实际分布不变的零假设是成立的:在t0和t1之间没有分布变化。分布图和模拟的个体(见图1)保持不变,但是使用不同的种子再次生成了观测数据,因此t0和t1之间的调查线上的检测过程产生了不同的数据集。这个选择相当于进行了多次调查,有不同的目击记录,而动物基础分布没有任何变化。误差的计算方法与图2中显示的方法相同,除了真实变化θ=0。对于这种零分析,运行了100次模拟(对应于表2中的情景0),每次在分布变化之前和之后(即使这里没有变化),总共进行了100×2=200次模拟调查。

在另一种基于实际分布不变的零假设下的模拟中,使用了略有不同的方法,结果和解释可以在补充材料中找到(见B部分)。还进行了基准分析,在零假设下并使用预测用的真实模型。因此忽略了模型选择步骤,因为假定正确的模型是事先已知的。进行这种基准分析是为了区分模型设定错误和其他来源的错误,可以在补充材料中找到(见C部分)。

下载:下载高分辨率图片(963KB)
下载:下载完整尺寸图片

图2. 研究区域(北海)的图形示意图以及MOC变化中的估计过程。左侧面板显示了时间0时的分布,右侧面板显示了时间1时热点向南移动后的分布。顶部面板显示了通过模拟获得的真实分布,底部面板显示了来自密度表面模型(DSM)的估计分布。

2.7. SCANS案例研究
对SCANS、SCANS-II、SCANS-III和SCANS-IV调查中的港湾鼠海豚(Hammond等人,2013;Lacey等人,2022;Gilles等人,2025)的(建模)分布图进行了案例研究。选择港湾鼠海豚作为案例研究物种的原因是之前已经证明其分布发生了变化(Hammond等人,2013):这个案例研究提供了评估所提出指标在定量检测这种变化方面的能力的机会。

3. 结果
3.1. 中心度量
基于两个时间点测量的MOCs差异的候选指标在抵抗估计误差方面的鲁棒性有所不同。图3显示了每种情景下MOCs的误差直方图。在每种情景中,VPC的误差最高,其次是GM,最后是CoG,其误差最低。所有直方图都在0或附近显示出一个峰值,表明估计的MOCs平均是无偏的。然而,实证误差分布的尾部比正态分布的尾部更重,特别是对于GM和VPC。为了量化这种重尾性,我们使用了一个误差阈值±100公里:低于此阈值的误差值被认为是可接受的范围内。低于阈值的值百分比在各种情景中保持稳定,平均分别为VPC的73%、GM的90%和CoG的96%。因此,VPC的较大估计误差比GM或CoG更可能发生。

MOC指标在反映分布变化方面也有所不同。图4显示了情景1(表2)中MOCs的整体模式变化,每个点对应于一个特定的模拟。在分布变化之前和之后,重心的分布范围非常狭窄,所有点都聚集在北海的中央。对于地理中间点(GM),这些点的分布更为分散,而对于虚拟中心点(VPC),这种分散程度更为明显。无论是模拟地图还是估计地图,这些模式都非常相似。其他三种情景的结果可以在补充材料中找到(见第A节)。热点区域的强度和分布范围影响了移动观测中心(MOCs)的总体分布情况;然而,这并没有改变不同指标之间的比较。

图3. 情景1至4中VPC(蓝色)、GM(绿色)和重心(红色)位移的估计误差经验直方图(详见表2中的情景定义)。虚线表示±100公里的范围内。

在分布未发生变化的零假设下,使用情景0进行了估计误差的研究(表2)。MOCs的估计误差很少超过100公里(图5):VPC的误差最大,其次是GM,最后是重心。表3报告了经验I型错误率,即超过不同阈值的模拟百分比。对于100次模拟,蒙特卡洛误差估计这些I型错误率的上限为0.5×0.5^100=0.05。在所有考虑的阈值中,VPC的错误率最高,其次是GM,然后是重心。

图4. 情景1下MOCs的变化。每张图中,每个MOC的位置分别用蓝色表示变化前的值,用红色表示变化后的值。顶部行(模拟地图)对应真实分布,底部行(估计地图)对应模型分布。

图5. 在零假设下,VPC(蓝色)、GM(绿色)和重心(红色)位移的估计误差经验直方图。

3.2 集中化
使用不同情景组合(S1至S4,见表2)模拟的分布变化,C50的估计误差用直方图显示在图6中。平均绝对偏差(mad)为0.047,每种情景对比的平均值,其中S3-S4的最大值为0.057。换句话说,由于估计误差导致的指标变化(即C50或ΔC50的变化)大多在0.1以下。更准确地说,平均87%的ΔC50误差低于0.1,尽管偶尔也会较高。总体而言,不同情景下的误差波动在84%到97%之间,均小于0.1。

在零假设下(情景0;表2),估计误差甚至更小(图7,表4)。在100次模拟中,误差的绝对值仅有一次超过0.1,92%的时间内误差低于0.05。因此,任何0.1或更大的C50变化都可以被解释为有意义的,因为它超出了零假设下的估计误差分布范围。

图6. 指标ΔC50=C50(t1)?C50(t0)的估计误差直方图。每一对情景(S)代表一次分布变化。

图7. 在零假设H0(动物真实分布无变化)下,指标ΔC50=C50(t1)?C50(t0)的估计误差直方图。

3.3 SCANS案例研究
SCANS -II、-III和-IV调查中,对港湾鼠海豚的估计分布计算了不同的指标(MOCs和C50),如图8所示。所有MOC指标在SCANS(1994年)和-II(2005年)之间都出现了向南的移动:VPC向南移动了230公里,向东移动了20公里;GM向南移动了223公里,向西移动了32公里;重心向南移动了155公里,向西移动了16公里。SCANS-II(2005年)、-III(2016年)和-IV(2022年)之间没有显著差异。C50的值没有明显变化,1994年为0.46,2005年为0.54,2016年为0.50,2022年为0.53,所有配对差异(即指标ΔC50)都低于0.1。

表3. 与不同阈值选择相关的经验I型MOC错误率,用于拒绝零假设H0(动物真实分布无变化)。在100次模拟中,蒙特卡洛误差估计这些I型错误率的上限为5%。

表4. 与不同阈值选择相关的C50的经验I型错误率,用于拒绝零假设H0(即ΔC50=0)。在100次模拟中,蒙特卡洛误差估计这些I型错误率的上限为5%。

图8. 从SCANS到SCANS-IV的北海港湾鼠海豚密度图上的相关指标。

4. 讨论
多项研究已经考察了鲸类种群的时间变化(Arcangeli等人,2013年;N?ttestad等人,2015年;Boyd和Punt,2021年),主要关注观察次数或丰度估计的变化,而不是研究区域密度图中的分布变化。已经展示了不同时期鲸类物种的密度图(Forney等人,2012年;Gilles等人,2016年;Becker等人,2018年),并对地图之间的差异(即年份或季节的变化)进行了定性描述,但没有定量分析。最近的研究开始量化这些变化(Chavez-Rosales等人,2022年);Arcangeli等人(2023年)测试了不同的范围指标,但没有讨论其对估计误差的鲁棒性。当前的研究旨在通过使用虚拟生态学方法(Zurell等人,2010年)来量化在估计地图上计算这些指标时可能出现的不确定性,这是开发鲸类分布变化指标的重要步骤。虽然之前的研究通过模型拟合和预测成功率指标来检查模型误差和不确定性(Naimi等人,2014年;Fernandes等人,2019年),但我们的重点是从典型的调查数据和建模工作流程中产生的估计误差。因此,我们的工作旨在探索观察和建模过程中可能产生的全部潜在不确定性。据我们所知,目前尚无研究涵盖当前模型及其对潜在指标影响的全部误差范围。在这方面,开发一个物种分布变化的指标是一个相对新颖的概念:本研究探讨了可用于海洋环境中移动物种的指标,以及基于这些指标构建的指标的局限性。

4.1 中心度量
在零假设下,MOCs的误差大多在50公里以下(图5,表3)。使用保守的100公里阈值可以有意义地解释指标的变化,因为指标的变化很可能反映了潜在分布的变化,即使对其幅度的估计存在误差。此外,100公里的阈值对于像港湾鼠海豚这样的物种也具有生态意义,因为这相当于许多个体超过一天的旅行距离(Read和Westgate,1997年;Otani等人,2000年;Sveegaard等人,2011年)。结果显示,GM和重心的误差始终低于这一阈值,而VPC的误差变化较大。

Valeriepieris中心是一个有前景的指标,可以用来将密度图总结到一个中心位置(Arthur,2024年)。与其他MOCs相比,它更能代表种群的实际位置。这在Arthur(2024年)中通过人口统计学的例子得到了证明,并且在图4中清楚地反映了热点位置的变化,从而反映了分布的变化。VPC对分布变化敏感,这对于分布指标来说是理想的,因为它意味着从指标的变化中检测到分布变化的可能性增加。然而,这也导致VPC对估计误差的敏感性更高。估计鲸类分布的建模过程会产生一些不确定性,这可能会影响最终的VPC位置(见图3)。换句话说,虽然VPC在识别分布变化方面很敏感,但需要注意的是,实际上,指标值的变化可能更多地归因于建模过程中的估计误差而不是真实的分布变化。VPC的误差在不同情景中的波动也比其他指标更大,表明其估计可能不够稳定:因此,我们得出结论,在使用最先进的方法(距离采样数据和DSM)估计鲸类分布的情况下,VPC对估计误差不够稳健。

重心是最不敏感的MOC指标之一,这可以归因于其平均性质。这个指标并不总是准确反映种群的实际位置或变化(见图4和Arthur,2024年)。然而,这种缺乏敏感性也使其对估计误差具有鲁棒性(见图3)。因此,在某种意义上,它是一个更为保守的选择,因为它更有可能被准确估计,但与VPC相比,它对真实分布变化的敏感性较低。几何中位数在鲁棒性和指标信息量这两个标准之间起到了平衡作用,似乎是一个良好的折中方案。GM对真实分布变化的敏感度高于重心,但受估计误差的影响较小,因此是检测地理分布变化的一个良好候选指标。

4.2 集中化
集中化也是一个有趣的信息,可以包含在指标中,以总结鲸类分布的一些显著特征。区分集中度(即每单位面积的个体数量)和集中化(即归一化到总种群的数量)是很重要的。在这项研究中,仅通过使用C50来评估集中化。在零假设下,它的估计误差很小,大部分误差都在±0.05以内(图7,表4)。将阈值设定为这个误差的大约两倍,得出了0.1的值,用于检测随时间变化的集中化。实际上,在零假设不成立的情景中(表2),估计误差大多数时间也低于这个阈值,且没有特定偏差(图6)。这是可接受的,因为大于0.1的变化可以有意义地解释。这些结果总体上是令人鼓舞的,因为它们展示了将地图总结为简单、信息丰富的指标的能力。

在进一步开发分布指标时,也可以考虑不同的集中化度量。特别是,C50是从包含50%种群的VP圆中得出的。选择50%是任意的:也可以选择其他比例,如C25(包含25%的种群),C75(包含75%的种群)等(Arthur,2024年)。我们预计,选择的比例越低,它受估计误差的影响就越大。然而,如果所选比例与研究种群中的局部密度(即高密度和低密度区域)更吻合,其信息价值可能会提高。与MOCs一样,需要在鲁棒性和信息量之间找到平衡,C50不一定是最优选择。在未来发展中,也可以考虑和探索其他集中化或种群分布的度量,并采用类似的工作流程和方法。然而,在这项研究中,我们的目标是调查当地图被总结并浓缩为少数几个指标时所发生的信息损失。这些指标随时间的变化可以提供一个变化指标,从而更容易地传达给政策制定者和管理者。因此,我们选择了那些解释清晰、非专业人员也能理解的指标。此外,我们的指标可以直接从生态学家常规生成的预测分布图中计算得出,而无需访问原始数据。

4.3 SCANS案例研究
港湾鼠海豚是北海数量最多的鲸类物种。1994年(SCANS)到2005年(SCANS-II;Hammond等人,2013年)之间,其分布范围从北部显著向南部转移。其他独立研究(IJsseldijk等人,2020年)也证实了这一变化。SCANS-II(2005年)和SCANS-III(2016年)的估计分布相似。SCANS-IV(2022年)的建模报告(Gilles等人,2025年)显示的分布与SCANS-III(2016年)相近,但略微偏向中部和北部地区。这些变化在1994年到2005年间海洋浓度(MOC)的向南移动中得到了很好的体现,而在2005年到2022年间没有明显的变化。因此,在北海港湾鼠海豚的案例研究中,MOC指标与SCANS-III(Lacey等人,2022年)和SCANS-IV(Gilles等人,2025年)之间的描述之间似乎几乎没有信息损失。此外,这项研究的结果表明,在像SCANS这样的大规模调查框架下,指标的误差应该相对有限(见补充材料B部分)。因此,使用我们提出的分布变化指标来准确总结SCANS的估计分布图是合理的。

4.4 提出新指标
在生态学中,有人提倡使用结合模拟和建模的工作流程(Wolkovich等人,2024年),“虚拟生态学家”方法(Zurell等人,2010年)是测试海洋大型动物视觉调查新方法的有效工具。然而,这种方法的结果也容易受到数据模拟选择的影响。例如,在这项研究中,为了获得“现实”的分布,我们选择了影响模拟分布的不同效应的权重(见方法-数据模拟),这在一定程度上是任意的。然而,为了达到现实性,这种任意性是不可避免的,因为现实性本质上是依赖于具体情境的。因此,我们将工作流程建立在专门的大规模鲸类分布建模的背景下。

此外,这种工作流程重视简洁性和缩短计算时间,以便在合理的时间内获得结果。模型选择过程非常直接,仅依据最低AIC标准进行。实际上,模型选择要复杂得多,需要使用多个标准来进行质量检查和模型验证(Gilles等人,2016年;Becker等人,2018年),这些标准对于根据可用证据选择最佳模型至关重要。我们预计目前的结果可能略微悲观,因为一个仔细进行的建模过程通过排除不合适的模型应该能够更有效地减少估计误差。具有极端误差和非常不可能的估计分布的模拟也可以通过简单的眼力检查方法轻松排除,但本文没有采用这种方法来全面调查MOC中的误差范围。

我们考虑的候选指标的准确性直接与估计的质量及其相关不确定性有关。这又取决于多种因素,其中最重要的是用于收集鲸类目击数据的调查工作量。由于这种误差可能很大,因此每个案例研究都需要重新校准用于解释的误差阈值。像本文中使用的虚拟生态框架非常适合这种实证校准。在这里,我们假设数据是按照最新的鲸类调查标准(Hammond等人,2021年)收集的,以产生无偏的丰度估计。从这些数据通过密度表面建模生成的任何分布图都伴随着相关的预测不确定性,在计算MOCs或C50等分布指标时需要忽略这种不确定性。较小的不确定性应该会导致指标的估计误差较小,从而提高准确性。即使预测分布的不确定性较高,总结结果仍然有用;在这种情况下,重要的是要强调指标上可能的高误差,而在总结结果时不丢弃不确定性。

Montenero等人(2026年)强调,海洋生态系统指标的性能和实用性取决于它们计算的尺度,这也是我们通过指标观察到的现象。实际上,如果研究区域太大,指标的平均性质可能会掩盖研究区域内的局部变化。对于像SCANS调查这样的大规模鲸类种群研究来说,计算较小子区域的指标可能是明智的。这里以北海为例,它是港湾鼠海豚的一个评估单元/亚种群(北大西洋海洋哺乳动物委员会和挪威海洋研究所,2019年)。专注于评估单元有助于突出和解释在更广泛的区域背景下发生的变化,并且在评估区域与特定种群对齐时在生态学上更有意义。然而,在过小的研究区域使用指标可能会有问题,因为误差可能会掩盖任何估计的变化,从而削弱指标的可靠性。进一步发展该指标需要研究地理尺度的影响。

必须牢记任何分布指标的内在局限性,以避免过度解读指标值的任何变化或无变化。实际上,指标没有变化并不一定意味着底层分布没有变化,因为指标具有平均性质(见Arthur(2024年)和图4)。此外,这样的指标的目的绝不是替代分布图,而是简化并以政策相关的摘要统计形式报告结果,同时保留最重要的信息。在报告之前,进行简单的眼力测试以确保指标反映的信息与分布图上的解释一致是一个重要的步骤。

最后,我们探讨了鲸类分布变化指标的预期误差,但后续工作需要扩展我们的模拟范围。需要考虑不同的分布变化场景,而不仅仅是热点区域的转移,以获得更普遍的结果,特别注意我们旨在检测的最小变化和检测能力。

5. 结论
在这项研究中,我们基于虚拟生态学框架(Zurell等人,2010年)开发了一个R工作流程,用于:(i)模拟北海一种小型鲸类的分布;(ii)模拟研究区域内实际可能获得的调查数据;(iii)通过距离抽样方法对这些数据建模得到的分布;(iv)比较模拟和估计的分布图以理解估计误差。这四个步骤在初始时间t0和之后模拟了分布变化的时间t1进行了多次重复。测试了可用于鲸类种群分布变化指标的指标,包括三个中心度量和一个集中化度量。通过这个模拟工作流程,我们检查了观测和建模过程对候选指标指标的影响。结果表明,几何中位数和C50可以用几个数字概括分布图,这些数字可以容易地传达给政策制定者,同时对估计误差的敏感性较低。我们开发的工作流程使得这些指标的阈值校准成为可能,因此它对于政策应用来说是一个实用且有前景的概念验证。但仍需要一些工作来使其具备操作性。重要的步骤包括探索不同的分布变化场景以获得更普遍的结果,在政策论坛中测试该指标,例如OSPAR委员会已经在即将到来的2029年中期评估中接受了该指标的试点应用(OSPAR,2026年)。最后,通过开发专用软件包自动化工作流程将提高其可用性、可重复性和可访问性。

CRediT作者贡献声明
Vincent Benoit:写作 - 审稿与编辑、撰写初稿、方法论、正式分析、数据管理。
Matthieu Authier:写作 - 审稿与编辑、监督、方法论、概念化。
Anita Gilles:写作 - 审稿与编辑、监督、方法论、资金获取、概念化。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号