利用下游河流遗传标记识别技术（GSI）以及针对支流的标记-重捕研究方法，来估算大型河流系统中太平洋鲑鱼的遗传单元逃逸数量

《Canadian Journal of Fisheries and Aquatic Sciences》：Using lower river genetic stock identification (GSI) and a tributary-specific mark–recapture program to estimate genetic unit escapements of Pacific salmon within large river systems

【字体：大中小】 时间：2026年05月10日 来源：Canadian Journal of Fisheries and Aquatic Sciences 2.2

编辑推荐：

　　瑞安·W·惠特莫尔 | 大卫·G·汉金 | 埃里克·B·龙多加拿大渔业和海洋部，科学部门，太平洋地区，417 – 第二大道西，鲁珀特王子市，BC V8J 1G8，加拿大利用传统方法估计大型河流系统中太平洋鲑鱼的系统范围内的逃逸量和保护单元（CU）逃逸量存在显著的后勤

　　瑞安·W·惠特莫尔 | 大卫·G·汉金 | 埃里克·B·龙多
加拿大渔业和海洋部，科学部门，太平洋地区，417 – 第二大道西，鲁珀特王子市，BC V8J 1G8，加拿大

利用传统方法估计大型河流系统中太平洋鲑鱼的系统范围内的逃逸量和保护单元（CU）逃逸量存在显著的后勤和财务挑战。为了解决这些问题，我们开发了一种结合了下游河流遗传种群识别（GSI）与单一主要产卵支流（“参考单元”）的精确标记-重捕逃逸量估计的方法。我们提出了系统范围内逃逸量的估计方法，以及CU和CU内的较小遗传单元（GU）的逃逸量估计方法。基于德尔塔方法，我们提供了估计逃逸量误差的明确公式。我们确定并讨论了一组必须满足的假设，以确保这些估计方法的有效应用，并将我们的方法应用于2019年至2024年斯凯纳河银鲑（Oncorhynchus kisutch）逃逸量的估计。我们的方法能够评估CU数量随时间的变化趋势，以及可能主要影响CU数量变化的特定GU的数量趋势。这些信息对于有效实施加拿大的野生鲑鱼政策至关重要。

**引言**
2005年，加拿大出台了《野生太平洋鲑鱼保护政策》（“Wild Salmon Policy”：WSP）。该政策的战略之一是标准化基于科学的野生鲑鱼状况监测，其中包括开发生成可靠数量估计的方法、评估保护单元（CU）状况的标准以及确定代表生物状况的基准。Holtby和Ciruna（2007）总结了加拿大太平洋鲑鱼物种CU的识别依据，并认为这些CU描述了“真实且可能具有适应性的多样性”。在这些建立的CU内，可能存在许多在遗传上可区分的较小单位或产卵地点群组，我们称其为遗传单元（GU）。特定CU的数量下降可能特别值得关注，因为它对整个系统的总数量和遗传多样性有贡献。这种下降可能是由特定GU内的问题引起的，从而将恢复工作指向更相关的、通常是种群层面的尺度。虽然WSP正式基于CU，但单个GU可能具有独特的生态属性和/或宝贵特性，失去稀有GU可能会进一步降低遗传多样性，但也可能影响CU的生产力、恢复能力和恢复轨迹。因此，有必要确定特定CU内的数量分布，以评估其生物状况并维持其遗传多样性（目标1，DFO 2005）。WSP引入了一个状态区框架，定义了三个状态区（即绿色、琥珀色和红色）的高低基准。该框架旨在捕捉CU状况的重大变化，以帮助根据WSP的目标3进行调整渔业管理决策（DFO 2005）。然而，对于大型河流系统，尤其是不列颠哥伦比亚省北部的河流系统，缺乏评估CU生物状况的基准。

数量是最重要且最难估计的参数之一（Luikart等人，2010）。理想情况下，应通过多年追踪逃逸量估计（从主干渔业逃逸并进入产卵支流的鱼类；参见逃逸量定义）来确定CU或GU的数量趋势。在非常大的河流系统中，由于后勤和财务限制，通常无法使用传统方法（例如，所有支流的标记-重捕计划）来估计每个主要支流的逃逸量。相反，数量趋势的评估通常基于在产卵调查期间对固定河段进行的鱼类计数或类似但统计特性不明确的表观数量指标。这导致许多根据WSP识别的CU缺乏足够的数据，限制了状况评估并推迟了基准的制定。这在像斯凯纳河这样的大型偏远流域尤为明显，因为进入许多支流的费用高昂且不稳定。

在许多大型河流系统中，下游测试渔业主要是为了调节淡水太平洋鲑鱼的渔业（例如，Cox-Rogers和Jantz 1993；Chamberlin和Parken 2012）和/或管理减少淡水回流的海洋渔业而存在的。如果这些测试渔业在整个洄游期间（即成鱼向上游迁移期间）运营，并采用统一的采样计划和标准化的努力水平，那么可以合理假设测试渔业从给定物种的整个产卵洄游中收集了大致相等的概率样本（参见附件A）。在这种情况下，可以使用现代遗传方法（例如，鉴定许多单核苷酸多态性（SNPs）（Narum等人，2008）对样本鱼类进行基因分型）。然后，可以利用遗传种群识别（GSI）方法（例如，rubias（Moran和Anderson 2019）来生成CU或GU在整个产卵洄游中所占比例的近似无偏估计。如果在一个支持大量总逃逸量的大型支流中准确估计了特定物种的逃逸量，并且下游测试渔业能够估计该支流中的鱼类比例，那么（在满足一些假设的情况下）就可以估计系统范围内的（总）逃逸量。这是通过将大型支流的估计逃逸量除以其在下游测试渔业中的遗传样本中所代表的比例来实现的。然后，可以通过将估计的系统范围逃逸量乘以下游测试渔业中CU或GU特定的遗传比例来估计特定CU或GU的逃逸量。

Hamazaki和DeCovich（2014）首次提出了类似的估计方法，但他们将其描述为“反向标记-重捕”实验，并提供了方差估计的“参数自举”方法的概述。随后对Hamazaki和DeCovich（2014）方法的应用（例如，Courtney等人，2022；TTC 2022）生成了系统范围逃逸量的点估计，但这些应用没有包括相关估计误差的计算，可能是因为认为参数自举方法难以实施或结构不确定。Winther等人（2024）使用类似的方法估计了斯凯纳河帝王鲑的系统范围逃逸量，但由于无法在整个研究河流系统中获得捕获量的估计误差，因此无法估计单个CU的逃逸量。然而，Winther等人（2024）确实使用德尔塔方法估计了系统范围逃逸量的方差，正如我们在这里提倡的那样。

在这里，我们在以前的工作基础上提出了系统范围逃逸量以及CU和GU逃逸量的不同估计动机，并提供了方差估计的简单分析表达式。我们将我们的方法应用于2019年至2024年斯凯纳河（不列颠哥伦比亚省）银鲑（Oncorhynchus kisutch）产卵逃逸量的估计。我们开发和应用的方法假设没有主干淡水渔业，但我们也表明这些方法可以扩展到Hamazaki和DeCovich（2014）所讨论的更一般情况，即主干捕获量较大且CU和/或GU特定捕获量可用。

**方法**
**逃逸量的定义**
在本文中，我们使用“逃逸量”一词来指从主干淡水渔业逃逸并进入特定CU或GU内产卵支流地理边界的鱼类数量。这种用法可以与产卵逃逸量区分开来，产卵逃逸量是指在特定CU或GU内参与产卵的鱼类数量。CU或GU内的产卵逃逸量可能会因产卵前的死亡率和/或CU或GU地理边界内的非主干捕捞而减少。在斯凯纳河流系统中，银鲑的产卵逃逸量基本上等同于我们对逃逸量的定义（不包括产卵前的死亡率），但Bulkley河有一个较小的内部渔业（见下文）。

**基本数据收集要求**
应用我们下面提出的方法需要三个基本的信息来源：
(a) 一个严格的下游采样计划，在成熟成鱼向上游迁徙期间使用固定的调查协议；
(b) 一个“遗传基线”，列出河流系统中所有明显可区分的CU或GU的详尽清单；
(c) 一个主要产卵支流上的已知或准确估计的逃逸量，通常称为参考单元i。下游采样计划从感兴趣的物种的产卵洄游中生成一个（等概率的）“随机样本”（参见附件A）。对这些样本中的个体进行基因分型，并结合GSI来确定来自不同CU或GU的整个产卵洄游的百分比。标记-重捕计划可以用来估计参考单元i的逃逸量。

**估计方法**
设k表示大型河流系统中的可区分CU（或GU）的数量，用j索引这些单元，j = 1, 2,..., k。设i表示一个特定的单元，即“参考单元”，该单元的标记-重捕（或其他）逃逸量估计是可用的。设pi表示单元i在产卵洄游中的比例（以及系统范围逃逸量，见下文假设）；设Ei表示CU（或GU）i的逃逸量；设p?i和E?i分别表示pi和Ei的估计值。在满足一些重要假设的情况下（见下文），可以形成系统范围（总）逃逸量E的估计值：
E?=E?iP?i

对于没有逃逸量估计计划的k ? 1个CU（或GU）的产卵逃逸量，可以形成估计值：
Ej?=Pj?E?=Pj?Ei?Pj?,j≠i

方程1和2涉及估计值的比率及其乘积，即使所有组成估计值都是无偏的，它们也可能不是无偏的。然而，如果组成估计值的偏差相对于各自的期望值较小，那么方程1和2的偏差也应该相对于各自的估计值期望值较小。

为了估计方程1和2的抽样方差，我们依赖于德尔塔方法（参见Hankin等人2019年的A.8节），该方法基于一阶泰勒级数近似（Wolter 2007），是处理两个或多个估计量误差传播的有效方法（Deming 1943）。对于方程1，估计值E?i和p?i是统计独立的，COV(E?i,p?i)=0，因此德尔塔方法估计抽样方差的一般形式只有两项：
V?(E?)=(?E??E?i)2V?(E?i)+(?E??p?i)2V?(p?i)

将总逃逸量估计值E?关于E?i和p?i的相关偏导数的解代入，得到：
V?(E?)=1p?i2V?(E?i)+E?i2p?i4V?(p?i)

对于E?j的方差估计，形式更为复杂，原因有两个：
(a) 单元特定逃逸量的估计值E?j，j ≠ i，是三个估计量的函数而不仅仅是两个；
(b) 估计的单元比例p?i和p?j彼此之间不是统计独立的。方程2的德尔塔方法抽样方差估计的一般形式为：
V?(E?j)=(?E?j?E?i)2V?(E?i)+(?E?j?p?i)2V?(p?i)+(?E?j?p?j)2V?(p?j)+2(?E?j?E?i)(?E?j?p?i)(?E?j?p?i)COV?(E?i,p?i)+2(?E?j?E?i)(?E?j?p?j)COV?(E?i,p?j)+2(?E?j?E?i)(?E?j?p?j)COV?(p?i,p?j)

参考单元i的（标记-重捕）逃逸量估计误差与产卵洄游中单元比例的估计误差无关，因此COV?(E?i,p?i)=COV?(E?i,p?j)=0。因此，方程5中的第四项和第五项可以省略。将单位特定逃逸量的估计量E?j相对于E?i,p?i和p?j的相关偏导数的解代入后，得到：
V?(E?j) = p?j^2p?i^2V?(E?i) + p?j^2E?i^2p?i^4V?(p?i) + E?i^2p?i^2V?(p?j) ? 2p?jE?i^2p?i^3COV?(p?i,p?j)

需要注意的是，由于估计的成对协方差COV?(p?i,p?j)（j ≠ i）几乎总是负值，方程6中的最终（协方差）项通常会对单位特定逃逸量的估计方差产生正贡献。

### 假设
上述估计量的有效性和适用性在很大程度上取决于以下隐含或明确的假设是否得到满足：
- 下游河流采样计划在产卵期间必须从整个产卵过程中随机选取个体，且每个个体的被选中的概率相等（参见附录A）；
- 用于从下游河流采样计划中估计单位特定比例的遗传基线和GSI方法必须能够生成大致无偏的比例及其标准误差的估计；
- 参考单元i中的标记-重捕计划（或其他方案）必须能够生成该单元的逃逸量估计值及其相关方差估计值；
- 产卵期间没有从主干河流中捕捞淡水鱼，或者所有GU或CU的主干河流捕捞率相同，以确保在主干河流渔业之前（即pi被估计时）以及主干河流渔业之后的系统范围内，单元比例保持一致；
- 来自GU或CU的产卵鱼会忠实地返回它们起源的具体河流或更大的流域（即没有显著的跨遗传群组的偏离）；
- 主干河流在产卵前的死亡率不存在，或者主干河流在产卵前的死亡率在不同遗传组之间没有显著差异。

请注意，非主干河流的捕捞可能发生在参考单元或其他CU的地理边界内的支流中。在所有这些情况下，估计的逃逸量将等于产卵逃逸量加上非主干河流的捕捞量（假设没有产卵前的死亡率）。

这些假设是否在实践中得到满足或将接近满足，将取决于具体情境。在附录B中，我们展示了我们的方法可以扩展到存在重大主干河流渔业的更一般情况，只要有关CU或GU特定捕捞量的估计数据是可用的。

#### 示范应用：斯基纳河银鲑
我们首先使用我们的方法来估计由Holtby和Ciruna（2007年）建立的斯基纳河银鲑CU的逃逸量（见图1，使用方程1-8）。然后我们展示了可以使用相同的方程1-6来估计这些CU内部遗传上可区分的更小GU的逃逸量（见图2）。

### 下游河流采样以获取遗传比例数据
银鲑在进入斯基纳河潮汐带时在Tyee试验渔场被捕获（见图1），这是DFO自1955年以来在斯基纳河口运营的一个标准化渔场。Tyee试验渔场的主要目的是提供季节性的红鲑丰度估计，但该渔场也提供了进入斯基纳河的所有鲑鱼物种相对丰度的指标（Cox-Rogers和Jantz 1993）。自2019年以来，Tyee试验渔场的运营时间为6月21日至9月26日，2024年除外，那年结束时间为9月23日。在试验渔场运行的最初几周以及最后几天，银鲑的捕获量通常为零。因此，我们推测试验渔场在整个银鲑繁殖期间都在运行。

每年，试验捕捞由一艘刺网渔船进行。根据低潮和高潮时期的不同，每天设置两到三次渔网。渔网由绿色六股单丝尼龙制成，长度为366米，深度为7.6米（Cox-Rogers和Spilsted 2002）。渔网包含10个等长的面板，网眼大小从8.9厘米到2.3厘米不等，以1.3厘米的增量递增，并以2:1的比例悬挂。每次设置后，渔网允许顺流漂浮1小时。由于河道动态和水流的影响，低潮和高潮时的设置位置略有不同。根据潮汐情况，渔船下方的深度范围从4.5米到9.1米不等。按物种和总捕捞时间记录捕获量。由于本文提出的方法的有效应用要求Tyee试验渔场的捕捞努力是固定的，我们在每天设置三次渔网的日子里随机移除了一次渔网设置，从而将每天捕捞努力标准化为两次（见附录A）。

在Tyee试验渔场捕获的银鲑的组织样本是根据DFO的分子遗传学实验室（MGL）指南收集的，其中通过孔冲法从脂肪鳍中提取组织，然后放置在Whatman纸上。组织样本根据在试验渔场的采集日期和设置进行了标记。所有遗传组织都在DFO的MGL进行了处理。

### 参考单元（布克利河）的逃逸量估计
使用双事件标记-重捕程序估计了布克利河Witset峡谷上游的逃逸量（见图1）。第一个事件从7月初开始，在Witset峡谷下游进行，使用海滩围网进行采样。鱼被围网带到浅水区，测量长度和性别，分类后要么被捕捞、标记、识别为重捕个体后释放，要么无标记释放。从早晨到下午中间定期进行围网捕捞，期间会休息以便处理鱼和减少同天的重捕情况。自2019年以来，每天的设置次数有所变化，从2023年的最低平均设置次数（4.2次）到2019年的最高次数（14.5次）不等。每次设置的时间长度也根据船员人数、捕获量和条件而有所不同。第二个事件也在7月初开始，位于第一个事件上游约350米处。在这里，渔民使用长柄抄网在Witset峡谷上游捕获鱼。鱼被放入鱼笼中，然后被捕捞、测量和标记，记录为重捕个体后释放，或者无标记释放。无标记释放的通常是小鱼或状况较差的鱼。这种采样全天由多名抄网渔民和单独的 fish processing 人员连续进行。全天和整个季节的抄网捕捞努力取决于多种因素，包括捕捞成功率、辅助人员的数量、其他鱼类（例如粉鲑）的捕捞量以及现场条件（例如河流流量）。经过广泛的程序审查，发现分层-Petersen估计器（SPAS；Schwarz 2024）是最适合估计Witset峡谷上游布克利河银鲑逃逸量的模型（Peck，个人交流，未发表的数据，2025）。

### 遗传基线的建立
对于遗传分析，使用了Beacham等人（2017年）提出的整体方法论来应用GSI。简而言之，已经使用了一个包含480个SNP扩增子的面板（Beacham等人2020）对整个范围内的银鲑参考基线样本进行了基因分型，并将其更新为v.5.0.1版本。对每个个体应用了最低75%的基因分型成功率、0.15到0.50之间的杂合度以及≤0.45的污染评分过滤器（https://github.com/gjmckinney/GTscore）。不符合一个或多个这些过滤器的个体被丢弃，每个采集点至少需要20条鱼或更多的样本量，这与之前使用银鲑基础线的做法一致（Beacham等人2020）。对于斯基纳河系统的应用，范围基线进一步缩小，仅包括斯基纳河流域内的采集点以及斯基纳河口CU，以排除流域内最可能的偏离来源。我们的斯基纳河系统基线包括来自Holtby和Ciruna（2007年）建立的河口、下游、中游和上游斯基纳河CU的3,932条成年银鲑（表1）。

#### 报告单元设计
我们使用了两种替代方法进行报告单元设计。这两种方法都基于CU结构，而CU结构部分基于之前基于微卫星的人群结构分析的证据（Beacham等人2011）。在第一种方法中，报告单元从现有的CU结构开始，并被分类为“CU级别”。这种方法的扩展“CU-布克利级别”是将中游斯基纳CU的采集点分为来自布克利河及其支流的采集点（称为“布克利”报告单元）和来自中游斯基纳CU其他位置的采集点（称为“中游斯基纳”报告单元）。

在第二种方法中，使用rubias（Moran和Anderson 2019）实现的Leave-One-Out（LOO）分析对单个采集点进行了测试。然后将收集点合并成更大的报告单元结构，直到至少80%的个体以50%或更高的概率成功自我分配，并且所有测试个体的整体自我分配达到了80%的最低阈值。这些被认为是“GU级别”的报告单元，代表了可用数据能够合理支持的 finest-scale 遗传分组。在“CU-布克利级别”中被分类为布克利的相同采集点被合并到一个“布克利”报告单元中，最终生成了“GU-布克利级别”（注意，在布克利报告单元内也有更小的可区分GU）。

### GSI分析
从Tyee试验渔场收集的个体样本使用Qiagen BioSprint96珠子基提取方法在ThermoFisher KingFisher Flex上进行提取。我们使用ThermoFisher S5 Prime测序系统对个体进行基因分型，使用480个SNP AgriSeq扩增子面板。读长与基因组对齐（Rondeau等人2023），并使用TorrentSuite v.5.14.1 Variant Caller软件和插件调用变异体。由变异体调用器定义的基因型被重新格式化为rubias格式，并过滤出至少50%的基因分型成功率以保留个体。我们筛选剩余个体，排除重复样本（rubias的“close_matching_samples”设置min_frac_non_miss = 0.85, min_frac_matching = 0.94）和潜在的非银鲑（使用两个专门用于物种识别的扩增子，Beacham和Wallace 2020）。经过所有过滤后保留的个体被用于进一步分析。

我们使用rubias软件（Moran和Anderson 2019）估计CU和GU特定比例。使用Colony（Jones和Wang 2010）根据亲缘关系将少量个体分配到孵化场育种群体；这些个体被分配到rubias输入格式中相应的已知CU或GU。我们使用infer_mixture函数（reps = 25,000, burn_in = 5000, method = “MCMC”）估计CU或GU的比例。结果按报告单元总结，CU级别的信息部分用于估计用于估计比例协方差的bootstrap程序。

尽管rubias提供了比例估计值，且可以从MCMC轨迹中确定标准差或可信区间，但它没有提供估计成对比例（p?i,p?j）的指导，而这是应用方程6和方程8所必需的。我们开发了一种通过从Tyee试验渔场收集的遗传数据构建一个伪种群，然后使用rubias方法生成所有比例的重复估计值的程序来估计这些协方差。该程序的操作步骤如下：(1) 生成一个伪种群（参见Sitter 1992；Mashreghi等人2016），其规模大约等于给定年份的估计总逃逸量E?，通过将从Tyee试验渔业收集的遗传数据n行重复到最接近E?/n的整数来实现；(2) 从构建的伪种群中随机选择n行，使用rubias方法估计这些样本的比例，然后存储这些估计的比例；(3) 重复步骤(2)很多次（10,000次似乎是足够的），并形成一个由10,000行估计的CU或GU比例组成的矩阵；(4) 为这个10,000 × k矩阵的估计单位比例形成方差-协方差矩阵，并找到p?i和p?j之间的成对协方差，作为方差-协方差矩阵的非对角元素。

对于Middle Skeena CUAs的总逃逸量估计，如前所述，CU级别的分析需要首先将Middle Skeena CU（Mid-S）分为Bulkley和MSKNA（Middle Skeena不包括Bulkley）两个组，因为Bulkley河被用作参考单位。Middle Skeena CU的总逃逸量估计可以通过以下公式获得：(7) E?Mid?S = E?MSKNA + E?i = p?MSKNAE?i + p?i，其中p?MSKNA和p?i分别是来自Middle Skeena CU（不包括Bulkley河）和Bulkley河参考单位的Coho Salmon的估计比例；E?i是Bulkley河参考单位的标记-重捕估计逃逸量。使用delta方法，可以计算这两个估计逃逸量总和的方差估计值：(8) V?(E?Mid?S) = ((p?MSKNA + p?i)2 + E?i) / (2p?i) * [(p?MSKNA + p?i) * (p?MSKNA + p?i) - 2p?MSKNA * p?i] / (3E?i2) * COV(p?MSKNA, p?i)。

关于基线性能的参考，CU级别的准确性已经得到了之前的评估（Beacham等人2020年），并且性能指标继续保持合理。在我们的分析中，能够可靠地区分来自Witset标记-重捕计划上游Bulkley河的个体和Middle Skeena CU其余部分的个体是至关重要的。图3显示，根据LOO测试确定的个体分配，在分配源自Bulkley河的Coho Salmon时，准确率预计将接近90%，远高于通常在基线或面板评估中描述的80%的阈值（例如，Hess等人2014年；Beacham等人2020年；Euclide等人2022年；Beemelmanns等人2025年）。在这种情况下，所有CU都超过了我们的最低基准，尽管Lower Skeena和Skeena Estuary CU的性能特别强，预期准确率远高于95%。

关于GU级别的准确性，基线的分配概率通常较低，这是由于单位规模更细导致的。在尝试了多种参数和可能的GUs划分方式后，仍有13个报告单位的分配符合我们的目标参数（表1）。总体而言，预期这些所识别的报告单位在分配上的表现会很好，大多数在LOO测试中的自我分配估计概率超过90%（图4）。唯一的例外是LLSKNA GU，其LOO分配个体概率仅为79%。在尝试将所有LOO分配概率提高到80%以上时，我们发现这需要将三个LLSKNA集合与 Terrace_SKNA中的八个集合合并。我们认为，由于合并LLSKNA和Terrace_SKNA GU而导致的特异性损失并不是一个理想的结果，因为它不会大幅改变CU级别的信息，因此尽管LLSKNA的分配概率略低于我们的最低阈值80%，我们仍然将这两个GU保持分开。根据可用的工具和收集的数据，图4中显示的GUs代表了在当前信息条件下，对Skeena河流系统内的Coho Salmon应用GSI的最细致尺度。

我们发现，我们的自举程序产生的估计标准误差（方差-协方差矩阵主对角线的平方根）与通过将rubias?infer_mixture程序应用于原始Tyee试验渔业样本大小计算出的“后验标准差”非常相似，这支持了使用这种方法来估计估计比例的协方差（表2）。自举估计的标准误差与rubias后验标准差之间的唯一显著差异出现在估计比例<0.0001的情况下。我们认为，由rubias生成的这种大小的估计比例是没有意义的，应视为零。例如，在2024年，Tyee试验渔业的样本量为353条。假设GU或CU的身份是已知的，那么最小的可能估计单位比例为1/353 = 0.00283。

基于自举程序的估计比例的抽样方差V?(p?i)仅比在已知GU身份的多项式模型下的估计比例抽样方差V(p?i)mult略大（表3）。方差膨胀因子（V?(p?i)/V(p?i)mult）的范围从1.01到1.47，对于已知GU身份的最小可能值（1/353 = 0.00283）平均为1.23（表3）。

在2024年，基于自举程序的估计CU比例（p?i）的估计抽样方差V?(p?i)仅比在已知GU身份的多项式模型下的抽样方差V(p?i)mult略大。在忽略估计比例小于1/n的情况下，估计比例的协方差平均略大于在已知GU身份的多项式模型下的预期值。例如，在2024年，协方差膨胀因子的范围从0.81到1.51，平均约为1.18（表4）。

对于Bulkley河上游Witset Canyon的逃逸量估计，基于SPAS的估计值范围从13,808（2020年）到70,459（2023年），变异系数（CVs）范围从13%到24%（表5）。除了2023年（s = 7）外，所有年份的分类支持层数量都仅为一个，但可恢复层数量范围从4到8（表5）。

在四个CU中，来自Bulkley河系统的鱼的估计比例范围大约从0.1474到0.2949，标准误差（SEs）范围从0.018到0.038（表5）。这些估计的Bulkley河系统比例受rubias中应用的报告组别（即CU与GU）的影响很小。在其中四个CU中，Middle Skeena CU的比例通常最高（0.33–0.62），其次是Lower Skeena CU（0.20–0.54）、Upper Skeena CU（0.13–0.19）和Skeena Estuary CU（7.8 × 10??–3.5 × 10??）。例外情况出现在2024年，当时Lower Skeena CU的比例（0.54）高于Middle Skeena CU的比例（0.33）。根据这些数据，估计的整个系统的逃逸量范围从47,123（2020年）到238,953（2023年），变异系数（CVs）范围从15%到28%（图5和表6）。在CU特定的逃逸量中，Middle Skeena CU通常最大（范围从31,103到135,971，CVs范围从16%到28%），其次是Lower Skeena CU（3,864–99,923；CVs: 17%–34%），然后是Upper Skeena CU（5,508–33,193；CVs: 19%–37%）（图5和表6）。由于Tyee试验渔业位于河口上游，无法可靠地估计Skeena Estuary CU的逃逸量。

在本文中，我们提出了一种用于估计大型河流系统中Pacific Salmon CU或GU逃逸量的方法，并将其应用于Skeena River的Coho Salmon。这些方法的主要优势在于能够估计那些传统方法在物流上不可行或成本过高而无法应用的单位的逃逸量，并能够计算与估计逃逸量相关的统计上严谨的误差估计。我们的方法在概念上类似于Hamazaki和DeCovich（2014年）提出的方法，但我们的特定应用是在主干淡水渔业不存在（或所有CU或GU的淡水收获率相同）的特殊情况下。与Hamazaki和DeCovich（2014年）提出的方法不同，我们没有将我们的估计方法描述为“反向标记-重捕估计器”，并且我们没有使用“参数自举”来估计方差，而是提供了用于估计估计逃逸量方差的显式delta方法表达式。在附录B中，我们展示了delta方法也可以用于Hamazaki和DeCovich（2014年）考虑的更一般情况下的估计逃逸量方差的估计器，其中主干淡水渔业规模较大且不能忽略。我们相信，使用delta方法推导出的简单分析表达式比Hamazaki和DeCovich（2014年）使用的自举方法更容易用于方差估计。delta方法方法的另一个重要优势是，可以很容易地确定不同误差来源对总体估计方差的相对贡献，因为在delta方法方差估计器中每个误差来源都已被明确识别。

我们提出的方法首次产生了Skeena River Coho Salmon的系统范围、CU和GU级别的统计上可辩护的逃逸量时间序列估计，并为根据WSP制定生物基准提供了前提。在引入WSP（DFO 2005）之后，English等人（2006年）尝试估计Skeena River Coho Salmon的CU级别数量。他们的数量估计使用了当时可用的最佳数据，主要是来自产卵调查的低质量数据（视觉计数）。作者承认这些类型的数据应谨慎使用，并评论说“现有的估计仅略好于没有数据”（English等人2018年）。然而，考虑到我们论文中呈现的估计逃逸量时间序列相对较短，我们认识到，如果有数据可用，未来的工作应侧重于将我们的估计与之前的工作（如English等人2018年）进行回顾性分析。如果没有长期应用我们论文中介绍的估计方法，就无法建立可辩护的生物基准（例如，Holt等人2009年；Holt和Bradford 2011年），也无法根据WSP的要求按CU评估状态（战略1 – 行动1.2，DFO 2005）。此外，这些方法还可以识别出可能导致特定野生鱼群（CU）数量下降的关键野生群（GU），从而为针对这些特别需要关注的GU的保护工作提供方向。因此，应用我们的方法将提高以往依赖于低质量指标（例如，视觉计数）的CU状态评估的可辩护性，并能够在不同地区更一致地应用WSP状态标准。最后，改进CU和GU水平的逃逸量估计将有助于指导WSP综合规划过程中概述的捕捞管理计划的制定（策略4，DFO 2005）。因此，这项工作通过提供状态信息来连接WSP的策略1和4，以支持透明的恢复规划。

本文提出的估计方法依赖于一些强有力的假设，这些假设必须得到满足才能有效应用我们的方法。也许最关键的假设，但却经常被忽视的是，来自产卵期的下游河流鱼类样本是一个等概率（“随机”）样本。下游河流的测试渔业采样计划本质上是一个分层随机样本：在测试渔业的特定周内，样本只能从该周经过的鱼类“层”中选取。由于来自不同CU或GU的鱼类通常在产卵时间上有很大差异，因此来自不同周的样本将从不同CU或GU中得到不同的比例贡献。这种内在的分层采样设计只有在比例分配的分层采样设计的特殊情况下才能等同于一个总体等概率样本。在比例分配的情况下，所有时间层的采样比例（收集的样本/通过的鱼类数量）是相同的。因此，至关重要的是测试渔业必须按照固定的严格时间表进行。由于Tyee测试渔业计划每天有两到三次采样，如果我们不首先将测试渔业数据标准化为每天两次采样，就无法有效使用这些数据来估计CU或GU的比例。像rubias这样的程序的有意义应用基于一个隐含的假设，即样本数据是从总体（在这种情况下，是从产卵期）中随机选取的。显然，对于测试渔业来说情况并非如此，但在附录A中我们展示了将比例分配的分层随机样本视为简单随机样本几乎总是会导致估计比例的采样误差被保守估计。

我们方法有效应用的第二个关键假设是主河道没有捕捞，或者相对于整个系统的逃逸量而言，主河道的捕捞可以忽略不计。我们认为对于Skeena河的Coho鲑鱼来说，这个假设大致是成立的。从2019年到2024年，估计的主河道捕捞率（估计的主河道捕获量/（估计的总系统逃逸量））大约在0.5%到5.2%之间，平均约为2.4%（表8）。附录C中的假设计算表明，如果忽略这些捕捞，它们对CU或GU逃逸量的估计影响非常小（正如我们所做的那样）。当然，我们认识到这个假设可能在许多大型河流系统的许多太平洋鲑鱼物种中并不成立。因此，附录B将我们的方法推广到了主河道捕获量较大并且可以归因于特定CU或GU的情况。

第三个假设极其难以验证，即没有鱼类在CU或GU之间漂移，或者任何这样的漂移都是微不足道的。WSP将CU定义为“一个与其他群体足够隔离的野生鲑鱼群体，如果被消灭，其在可接受的时间范围内自然重新殖民的可能性非常小”（DFO 2005）。由此推断，即使在CU内部，由于鱼类在CU内的支流间漂移，被消灭的种群最终也会自然重新殖民。因此，即使使用这里的每种方法，由于报告单元略低于CU的划分，例如，预计漂移确实存在，并且在干扰后的重新殖民中起着重要作用。然而，漂移的遗传影响高度依赖于许多因素，包括种群的漂移率和受体种群的相对大小（Keefer和Caudill 2014）。在对不列颠哥伦比亚省Chinook鲑鱼的证据进行全面回顾时，作者观察到，来自大型供体种群的相对较小的漂移率可能会随着时间的推移对小型受体系统的遗传组成产生重大影响（Weil等人，2025）。在本研究中进行的遗传测试中，我们看到了一些可能表明系统内部存在漂移（自然或人为引起的）的迹象。例如，Terrace_SKNA GU由八个定义的收集点组成，LLSKNA还有另外三个，这表明在这些CU（或GU）内部的每个群体中，漂移发生得足够频繁，以维持我们现有基线收集点内的遗传同质性。总体而言，这些大的群体划分大约符合基于loo测试的可接受估计准确性的阈值，表明持续存在交换。然而，在我们的估计器框架下，漂移被定义为未能返回到CU或GU的地理边界。因此，Terrace_SKNA GU内的漂移并不会违反假设。违反这一假设的一个例子是，如果一条来自Bulkley河的鱼没有返回到Bulkley河。在Skeena河流系统中，能够在四个已建立的Coho鲑鱼CU内形成13个定义明确的GU，表明这些GU之间的漂移必须受到严格限制。如果不是这样，我们就无法创建这些GU。因此，我们得出结论，Skeena River GU或CU之间的漂移必须是可以忽略的。

我们提出的估计方法的统计性能（通过标准误差或CV来衡量）主要取决于两个因素：(a) 参考单元（支流）中的逃逸量大小相对于整个系统的逃逸量；(b) 参考单元特定逃逸量估计的方差。当参考单元特定逃逸量的相对大小较大（例如，占整个系统逃逸量的30%或更多，即p?i“较大”）以及估计的参考单元特定逃逸量的CV较小（例如，小于15%–20%，即V?(E?i)/E?i“较小”）时，将获得最佳结果（即最小标准误差和CV）。

通过增加测试渔业中的样本量（例如，从每年约400条增加到每年800条），可以适度减少整个系统逃逸量和CU或GU逃逸量的估计误差，这可以通过减少对流或整个系统逃逸量中CU或GU比例的估计误差来实现。当然，更大的测试渔业样本量也使得遇到来自相对稀有GU的鱼类的可能性更大。

如果在两个或多个大型支流中进行严格的逃逸量估计程序，那么很容易扩展本文提出的方法。设E?C=∑i=1mE?i表示m个不同参考单元中m个独立逃逸量估计的总和，让p?C表示基于测试渔业数据的这些组合m个参考单元中鱼类的比例估计。那么，整个系统逃逸量的估计器将是E?=E?C/p?C。与本文中开发的基于单个参考单元的估计器相比，这个估计器的采样方差可能会减小。

在480个扩增子面板中使用的标记在分配时并不能提供100%的准确性。虽然这可能表明通过收集点和报告单位之间的漂移继续存在适度的遗传交换，但应该注意的是，现有SNP检测设计的最初开发目的是用于沿海地区的应用。并非所有标记在Skeena河流域的变化都像在沿海其他地方那样大，有些标记对于划定Skeena河流域内的GU的信息提供有限。未来，一个有针对性的遗传面板，其中标记是根据它们在Skeena河流域内划分种群结构的性能专门选择的，可能会提供更准确或更详细的结果，以支持使用我们提出的方法估计单元特定的逃逸量。

通过开发更广泛的SNP（或其他遗传属性）来显著减少逃逸量估计的误差将是困难的，因为这样可以减少将个体分配到CU或GU组的不确定性。使用rubias方法估计的CU或GU比例的方差仅约为在多项式模型下预期的1.2–1.3倍，该模型假设CU或GU的身份是已知的。我们认为这是一个了不起的成就。我们获得了rubias的样本编码，以便直接计算p?i,p?j的协方差（E. Anderson，个人通信，2025）。使用此代码在rubias中估计的协方差基本上与我们使用数值密集型自举方法生成的协方差相当。我们建议未来的rubias迭代将估计比例的协方差作为可选输出。我们的自举程序还验证了rubias报告的贝叶斯“标准差”与从原始遗传样本数据创建的伪种群中重复独立选择样本得到的“频率论”标准误差是一致的。但我们强调，对于小于1/n的比例估计值，我们应该给予很少的信任，其中n是测试渔业的样本量。使用我们提出的方法无法可靠地估计非常小的GU的丰度。相反，需要使用特定地点的标记-重捕或其他方法来估计非常小的GU的逃逸量。在这方面，我们重申了为什么在本文中没有报告Skeena河口CU的估计逃逸量。我们不期望在Tyee测试渔业采样地点看到河口产卵的鱼类。确认这一预期，来自Skeena河口CU的鱼类比例估计值在0.000073到0.000358之间，平均值为0.000238，比在假设Tyee测试渔业样本量为400的情况下的最低“可检测”比例低一个数量级（1/400 = 0.0025）。需要采用其他方法来估计Skeena河口CU的逃逸量。

我们注意到，本文提出的用于估计CU或GU级别逃逸量的方法可以直接应用于其他主要河流系统中的太平洋鲑鱼物种，这些物种的主河道捕捞量不存在或相对于总逃逸量来说非常小。附录B显示，类似的估计器也可以应用于有显著主河道捕捞的河流系统。应用附录B中提出的方法，类似于Hamazaki和DeCovich（2014）提出的方法，不仅需要通过严格的随机调查设计来估计所有主河道位置的鱼类总数（在大多数情况下），还需要从所有捕获样本中收集遗传数据，以便估计每个位置的CU或GU特定比例，这也需要使用严格的随机调查设计。这些主河道捕获样本要求可能会限制Hamazaki和DeCovich（2014）以及附录B中的估计器在非常大河流系统中的高价值鲑鱼物种（例如，育空河Chinook鲑鱼）中的应用。

最后，至少对于Coho鲑鱼来说，由于指定的CU内可能包含许多GU，我们强调在CU级别评估丰度趋势可能会掩盖组成GU的丰度的重要趋势。例如，特定GU可能显示出明显的严重下降迹象，而在CU级别上可能还看不到这样的下降信号。这对于局部规模的评估尤其重要，例如可能只影响CU内一个或两个GU的First Nations渔业，这进一步强调了在GU和CU级别进行评估的重要性。WSP CU框架在生物分辨率和管理可行性之间取得了合理的平衡，但我们认为评估 GU（可能是特定领域的缩写）层面的趋势也同样重要。

**数据可用性**
本文所使用的数据和代码可在Dryad数字存储库中获取，网址为：https://doi.org/10.5061/dryad.pzgmsbd2w

**作者贡献**
- 构思：RWW、DGH
- 数据整理：RWW、DGH、EBR
- 形式分析：DGH、EBR
- 资金筹集：RWW
- 研究实施：RWW、DGH、EBR
- 方法论设计：DGH、EBR
- 项目管理工作：RWW
- 资源协调：EBR
- 软件开发：DGH、EBR
- 监督指导：RWW
- 验证工作：DGH、EBR
- 可视化制作：RWW、DGH、EBR
- 原稿撰写：RWW、DGH、EBR

热点排行