在青藏高原上，利用低干扰无人机与人工智能技术对濒危的普氏瞪羚进行监测

《Ecological Informatics》：Low-disturbance UAV-AI monitoring of the endangered Przewalski's gazelle on the Qinghai-Tibetan plateau

【字体：大中小】 时间：2026年05月11日 来源：Ecological Informatics 7.3

编辑推荐：

　　盛利汉|肖军尧|法扎尔·乌拉|张娟|窦浩民|约瑟夫·阿切安庞·奥武苏中国西北师范大学地理与环境科学学院，兰州730070 **摘要** 对濒危物种的监测经常面临行为干扰和数据可获得性有限的两个限制。本研究聚焦于普氏瞪羚（Procapra przewalskii），

　　盛利汉|肖军尧|法扎尔·乌拉|张娟|窦浩民|约瑟夫·阿切安庞·奥武苏
中国西北师范大学地理与环境科学学院，兰州730070

**摘要**
对濒危物种的监测经常面临行为干扰和数据可获得性有限的两个限制。本研究聚焦于普氏瞪羚（Procapra przewalskii），这是一种青藏高原特有的濒危有蹄类动物。在本文中，我们提出了一种综合性的、非侵入性的监测框架，该框架结合了垂直起降（VTOL）无人机（UAV）和深度学习技术，以支持该物种的保护工作。在研究区域内进行的干扰-响应实验表明，随着无人机操作的降低和声学效果的增强，动物的行为反应呈现出明显的、分级增加的趋势，这支持了在保守和低影响飞行模式下水上调查的可行性。我们建立了无人机影像数据集，并评估了多种目标检测模型在不同训练数据分割下的性能。结果表明，在样本量较小的情况下（20%的训练数据），You Only Look Once版本11（YOLOv11）在准确性和效率之间取得了最佳平衡，平均精度（mAP）达到了0.872，并保持了强大的运行性能；而Real-Time Detection Transformer（RT-DETR）虽然达到了略高的峰值准确率，但计算成本显著增加。基于无人机的计数结果与地面调查结果高度一致（平均相对一致性为94.52%），这突显了无人机监测在异质景观中的可靠性。空间统计分析显示存在显著的正空间自相关性（Moran’s I = 0.238，p < 0.001），高密度种群聚集在研究区域湖泊岸边的草地上（>81只/平方公里）。围栏和交通基础设施加剧了栖息地的破碎化，限制了动物的移动路径。总体而言，无人机-深度学习框架为高山生态系统的种群评估、栖息地管理和保护规划提供了可行的证据。

**1. 引言**
生物多样性的丧失破坏了对全球生态安全至关重要的生态系统功能。濒危关键物种和标志性物种的生存能力与其相应生态系统的稳定性密切相关，进而影响到人类-自然系统的可持续性（Ceballos等人，2020；Pimm等人，2014）。近几十年来，城市化的加速、栖息地的破碎化以及气候变化对全球野生动物种群构成了重大威胁（Daskalova等人，2020；Doherty等人，2016）。因此，保护科学越来越依赖于能够在管理相关尺度上提供可靠种群和分布数据的监测方法，同时尽量减少对动物和栖息地的干扰（Goodenough和Perks，2025）。

普氏瞪羚（Procapra przewalskii）是青藏高原特有的濒危有蹄类动物，被广泛认为是高山草原保护工作的标志性物种（Cai等人，2022；Jiang等人，2002；Jiang等人，2016）。尽管在持续的的保护努力下，其种群数量从20世纪90年代的不足300只增加到了2021年的约4000只（Liu等人，2023），但它仍被评估为濒危物种，并继续面临遗传多样性低、亚种群隔离严重以及栖息地连通性有限的风险（He等人，2017）。最近的栖息地适宜性评估进一步表明，该物种的分布范围内保护措施仍存在不足（Liang和Li，2024）。同时，高原草原系统正面临围栏建设、基础设施扩张和气候变化带来的日益增加的压力，这些因素对植被状况和功能连通性产生了影响（Dong等人，2020；Ren等人，2024）。特别是围栏会限制动物的移动和空间利用（You等人，2013），而线性基础设施可能进一步阻碍种群间的交流并加剧隔离（He等人，2017；Zhang等人，2023）。在这种背景下，监测工作仍然主要依赖于线路调查和直接计数，这些方法劳动强度大、空间覆盖范围有限，并且容易受到可检测性问题及重复计数的影响（Brack等人，2018；Schultz等人，2024）。在青海湖区，这种情况尤为突出，因为瞪羚分布在高度异质的栖息地中，使用传统方法进行重复的、大范围的、低干扰监测非常困难（Brisson-Curadeau等人，2024）。

无人机（UAV）已成为野生动物监测的实用工具，因为它们能够快速进行调查，实现广泛的空间覆盖，并提供标准化的空中观察（Corcoran等人，2021；Iglay等人，2024）。平台的选择影响着监测能力：固定翼无人机具有长续航时间，适合大面积搜索；而多旋翼无人机则支持稳定悬停和低空高精度成像（Christie等人，2016；Johnston，2019）。垂直起降（VTOL）系统结合了这些优势，提高了在复杂环境中的操作灵活性（Chang等人，2025）。最近的研究已经从概念验证性的无人机调查发展到可部署的、基于人工智能的监测系统，包括专门为普氏瞪羚开发的多目标跟踪技术（Zhang等人，2024）。通过光学或热成像传感器，无人机已被广泛应用于鸟类、哺乳动物和爬行动物的栖息地调查和种群估计（Kim等人，2021；Larsen等人，2023；Zhang等人，2020）。然而，基于无人机的调查必须明确考虑干扰风险：飞行高度、接近方式和噪音可能会改变动物行为，从而影响生态推断的结果，最佳实践指南越来越强调干扰评估和飞行参数的透明报告（Duporge等人，2021）。然而，目前仍缺乏将干扰感知的操作设置与可扩展的、自动化的图像分析相结合的文档记录，这限制了方法的重复性和管理方向的解读（Hodgson和Koh，2016）。尽管无人机能够生成大量的高分辨率图像，但人工解释仍然劳动强度高且容易受到观察者偏见的影响（Hvala等人，2023）。因此，深度学习已成为扩展生态图像分析的核心技术，实现了在复杂空中场景中的自动化检测和计数（Carion等人，2020；Liu等人，2025）。在无人机野生动物监测中，You Only Look Once（YOLO）算法系列被广泛使用，因为它在速度与准确性之间提供了良好的平衡，适用于实地应用（Bakana等人，2024；Hua等人，2022；Roy等人，2023）。针对小型目标和杂乱背景的野生动物优化YOLO模型的研究（例如YOLO-SAG）为我们的基准测试提供了有用的方法论背景（Chen等人，2024）。基于Transformer的检测器提供了另一种补充方法，并在实时检测场景中得到了越来越多的评估（Carion等人，2020）。尽管取得了快速进展，但生态无人机检测仍然具有挑战性，因为目标通常较小且分布稀疏，背景复杂，遮挡和光照变化常见；重要的是，性能可能对有限、不平衡且特定于地点的训练数据非常敏感，这促使人们需要在数据受限的情况下进行评估，并进行更加透明的基准测试（Axford等人，2024）。多传感器融合技术（如共注册的光学和热成像通道）可以在光谱异质性景观中提高检测概率，但性能提升具有场景依赖性，必须通过参考数据进行实证验证（Bao等人，2024）。对于普氏瞪羚而言，基于无人机的热红外检测技术也有报道，这表明在光照条件具有挑战性的情况下，光热红外策略具有潜力（Zhang等人，2025）。为了解决这些问题，我们开发了一种快速的、非侵入性的监测工作流程，将VTOL固定翼无人机（P330 Pro）与深度学习检测器结合，用于青海湖区的普氏瞪羚监测。我们在不同的飞行高度进行了无人机干扰-响应实验，记录了相同现场设置下的地面噪声数据，并在多种训练数据分割条件下对比了不同的检测器（YOLO系列与RT-DETR）。然后将检测结果转化为空间明确的模式特征和管理导向的产品（如出现区域、热点和潜在瓶颈），以支持与水资源可用性和人为干扰相关的保护工作。

**2. 材料与方法**
**2.1. 研究区域**
青海湖位于青藏高原的东北部，涵盖了普氏瞪羚（Procapra przewalskii）的全部自然分布范围（图1a，c）。我们重点调查了北岸的哈尔盖（Haergai）和甘孜河（Ganzihe）地区（图1b），调查区域面积为273平方公里，海拔高度为3100–3200米（37°02′–37°17′ N，100°18′–100°37′ E）。哈尔盖河和甘孜河沿岸的草地-湿地镶嵌在高海拔大陆性气候下的高山草原-灌木丛景观中。夏季（6月至9月）降水量达到峰值，年平均气温约为0.5°C，年降水量为350–450毫米。当地的土地利用以畜牧业为主；瞪羚与大量的牦牛（Bos grunniens）、牛（Bos taurus）和羊（Ovis aries）共同生存，偶尔也有自由活动的野狗（Canis lupus familiaris）和稀少的灰狼（Canis lupus）对它们构成局部捕食风险。长期存在的围栏和线性基础设施（国道、青藏铁路）降低了栖息地的连通性，尽管最近的社区围栏改造改善了关键通道（图1b）。由于有蹄类动物的多样性较低，普氏瞪羚成为该地区的标志性本地物种。

**2.2. 数据收集与预处理**
**2.2.1. 无人机系统与图像采集**
2024年8月5日至15日期间，我们在青海湖周围的两个主要普氏瞪羚分布区域（哈尔盖和甘孜河地区）进行了系统的空中调查（图2c）。使用的无人机是VTOL固定翼P330 Pro（图2b），配备有成都RIEBO M10 Pro摄影测量相机，通过Easyfly飞行控制系统操作（图2a；https://www.huace.cn/download/280）。P330 Pro的最大续航时间约为150分钟，操作范围可达120公里，巡航速度约为76公里/小时，超过了传统的多旋翼无人机（如DJI Phantom/Mavic，续航时间小于45分钟）。任务预先编程为在距离地面399米的高度进行平行飞行，地面采样间距约为3厘米。在常规的固定翼飞行中，相机采用标准化的近地视角进行操作，以确保一致性的检测和景观尺度空间分析。每次飞行的航线长度平均为75–85公里，空间覆盖范围约为17平方公里。图像以高质量的JPEG格式采集，并同步记录了全球导航卫星系统（GNSS）和惯性测量单元（IMU）的数据，以支持基于图像的地理定位和后续的空间分析。

**2.2.2. 地面调查数据**
地面调查在一个选定的有利位置进行，该位置具有较高的海拔和不受阻碍的视野，能够覆盖无人机飞行区域。两名经验丰富的观察者同时使用安装在三脚架上的Swarovski ATX 30–70×95观测镜进行调查，并辅以10×42倍的双筒望远镜进行快速扫描（图2d）。观测镜的有效视野范围取决于放大倍数，从大约35米到19米不等，这使得观察者能够在约2–3公里的半径内高精度地检测个体。每次地面调查持续约一小时，与无人机飞行时间相匹配，确保了时间上的一致性。对于每组检测到的瞪羚，观察者记录了时间、相对于稳定地标（如围栏、河渠或道路段）的 approximate 距离和方位、估计的种群大小以及主要的行为状态（如觅食、休息、警戒）。观察者之间进行了连续的口头核对，以减少重复计数，通过相对位置、移动轨迹和间距模式来区分不同的群体。对于无人机与地面计数的验证，最终统计结果基于经过筛选的检测结果，而不是所有模型输出的总和。候选检测结果在推理后进行了手动审查，对于重叠图像块或相邻帧中的潜在重复记录，通过图像重叠、空间接近性和群体配置与可见景观特征的一致性进行了保守检查。在这种固定点、同步和标准化的设计下，地面数据集作为评估无人机衍生计数结果操作一致性的同步参考，而不是绝对的真实值。

**2.2.3. 定位与定向数据（POS数据）**
每张无人机图像都附带了定位与定向系统（POS）数据，这些数据提供了平台的位置和姿态信息，用于后续基于图像的地理定位和空间分析。该POS数据集整合了GNSS和IMU的输出，其中GNSS提供了图像主点的投影坐标和高度，而IMU记录了无人机在曝光时刻的姿态。POS数据格式如下：(1)xyhφωκ。在这项研究中，GNSS提供了图像主点在中国大地坐标系2000（CGCS2000）/ 3° Gauss–Krüger投影（中央经线99°E）下的投影坐标（x，y）和高度（h），而IMU记录了无人机在飞行过程中的航向（φ）、俯仰（ω）和滚转（κ）。POS数据使用CGO软件进行解码和后处理，处理后的结果随后用于基于图像的瞪羚地理位置识别。由于P330 Pro平台集成了实时运动学（RTK）和后处理运动学（PPK）定位，并支持在CGO中进行更高精度的POS后处理，因此在地理定位之前减少了平台级别的定位不确定性。尽管如此，由于视角几何、局部地形变化、图像中物体的位置以及本研究中采用的简化图像到地面转换方法，个体瞪羚的最终坐标仍然被视为近似的投影位置，而非精确的米级定位（Correia等人，2022；Padró等人，2019）。这一过程应被视为一种简化的直接地理参考方法，适用于景观尺度的空间分析，而不是对个体位置的完整摄影测量重建。

2.2.4. 带注释的无人机图像数据集
在调查过程中共收集了6439张高分辨率的无人机图像，这些图像被处理成一个用于普氏瞪羚监测的带注释的无人机图像数据集。为了满足深度学习模型的输入要求，所有图像都被裁剪成标准化的640×640像素瓷砖。每个瓷砖都使用开源工具LabelImg（https://github.com/HumanSignal/labelImg）手动标定了标记普氏瞪羚个体的边界框。这个专门为这项研究准备的数据集需要大量的手动工作来确保高质量的注释，反映了监测大规模、异质性景观的复杂性。注释以YOLO格式保存，以支持模型训练和评估（Ultralytics，2024；Ultralytics，2025）。数据集被分为训练集、验证集和测试集，使用三种划分方案（7:2:1、5:4:1和2:7:1），以评估在不同数据可用性情况下的模型性能（May等人，2025；Okuley等人，2025）。

2.3. 数据分析
分析工作流程包括六个组成部分（图3）。这些包括：(1) 在标准低干扰协议下获取无人机影像（VTOL固定翼调查）和补充的多旋翼干扰试验；(2) 图像分块和手动注释；(3) 在三种数据可用性配置下的模型训练和推理；(4) 使用标准检测指标和独立地面计数进行模型评估；(5) 使用POS信息和图像几何进行检测个体的地面坐标估算；(6) 使用核密度估计、基于网格的密度映射和空间自相关统计进行空间模式特征分析（Azmi等人，2025）。

下载：下载高分辨率图像（427KB）
下载：下载全尺寸图像

图3. 无人机-AI监测和空间分析的整体工作流程。工作流程包括：(1) 低干扰协议设计和多旋翼干扰试验；(2) VTOL固定翼无人机调查和辅助数据收集，包括飞行计划、POS数据和地面计数；(3) 图像预处理、分块和手动注释；(4) 在不同数据可用性配置下的模型训练、推理和选择；(5) 使用无人机得出的计数和独立地面调查计数进行计数验证；(6) 使用核密度估计（KDE）、基于网格的密度映射和空间自相关统计进行检测地的地理位置识别。在干扰试验期间，以Z加权方式记录了声压级（SPL）作为相对背景指标。

2.3.1. 干扰实验
为了评估无人机操作对普氏瞪羚的干扰效应，并确定适用于野外调查的实际低干扰飞行范围，我们首先通过文献回顾、员工访谈和现场侦察确定了该物种频繁使用的区域。然后使用DJI Air 3S多旋翼无人机进行了干扰试验。在逐渐降低的高度进行连续悬停接近时观察了五个瞪羚群体，以评估与高度相关的行为反应（图4）。

下载：下载高分辨率图像（205KB）
下载：下载全尺寸图像

图4. 普氏瞪羚无人机干扰实验的概念图，显示了飞行高度、噪声水平与行为反应（无反应、警觉、逃跑）之间的关系。SPL是在观察者位置测量的作为背景信息，不被视为暴露阈值。

行为反应分为三个级别：(1) 无反应，个体保持原有的活动状态，没有明显的警戒或回避行为；(2) 警觉，个体表现出如抬头或耳朵竖起等警戒行为，但没有移动位置；(3) 逃跑，个体迅速远离原始位置，有时伴有群体级别的躁动（Bevan等人，2018）。

对于每次悬停飞行，记录了无人机相对于地面的高度（AGL）作为主要解释变量。一旦出现明显的飞行反应，试验立即终止，以避免长时间的干扰。由于相同的瞪羚群体在下降的飞行高度中被反复观察，这种设计代表的是重复观察的野外评估，而不是完全独立的实验样本。鉴于普氏瞪羚的濒危和保护敏感性，干扰试验有意限制了规模，并被设计为低强度的野外评估。为了补充描述性观察，我们还使用惩罚逻辑回归模型，将任何行为反应（警觉或逃跑 vs. 无反应）的概率作为无人机悬停高度的函数进行了建模。这项分析被视为探索性的，用于可视化观察到的高度范围内反应概率的变化。每个高度段的样本大小和行为频率在表S1中报告，对于显示出任何行为反应的飞行次数的Wilson 95%置信区间在补充表S3中提供。作为支持背景，使用AWA-5636声级计在观察者位置记录了近地面SPL，并采用了Z加权。因为SPL是在观察者位置测量的，而不是在动物身上测量的，所以它受到风、微地形、基材吸收和反射以及源-接收器几何等因素的影响。因此，SPL仅作为背景信息报告，不被视为动物声音暴露的估计或干扰阈值。

2.3.2. 物体检测模型
为了评估用于濒危物种监测的深度学习模型，我们比较了四种代表性的物体检测器，包括基于锚点的CNN、无锚点的一阶段设计以及基于Transformer的框架（Axford等人，2024；Delplanque等人，2024）。所有模型都在Ultralytics框架中实现，并从Common Objects in Context（COCO）预训练的权重中进行微调，没有进行架构修改，反映了即插即用的部署（Azmi等人，2025）。YOLOv5（图5a）作为基于锚点的基线，其Cross Stage Partial（CSP）连接改善了梯度流并减少了冗余计算，Spatial Pyramid Pooling–Fast（SPPF）模块在低开销下聚合了多尺度上下文；这两者对于无人机影像中的小目标都有帮助。YOLOv8（图5b）采用了无锚点设计，具有解耦的头部，提高了在不同背景和目标尺度下的适应性。在此基础上，YOLOv11（图5c）在Ultralytics配置中引入了以效率为导向的特征块（例如C3k2）和轻量级注意力变体（例如PSA/C2PSA），可以在遮挡和纹理杂乱的情况下加强特征区分（Khanam和Hussain，2024；May等人，2025）。RT-DETR（Real-Time Detection Transformer；图5d）代表了一种基于Transformer的替代方案，使用编码器-解码器架构和基于集合的预测来建模全局特征关系（Carion等人，2020）。

数据准备遵循了跨模型一致的工作流程：(i) 无人机RGB图像的手动边界框注释；(ii) 转换为YOLO格式；(iii) 训练/验证/测试分割；(iv) 在相同的协议下进行训练和评估，以便公平比较。为了反映濒危物种监测中典型的标签稀缺情况，我们在三种不同的训练数据可用性水平下评估了性能。没有应用对象跟踪；检测结果按帧进行处理，以便后续的空间分析（Zhao等人，2024）。训练使用了固定的输入尺寸（640×640）和批量大小（16），以及AdamW（基础学习率=0.001）。启用了标准增强（例如亮度抖动、随机旋转/平移和水平翻转），并使用了自动混合精度（AMP）。实验在配备Intel Core i9-14900K CPU、32 GB RAM和NVIDIA GeForce RTX 4090 GPU的工作站上运行（Python 3.11.11；ultralytics 8.3.119；torch 2.4.1 + cu124）。本研究中使用的确切训练和推理设置，包括优化器配置、学习率参数、增强设置、随机种子、运行时选项和推理速度，在补充表S2中进行了总结。所有报告的模型结果都是基于固定种子条件（种子=0；确定性=True）的单次运行获得的，而不是从多个种子的平均值获得的。

2.3.3. 评估指标
模型的性能使用四个关键指标进行评估：精确度、召回率、F1分数和平均精度（mAP）。此外，还记录了训练时间（以小时计）、每张图像的推理时间（以每秒计）以及达到收敛所需的迭代次数，以量化计算效率。精确度（公式2）衡量所有预测为正样本中正确识别的正样本的比例。同时，召回率（公式3）评估模型识别实际正样本的能力。F1分数（公式4）是精确度和召回率的调和平均值，适用于不平衡的数据集。对于检测准确性，我们采用了 Intersection over Union（IoU）阈值为0.50的平均精度（mAP），遵循PASCAL Visual Object Classes（PASCAL VOC） convention（Everingham等人，2015）。为了简化，本文中所有报告的值都表示为mAP。mAP（公式5）是所有类别的平均精度（AP）值的平均值，被广泛接受为整体检测性能的指标（Clarfeld等人，2025）。

(2)精确度=真阳性/（真阳性+假阳性）
(3)召回率=真阳性/（真阳性+假阴性）
(4)F1分数=2×精确度×召回率
(5)mAP=1/N∑i=1N APi
这里，真阳性表示正确检测到的目标，假阳性指的是错误分类为正的目标，假阴性指的是遗漏的检测，其中目标被错误分类为负值。N是类别的总数，APi表示第i类的平均精度。

2.3.4. 普氏瞪羚的坐标估计
坐标估计是基于解码后的POS记录逐图像进行的，而不是通过全场景正射镶嵌生成的。对于每张图像，使用图像主点的投影平面坐标（表示为（Xp, Yp）作为地面参考原点，而POS姿态参数描述了曝光时的相机方向。这里的“地面坐标”指的是用于后续空间分析的CGCS2000 / 3° Gauss–Krüger坐标系中的投影平面坐标。每个YOLO检测的质心首先从标准化坐标转换为图像像素坐标，然后转换为相对于图像中心的图像平面偏移量，这些偏移量通过地面采样距离（GSD）进行缩放。鉴于标准化的近天底调查配置，航向提供了分析尺度上的主要方向校正；因此，应用了一个旋转矩阵将图像平面偏移量与投影的地面坐标系统对齐，然后将旋转后的偏移量加到主点坐标上，以获得每个检测到的瞪羚的估计地面位置（Rehak等人，2013）。因为调查是在相对平坦的地形上进行的标准化近天底配置下进行的，因此在景观分析尺度上，俯仰和滚转相关的畸变被认为是次要的，并且在简化的图像到地面转换中没有明确建模。

无人机数据的图像坐标系统由图像宽度（W）和高度（H）定义，图像中心由以下公式给出：
(6) cx=W/2, cy=H/2
YOLO检测输出表示为（类别，xyolo，yyolo，w，h），其中（xyolo，yyolo）表示目标的标准化坐标，范围从0到1，w和h表示YOLO注释格式中边界框的标准化宽度和高度（Ultralytics，2024；Ultralytics，2025）。为了将这些标准化坐标转换为图像像素坐标（ximg，yimg），应用以下转换（公式7）：
(7)ximg=xyolo×W, yimg=yyolo×H
接下来，为了将图像坐标投影到地面坐标系中，纳入了GSD来表示每个像素对应的实际地面距离。目标在图像坐标系中的相对位置，表示为 (X′, Y′)，是根据公式 (8) 计算得出的。(8)X′=?yimg?cy×GSD,Y′=ximg?cx×GSD由于无人机图像受到偏航角 θ 的影响，因此应用了旋转矩阵 R(θ) (公式 9) 来校正飞行方向。(9)Rθ=cosθ?sinθsinθcosθ最后，通过将旋转矩阵应用于相对图像坐标，得到了检测到的目标的地面坐标 (X, Y)，如公式 (10) 所示。(10)XY=XpYp+Rθ·X′Y′尽管这种转换不能消除所有与局部地形变化、图像内的物体位置、俯仰/滚转效应以及非正下视视角相关的残余误差，但我们的调查设计的一些特点减少了这些不确定性的来源。首先，调查集中在 Haergai–Ganzihe 湖岸带，那里的瞪羚主要集中在相对平坦的河岸和低地生境中，而不是陡峭的山区。其次，所有固定翼任务都在接近正下视的配置下进行，飞行高度为 399 米，图像的地面采样距离 (GSD) 大约为 3 厘米，这减少了由于强倾斜视角造成的比例差异。第三，P330 Pro 平台提供了 RTK/PPK 支持的定位数据，而基于 GPS 的后期处理进一步提高了平台的定位精度。因此，所得到的坐标被解释为适合进行 KDE、LISA 和其他景观尺度空间分析的投影位置，而不是单个瞪羚的精确地面真实位置 (Correia et al., 2022; Padró et al., 2019; Soares et al., 2021)。2.3.5. 核密度估计核密度估计（KDE）是一种广泛使用的空间方法，用于估计研究区域内物种出现的强度（单位面积的密度）(Silverman, 1998)。通过使用核函数集成离散的出现点，KDE 为每个位置分配一个密度值，并生成一个连续的空间密度表面。这种平滑过程有助于识别聚集热点和更广泛的空间分布模式，同时减少对局部点级噪声的敏感性。KDE 的通用公式如下：(11)f?x=1nh2∑i=1nK∥x?xi∥h其中 f?x 是位置 x 处的估计密度，n 是数据点的总数，h 是带宽，K 表示核函数，xi 表示第 i 个点的位置。在本研究中，KDE 被应用于普氏瞪羚的地理参考出现点，每个点代表一次检测事件。核密度估计是使用 ArcGIS Desktop 10.8 中的 Kernel Density 工具实现的。通过选择 NONE 作为种群字段，每个出现点都被赋予相同的权重，确保每个点都对密度表面贡献了一个计数。密度表面是以 10 米的空间分辨率生成的栅格。距离是使用投影坐标系中的平面方法计算的。该工具被设置为输出密度值而不是计数，并且密度按平方公里作为报告单位进行了标准化，因此 KDE 值表示为每平方公里的点数。带宽由工具的搜索半径表示，ArcGIS 根据输入点的数量和它们的空间分散度来计算出一个稳定的平滑级别。2.3.6. 全局和局部空间自相关分析在本研究中，使用了全局和局部 Moran's I 指数来评估普氏瞪羚栖息地的空间自相关性，并揭示栖息地选择的空间模式 (Getis 和 Ord, 1992; Goodchild, 1986)。全局 Moran's I 统计量度研究区域内所有栖息地位置的整体空间自相关程度，定义为：(12)I=nW·∑i=1n∑j=1,j≠inwijxi?x?xj?x?∑i=1nxi?x?2其中 n 是栖息地样本点的数量，xi 和 xj 是位置 i 和 j 的属性值，xˉ 是全局均值，wij 是反映 i 和 j 之间空间关系的空间权重，W 是所有权重元素的总和。Moran's I 的值介于 -1 和 1 之间，I > 0 表示正空间自相关，I < 0 表示负空间自相关，I = 0 表示随机空间分布。为了进一步研究局部空间模式，我们应用了局部 Moran's I（局部空间关联指标，LISA），它可以识别栖息地分布中的热点和冷点。该指数计算如下：(13)LISAi=xi?x?S2·∑j=1nwijxj?x?其中 Ii 表示位置 i 的局部 Moran's I 值，xi 和 xj 是位置 i 和 j 的属性值，xˉ 是全局均值，S2 是属性值的方差，wij 是空间权重矩阵。局部 Moran's I 可以突出显示“高-高”集群（热点）和“低-低”集群（冷点），从而揭示局部空间自相关的变化。通过结合全局和局部 Moran's I 分析，我们全面评估了普氏瞪羚栖息地的空间聚类特征，识别出潜在的栖息地热点和受威胁区域，并提供了支持保护规划和栖息地管理的定量证据。3. 结果3.1. 干扰测试通过对五组普氏瞪羚的行为观察，在 DJI Air 3S 多旋翼悬停试验期间发现了一致的高度相关响应模式（图 6）。每组在逐渐降低的悬停高度下进行了连续的短期观察，行为反应通过直接现场观察被分类为无反应、警觉或逃跑。在较高的悬停高度（大约 ≥10–12 米）时，瞪羚通常保持正常活动，没有明显的干扰。当高度降至大约 10 米时，警戒行为如抬头和扫视变得更加明显。在 5–10 米时，逃跑反应更频繁地发生，有时伴随着群体级别的骚动（图 6）。声音强度（SPL）仅在观察者位置记录为上下文元数据，不被解释为干扰阈值，因为声音传播受基底吸收和反射、局部地形、风况和源-接收器几何形状的强烈影响。鉴于该物种的濒危状态以及避免过度干扰的伦理需求，这些观察被解释为现场条件下的探索性操作参考，而不是一个完全普遍的行为阈值。下载：下载高分辨率图像（282KB）下载：下载全尺寸图像图 6. 代表普氏瞪羚在多旋翼悬停试验期间的三种行为反应类别的无人机视图：(a) 无反应，(b) 警觉，(c) 逃跑。为了提供这种模式的探索性定量总结，我们进一步使用惩罚逻辑回归模型，将任何行为反应（警觉或逃跑 vs. 无反应）的概率作为无人机悬停高度的函数进行了建模（图 7）。拟合曲线显示出明显的负高度-反应关系，即在较高悬停高度时行为反应的概率较低，而在高度降至大约 10 米及以下时迅速增加。因为相同的五组在下降的飞行高度下被反复观察，因此这种回归分析被视为支持性的操作证据，而不是群体水平的推断模型。下载：下载高分辨率图像（66KB）下载：下载全尺寸图像图 7. 普氏瞪羚任何行为反应（警觉或逃跑）的概率与无人机悬停高度的探索性惩罚逻辑回归。点代表来自单独悬停飞行的观察到的二元结果（0 = 无反应，1 = 任何反应；为了可见性而抖动）。由于样本量有限且相同的组被反复观察，因此曲线作为探索性可视化呈现，而不是阈值估计。然后，我们在常规 VTOL 固定翼飞行剖面调查中评估了 P330 Pro 系统，飞行高度为 399 米（GSD 约 3 厘米）。在这种飞行配置下，瞪羚在图像中始终可识别，并且在常规任务中的同时现场检查没有显示出明显的行为反应（图 8）。由于多旋翼悬停和固定翼飞行在飞行几何和声学特性上有所不同，因此没有使用悬停试验中的 SPL 观测来推断 P330 操作期间的干扰；相反，P330 配置下的干扰是在常规任务中直接判断的。下载：下载高分辨率图像（196KB）下载：下载全尺寸图像图 8. 不同表面条件下 P330 Pro 无人机系统捕获的普氏瞪羚示例。个体显示为躺下或觅食，未受到无人机操作的干扰。飞行剖面具有 30% 的前向重叠和 20% 的侧向重叠，每次飞行覆盖约 17 平方公里。选择这种重叠是为了减少遗漏的检测，同时允许有限的帧间移动而不产生过多的冗余，因为普氏瞪羚在受到干扰时可以达到约 60 公里/小时的速度（Jiang, 2004）。任务在 09:00 到 16:00 之间进行，以保持稳定的光照并匹配白天的活动。3.2. 无人机和地面调查之间的比较我们在五个代表不同地形设置和群体大小的调查区域（图 9）中比较了基于无人机的计数和传统的基于地面的计数。在每个区域，经验丰富的观察者使用高倍率瞄准镜进行地面计数，同时无人机在同一调查范围内获取图像。然后使用训练有素的物体检测模型处理图像以识别和计数个体。为了验证，无人机总数是从筛选和去重后的检测中得出的，而不是从所有模型输出的原始总和。通过手动审查保守地检查了重叠图像瓦片或相邻帧中的潜在重复项。下载：下载高分辨率图像（147KB）下载：下载全尺寸图像图 9. 研究区域的调查设计，显示无人机飞行路线（黄色线条）和地面计数站点（蓝色图标；群体 ID 1–5）。（有关此图例中颜色参考的解释，请参阅本文的网络版本。）两种计数方法显示出接近的结果（表 1）。在五个调查组中，平均绝对差异为 10.6 个个体，平均相对一致性为 94.52%。Bland–Altman 分析进一步显示基于无人机和基于地面的计数之间的平均偏差较小（偏差 = 3.40 个个体），95% 的一致范围在 -21.65 到 28.45 个个体之间（图 10）。这表明基于无人机的估计通常与同步的地面观察相当，尽管不同调查组之间存在一定程度的变异。因此，在本研究的调查条件下，无人机工作流程可以通过覆盖更大的区域并减少现场劳动力来有效补充传统的地面调查（Povlsen et al., 2024）。表 1. 基于无人机和基于地面的普氏瞪羚种群计数的比较。群体无人机地面绝对差异相对一致性(%)12322421095.872161152994.0836055590.9143833622194.205317325897.54平均值10.694.52下载：下载高分辨率图像（87KB）下载：下载全尺寸图像图 10. Bland–Altman 图显示基于无人机和基于地面的瞪羚计数之间的一致性。每个点代表一个调查组。中间虚线表示平均差异（偏差），上下虚线表示一致性的限制（±1.96 标准差）。3.3. 检测模型的比较在三种训练数据比例（70%、50% 和 20%）下，我们评估了 YOLOv5、YOLOv8、YOLOv11 和 RT-DETR。使用 70% 的训练数据时，RT-DETR 的准确率最高（mAP = 0.947；F1 = 0.927），但需要最长的训练时间（2.475 小时），而 YOLO 模型在较短的训练时间内达到了类似的准确率（0.829–0.946 小时）。在 50% 的数据比例下，RT-DETR 的 mAP 仍然最高（0.944），而 YOLOv8 和 YOLOv11 接近（mAP = 0.916 和 0.913），训练时间也较短（0.716 和 0.808 小时）。即使只有 20% 的标签，RT-DETR 仍然是最准确的（mAP = 0.929；F1 = 0.895），但仍需要 1.361 小时。在 YOLO 模型中，YOLOv11 提供了最佳的速度-准确性平衡，结合了良好的性能（mAP = 0.872；F1 = 0.840）、相对较短的训练时间（0.665 小时）以及最小的性能下降（ΔmAP = 0.063）（表 2；图 11）。因此，YOLOv11 被用于下游检测和映射。在我们的硬件和运行时配置下，部署的 YOLOv11 工作流程每张图像的推理时间为 7.83 秒，这对于大规模无人机图像筛选来说是操作上可接受的。表 2. 不同训练数据比例下的模型性能。模型数据比例精确度召回率F1 分数mAPepochs时间/小时YOLOv570%0.8480.9370.8900.9202000.85250%0.8250.9040.8630.8912000.75620%0.7670.8690.8150.8242000.659YOLOv870%0.8430.9500.8930.9282000.82950%0.8420.9140.8770.9162000.71620%0.7890.8810.8320.8482000.586YOLOv1170%0.8590.9450.9000.9352000.94650%0.8420.9140.8760.9132000.80820%0.8030.8800.8400.8722000.665RT-DETR70%0.8980.9570.9270.9471412.47550%0.8830.9460.9130.9441352.12920%0.8690.9230.8950.9291421.361下载：下载高分辨率图像（532KB）下载：下载全尺寸图像图 11. 四种模型（列）和三种训练比例（行）中普氏瞪羚的比较检测输出。蓝色框是带有置信分数的预测。（有关此图例中颜色参考的解释，请参阅本文的网络版本。）3.4. 种群规模和空间模式3.4.1. 种群规模在覆盖 272.66 平方公里的 16 次无人机飞行中（图 12a），我们处理了 6439 张图像来量化普氏瞪羚的数量。使用 YOLOv11 进行图像预筛选并标记候选检测；然后手动检查每个候选项以减少误报和重复计数。合并验证后的记录后，我们在调查区域内计数了 2918 个个体（图 12b）。每次飞行的计数范围从 123 到 314 个个体（平均值 = 182），为该地区提供了高分辨率、非侵入性的普查。下载：下载高分辨率图像（525KB）下载：下载全尺寸图像图 12. 研究区域内的无人机调查覆盖范围和瞪羚分布。作为参考，2021 年的地面调查显示 Haergai 和 Ganzihe 区域有 3097 只个体（Liu et al., 2023），这些区域是该物种的核心分布区。尽管调查期间和空间边界不完全相同，但总数在数量上相当，支持使用基于图像的计数进行可重复的大面积普查。3.4.2.**空间模式**
我们研究了空间模式，以识别核心使用区域和潜在的破碎化区域。通过聚类分析发现，这些点的出现具有显著的正全局空间自相关（Moran’s I = 0.238，p < 0.001；见图13d插图）。这些点主要集中在河岸和湖滨地区，沿着河流走廊和湖岸形成带状分布。核密度估计（KDE）表面图（图13b）直观地显示了西南湖滨附近的几个热点区域。从数量上看，基于1公里×1公里网格的人口密度图（图13c）显示，这些区域的局部密度超过每平方公里81只个体，而这些热点与LISA结果中的“高-高”集群相吻合（图13d）。

**下载：** 下载高分辨率图像（927KB）
**下载：** 下载全尺寸图像

**图13. 研究区域内普氏瞪羚的空间分布模式：**
(a) 土地覆盖类型；
(b) 核密度估计；
(c) 按1公里×1公里单元格聚合的人口密度（个体/平方公里）；
(d) 强调“高-高”和“低-低”集群的局部空间关联指数（LISA）。全局空间自相关显著（Moran’s I = 0.238，p < 0.001）。

低密度区域主要与农田和围栏牧场相关，在局部Moran’s I（LISA）分析中被归类为“低-低”集群（图13d）。在铁路和高速公路附近，密度也有所下降，这与移动和连通性的障碍效应一致。在北部山区，瞪羚的出现较为稀少且分散，表明它们更依赖低地栖息地。尽管水资源丰富，南部的湿地仍呈现“低-低”集群，密度低于周边地区。

**4. 讨论**
**4.1. 无人机实现低干扰、高效率的监测**
在约399米的高度操作P330 Pro VTOL固定翼无人机，可以获得约3厘米地面样本距离（GSD）的图像，并每次飞行覆盖约17平方公里的范围。这直接解决了地面调查的常见限制问题，如视野受限、进入困难以及重复计数问题（Boon等人，2017年；Ducard和Allenspach，2021年）。与多旋翼无人机相比，VTOL固定翼平台在不依赖跑道的情况下扩大了覆盖范围。这在青藏高原尤为重要，因为那里平坦地形有限，且难以确保可重复的降落路线。相关研究展示了向无人机-AI监测流程的转变，包括用于管理决策的近实时检测（Tripathi等人，2025年）以及针对青藏高原普氏瞪羚的监测/跟踪应用（Zhang等人，2024年）。基于这一方向，我们采取了谨慎的监测方案，并通过同步地面观察来验证计数结果，从而支持在高原条件下进行可重复的广泛普查（Axford等人，2024年）。这种谨慎的操作方式也与探索性干扰分析结果一致，该分析表明，当悬停高度降至约10米及以下时，任何可观察到的行为反应的概率都会迅速增加。除了监测精度外，无人机的应用还能带来直接的保护效益，例如在保护区支持反偷猎行动（例如，非洲保护区的反偷猎部署；Mulero-Pázmány等人，2014年）。

我们的干扰试验表明，这种监测方案不太可能引起明显的行为反应。在标准的高度（约399米）进行P330无人机调查时，我们没有观察到警戒或飞行行为的系统性增加；而更接近或更低的高度则更常引发警觉或逃跑行为。我们并不将399米作为普遍的干扰阈值。在野外环境中，反应会受到听觉和视觉线索的影响，并可能因风速、背景噪音、群体组成和先前的暴露情况而变化。这与关于有蹄类动物的无人机研究结果一致，这些研究表明高度是一个可行的操作参数。这些研究还指出，在多次保守的飞行后动物可能会产生适应（van Vuuren等人，2023年）。在我们的案例中，我们认为在所测试的条件下，约399米的高度属于低干扰环境。未来，协议应记录可检测性和行为反应如何随飞行高度和环境条件变化，利用可用的物种感官信息（例如听力图），并保持保守的缓冲距离（Duporge等人，2021年），尤其是因为生理压力可能在无明显行为变化的情况下发生（Ditmer等人，2015年）。无人机图像还提高了计数精度：在五个同步测试地点，无人机计数与地面统计结果高度吻合（总体一致性约为94.5%），这与之前的证据一致，即标准化的基于图像的无人机计数方法可以与基于观察者的方法相匹配或超越（Hodgson等人，2018年）。总之，VTOL固定翼无人机结合自动化筛选为青藏高原这种敏感有蹄类动物的重复监测提供了实际基础，前提是操作限制得到明确并保守地解释（Mulero-Pázmány等人，2017年）。

**4.2. 深度学习在野生动物监测中的应用及未来潜力**
在基于无人机的野生动物调查中，主要瓶颈通常不是飞行本身，而是图像筛选。自动化目标检测有助于使首次飞行更加高效：模型标记可能的目标，然后由审查人员确认或排除错误，而无需从头开始扫描每一帧图像。在我们的青海湖北岸数据集中，一种无锚点的YOLO系列检测器在仅有少量标注的情况下仍表现可靠（mAP约为0.87，仅使用了20%的标注数据）。这一性能水平使得处理数千张高分辨率图像成为可能，而无需完全依赖人工审查。先前的综合研究也表明，当筛选规则和质量保证/质量控制（QA/QC）一致时，模型辅助的工作流程可以扩大覆盖范围，并且可以与基于观察者的计数结果相匹配或超越（Axford等人，2024年）。同时，最近的YOLO系列检测器改进了对小目标的检测能力，同时保持了常规监测的实用性（Ultralytics，2024年；Ultralytics，2025年）。

最近的研究通过注意力机制或多尺度特征改进了YOLO类型的检测器，以适应杂乱的场景（Chen等人，2024年）。我们的限制因素不同：阳性样本较为罕见，标注工作量较大。当目标只占图像的一小部分时，快速扩展标注量会导致大量重复的阴性样本（Petso等人，2021年）。因此，我们在训练数据减少的情况下测试了系统的稳健性。我们比较了多种检测器在不同标注比例下的表现，注重稳定性而非单一最佳结果。在数据最有限的条件下，虽然RT-DETR取得了最高的mAP值，但YOLOv11提供了最实用的折中方案，保持了0.872的mAP值，同时性能下降幅度较小，计算成本也较低。

有两个后续测试值得优先考虑，因为它们解决了我们在实地图像中观察到的问题：纹理背景下的低对比度、部分遮挡下的漏检以及在黎明/黄昏时分能见度降低的问题。首先，将RGB图像与热红外图像结合使用可能在热梯度较强的情况下提高目标与背景的区分度。无人机热成像研究在适宜条件下报告了有蹄类动物和尸体的更好检测效果，支持在同一条路线上进行的双传感器评估（Lyu等人，2024年；Pagacz和Witczuk，2023年；Rietz等人，2023年）。其次，数据高效标注技术，特别是结合交互式标注的主动学习方法，可以通过选择不确定或多样化的图像进行标注，从而减少冗余，适用于稀有目标的检测以及背景和外观的季节性变化（Bothmann等人，2023年；Kellenberger等人，2020年）。对于管理工作来说，目标是建立一个简单、可审核的现场到报告的流程：带有可追溯QA/QC的验证检测结果、可重复的计数协议，以及可用于定期报告的地图生成工具（Converse等人，2024年；Reynolds等人，2025年）。

**4.3. 空间模式、破碎化及生态启示**
青海湖周围的瞪羚表现出强烈的非随机空间分布模式。检测点集中在河岸和湖滨草地上，研究区域西南湖滨和河口三角洲的密度最高（≥81只个体/平方公里，见图13a-c）。全局空间自相关显著（Moran’s I = 0.238，p < 0.001），局部空间关联指数（LISA）勾勒出沿着湖岸的连续“高-高”带状区域（图13d）。尽管直接比较不同研究中的Moran’s I值时应谨慎，因为空间自相关指标容易受到研究范围、空间粒度和邻域定义的影响，但我们的观测值仍处于其他有蹄类动物相关空间数据集的合理范围内。例如，关于丛生鹿的活动强度的研究报告了显著的正空间自相关（Moran’s I = 0.3055）；而来自人类主导景观的羚羊分布数据显示，黑羚的Moran’s I值为0.1742，四角羚为0.4855，尼尔盖羚为0.4241；多卡斯瞪羚的研究也显示了与距离相关的正聚集现象（Jiang等人，2025年；Louhichi等人，2025年；Niyogi等人，2021年）。总体而言，这些比较表明我们观察到的聚集现象具有生态学意义且明显非随机，但并不异常极端。这种配置与干旱高海拔地区的有蹄类动物生态特征一致：动物集中在地表水供应充足、猎物易被发现的地方，且比较研究表明有蹄类动物的活动、微气候选择和空间利用与水源的距离密切相关（Boyers等人，2019年）。这与独立的栖息地适宜性模型和差距评估结果一致，这些模型一致将青海湖沿岸地区认定为该物种的生态核心区域（Liu等人，2023年）。

人为障碍不断挤压优质的湖滨栖息地。广泛的牲畜围栏以及道路和铁路走廊将该区域划分为半孤立的区块，打断了动物的传统迁徙路径，在LISA地图上形成了冷点区域（图13d）。对于普氏瞪羚来说，带刺且间距紧密的草地围栏减少了可利用的栖息地，增加了被追逐和缠绕的风险；青藏铁路通过阻碍基因流动加剧了这种分裂（Qin和Zheng，2010年；You等人，2013年）。由于立交桥位置不当，藏羚（Pantholops hodgsonii）的迁徙距离增加，这提供了基于实验证据的警示，表明线性基础设施的布局会影响青藏高原上的迁徙成本（Xu等人，2019年）。我们在南部湿地的实地观察进一步表明，尽管水资源丰富，但大量牲畜的存在通过竞争性消耗和干扰（如饲料耗尽和行为改变）减少了瞪羚的出现频率，这种情况在跨喜马拉雅山脉的野生有蹄类动物中普遍存在（Mishra等人，2004年；Shrestha和Wegge，2008年）。

这些限制具有行为和人口统计学上的影响。我们还观察到动物出现在集群边缘，这些地方的水源和食物资源有限，增加了生态风险。这强化了连通性作为与栖息地质量同等重要的目标。KDE和LISA分析一致表明，高密度热点集中在西南湖滨草地（图13b,d）。方法上，我们的解释遵循了使用局部空间统计量将全局聚类分解为可操作的热点和冷点结构的既定方法（Anselin，1995年）。总之，虽然总数有所回升，但长期生存能力将取决于减少关键区域的障碍效应，从而使聚集反映了栖息地的选择而非约束，这与该地区的遗传和景观证据一致（Liu等人，2023年）。

**4.4. 对保护管理的启示**
第4.3节和图13c-d表明，青海湖周围的普氏瞪羚受到的限制更多来自地貌连通性，而不仅仅是局部密度。未来的最低成本分析和路径理论分析可以进一步优先考虑那些在牧场-湖岸生态过渡带处移动受阻的区域。在区域层面，适宜性和差距评估也表明存在一条高质量的栖息地带，但目前仅部分受到保护，因此提高该地带的连通性是一个现实的管理优先事项（Liu等人，2023年；Maxwell等人，2020年）。结合选择性降低或移除围栏、社区参与和奖励计划等当前行动，我们的无人机-AI工作流程提供了一种可重复、低干扰的方法来跟踪随时间变化的分布和破碎化情况。其有效性得到基于无人机的计数结果与同步地面计数结果之间高一致性的支持，包括平均相对一致性为94.52%，以及Bland-Altman分析中的小幅偏差（表1；图10），这使得不仅可以监测总数，还可以关注空间结构。

利用本研究已生成的产品，可以立即采取若干短期行动。KDE热点和高分辨率出现图可以帮助指导沿湖滨带段的巡逻分配和共同管理，特别是在热点与障碍段重叠的地方。当围栏与热点接口呈现LISA中的“高-低”异常值时（即热点邻接低密度区域），可以通过改进围栏来提高通行的同时保持牲畜的功能。实际可行的选项包括用平滑金属丝替换带刺的顶部金属丝，适度增加底部金属丝的高度，以及在关键交叉点安装季节性可折叠或可放下的围栏（Laskin等人，2020年）。在检测点集中在交通走廊附近的情况下，可以先对现有桥梁和涵洞进行有针对性的检查，然后优先考虑低成本改进措施，如安装导向围栏和改善通道设计，再考虑资本密集型的工程改造。有效性可以通过重复无人机调查并在同一分析框架内评估空间限制是否得到缓解来评估。有用的诊断方法包括局部空间关联性的变化（例如，局部Moran's I模式）、KDE热点区域和峰值强度的变化，以及相对于已绘制屏障段的不同检测结果（Underwood, 1994）。我们建议使用基于重采样的区间来报告不确定性，并在解释局部簇时控制多重比较（Conner等人，2016）。所有操作都应在保留许可和特定物种的伦理阈值下进行；我们单季节（八月）的日间采样应在解释时间变化时视为背景不确定性。展望未来，可以在尊重牧民生计的情况下分阶段实施。第一步是使用无人机图像生成带有目标地面验证的地理参考屏障清单（包括围栏和其他线性特征）。第二步是利用出现模式参数化阻力表面，并通过最小成本和电路理论方法生成互补的走廊网络，强调整个区域的冗余性和脆弱性，而不仅仅是单一固定的走廊（Dickson等人，2019）。第三步是在模型优先的狭窄点部署共同设计的渗透性处理措施，包括底部电线调整、季节性铺设、野生动物通道和选择性拆除围栏（Ma等人，2023）。由于热点区域与水资源的可用性相关，还应测试适应性水文管理措施（例如，轮换保护河岸湿地斑块以及在干旱区域进行分散的、卫生管理的补充浇水），同时明确监测聚集相关的风险（例如疾病传播、捕食）。只有在低成本措施证明有效之后，才应考虑资本密集型工程（新的分级野生动物通道）。计划中的青海湖国家公园的建立可以进一步在基础设施审查中制度化野生动物友好的围栏规格和连通性检查（Lu等人，2024）。最后，虽然原地连通性恢复应是这一单一地区特有物种的重点，但根据国际指南（IUCN/SSC, 2013），仍应保留基于研究的预防性保护迁移方案作为长期备选方案。4.5. 不确定性和误差分析尽管UAV-AI工作流程已通过同步地面计数进行了验证（表1），但在解释结果时仍需考虑几个不确定性来源。首先，在复杂场景中（例如阴影、湿地边缘、异质纹理）或部分遮挡情况下，自动化检测仍可能产生偶尔的假阳性或假阴性；通过使用标准化的推理设置、保守的后处理以及手动审查模糊的检测结果来降低这种风险。此外，由于无人机调查包括有意的重叠图像，通过在验证过程中进行保守的手动去重处理解决了 residual 的双重计数风险；然而，一些假阴性和相邻视图之间的匹配不确定性无法完全排除。先前的研究也表明，动物的移动和基于重叠的调查设计可能会影响无人机调查期间的计数误差，这突显了在移动动物应用中需要仔细进行重复筛选的必要性（Schultz等人，2024；Soares等人，2021）。其次，基于地面的计数并非没有误差，因为能见度限制和观察者的差异性可能会影响计数结果；因此，一致性应被视为操作上的连续性，而不是绝对的真实情况。Bland–Altman分析进一步支持了这一解释，结果显示平均偏差很小，但一致性范围足够宽，表明在个别调查组层面仍可能发生不可忽视的差异。第三，地理参考的出现点继承了来自GNSS/IMU误差、相机到平台转换、局部地形变化以及每张图像内的非垂直视角效应的位置不确定性。在我们的案例中，这种不确定性部分通过主要调查带的相对开阔的湖岸-低地环境、标准化的近垂直飞行配置以及P330 Pro平台的高精度RTK/PPK支持的POS数据得到了缓解。尽管如此，这些点仍不应被过度解读为个体的精确米级重新定位。相反，它们被用作热点识别、核密度估计、Moran's I/LISA分析和走廊尺度生态推断的空间表示，其中残余的地理定位误差不太可能改变主要结论。第四，模型在当前研究背景之外的可转移性仍不确定。这里报告的YOLOv11的强劲性能反映了青海湖北岸的图像、P330 Pro光学传感器、近垂直飞行几何形状以及普氏瞪羚在开阔高山草地和湿地背景下的视觉形态。将相同的训练权重直接应用于森林、沙漠、被雪覆盖的场景或具有不同体型、颜色、聚集行为或遮挡模式的物种可能会导致领域偏移，从而降低精确度和召回率。因此，训练好的模型应被视为一个可转移的起点，而不是现成的通用检测器。在新生态系统或其他物种的应用中应包括本地验证、有针对性的迁移学习或使用小型代表性标记子集进行微调，以及推理后的QA/QC。从这个意义上说，更广泛的UAV-AI工作流程比针对特定物种和地点训练的权重更具通用性。最后，KDE和LISA输出对平滑处理和邻域规格敏感，因此我们在分析尺度上将它们视为相对的空间信号，而不是像素级别的密度。在这些限制条件下，关于种群规模和流域尺度聚类的主要结论仍然稳健，而细尺度干预措施应通过实地检查并在可行的情况下进行敏感性分析来证实。5. 结论我们开发了一个集成的UAV深度学习流程，用于监测普氏瞪羚，能够在399米绝对高度（~3厘米地面采样距离）下进行低干扰调查，并在标签稀缺的情况下（mAP ≈ 0.87，标签比例20%）实现可靠的小物体检测。原始图像被切片（640 × 640）并标注以训练/评估YOLO家族模型；经过筛选的检测结果通过POS和图像几何信息进行地理定位，生成出现点和空间产品（KDE；Moran's I/LISA）。结果显示出持续的湖岸-河岸聚集（Moran's I = 0.238，p < 0.001）以及与道路、铁路和围栏相关的破碎化现象，支持以走廊为重点的管理和在北岸瓶颈处进行有针对性的围栏改造，同时结合标准化的飞行规划和QA/QC进行常规报告。局限性包括与遮挡相关的错误、仅限于八月的采样，以及在青海湖开阔高山草地背景之外的可转移性未经测试。未来，應优先考虑多季节RGB-热成像调查、数据高效的学习、基于模型的密度估计，以及通过迁移学习或在不同生态系统和物种之间进行的外部验证和微调。CRediT作者贡献声明韩胜利：撰写 – 原稿、可视化、验证、软件、方法论、调查、概念化。姚晓军：撰写 – 审阅与编辑、监督、方法论、资金获取、概念化。Fazal Ullah：撰写 – 审阅与编辑。张娟：撰写 – 审阅与编辑、调查。窦浩民：调查。Joseph Acheampong Owusu：撰写 – 审阅与编辑。资金这项工作得到了祁连山中亚高山生态系统野外科学观测和研究站开放基金（QLSKFJJ-2024-D0013）和西北师范大学2024年研究生研究资助项目（编号KYZZS2025182）的支持。

热点排行