一种适用于水产养殖管理现场鱼类疾病检测的轻量级计算机视觉框架（该框架具有较高的边缘计算性能）作者：李家文（Jiawen Li）、张卫东（Weidong Zhang）、肖胜照（Shengzhao Xiao）、陈宣忠（Xuanzhong Chen）、黄月圣（Yuesheng Huang）、吕聚健（Jujian Lv）、林凯瀚（Kaihan Lin）、胡向雷（Xianglei Hu）、曾现贤（Xianxian Zeng）和陈荣军（Rongjun Chen）

《Fishes》：An Edge-Ready Lightweight Computer Vision Framework for On-Site Fish Disease Detection in Aquaculture Management Jiawen Li, Weidong Zhang, Shengzhao Xiao, Xuanzhong Chen, Yuesheng Huang, Jujian Lv, Kaihan Lin, Xianglei Hu, Xianxian Zeng and Rongjun Chen

【字体：大中小】 时间：2026年05月10日 来源：Fishes 2.4

编辑推荐：

　　摘要高效检测鱼类疾病对于智能健康监测和及时干预水产养殖至关重要。然而，当前的计算机视觉模型仍然计算量较大，阻碍了它们在水产养殖应用中资源受限的边缘设备上的部署。为此，本研究开发了一个基于改进的“你只看一次”（YOLO）的轻量级检测框架，旨在实现检测精度与现场推理效率之间的良

　　摘要
高效检测鱼类疾病对于智能健康监测和及时干预水产养殖至关重要。然而，当前的计算机视觉模型仍然计算量较大，阻碍了它们在水产养殖应用中资源受限的边缘设备上的部署。为此，本研究开发了一个基于改进的“你只看一次”（YOLO）的轻量级检测框架，旨在实现检测精度与现场推理效率之间的良好平衡。首先，提出了一个双分支特征保留下采样（DFPD）模块，以最小的计算开销增强与疾病相关的有价值线索的提取。随后，应用结构化剪枝来压缩优化后的基线模型。在相同条件下评估了四种剪枝技术，包括Slim、GroupTaylor、基于层适应的幅度剪枝（LAMP）和基于L1的剪枝技术。优化后的基线模型将精度从0.864提高到0.908，mAP@0.5:0.95从0.613提高到0.632，同时相对于原始YOLOv8n减少了参数数量（Params）和每秒巨量浮点运算次数（GFLOPs）。在各种剪枝技术中，基于L1的剪枝技术实现了最佳的整体权衡，最终模型在保持F1分数为0.860的同时，将参数数量和GFLOPs分别减少了54.7%和49.4%。消融研究进一步表明，大约41%到47%的FLOPs减少对于保持诊断性能的同时增强紧凑性是最优的。在RK3588S设备上的边缘部署测试验证了该框架的实际推理速度优势。因此，本研究为水产养殖管理中的现场鱼类疾病检测提供了一种适合部署的计算机视觉解决方案，特别适用于计算资源有限的现实世界场景。

1. 引言
水产养殖在全球食品生产中发挥着越来越重要的作用，向精准水产养殖的转变使得智能健康监测成为提高运营效率、减少经济损失和促进可持续农业实践的关键[1]。在密集生产系统面临的众多威胁中，体表疾病尤其令人关注，因为它们传播迅速，会损害鱼类福利，如果不能及时发现，可能导致高死亡率[2]。尽管存在这些风险，商业养殖场中的常规鱼类疾病检测仍然主要依赖于人工观察和专家判断。这些方法本质上劳动密集、主观性强，并且难以扩展到多个生产单元的连续实时监控。在这种背景下，先进计算机视觉和轻量级深度学习模型的集成成为了一种有前景的替代方案，实现了快速、非侵入性和自动化的基于图像的鱼类健康状况评估[3]。
近年来，越来越多的研究将计算机视觉模型，特别是“你只看一次”（YOLO）的变体应用于鱼类疾病检测任务。例如，Li等人[4]提出了YOLO-FD，一个结合检测和分割的多任务框架，以改进疾病评估，证明了考虑病变的建模可以提高诊断性能。Wang等人[5]开发了一种基于改进的YOLOv8的鱼类皮肤病变检测器，发现注意力机制和优化的回归损失可以提高水产养殖管理中的准确性和实时性能。Yin等人[6]引入了CBFW-YOLOv8，用于循环水产系统中的体表疾病识别。他们强调，相互遮挡和复杂的养殖场景等挑战仍然是可靠检测的主要障碍。Luo等人[7]提出了FishMambaNet，该模型采用状态空间建模和多尺度卷积注意力来提高检测性能。Wu等人[8]设计了YOLOv11-SDiseasedFishNet，通过自动化数据增强和增强的多尺度特征融合来推进症状识别。
尽管取得了这些进展，但在水产养殖管理中实际部署现场鱼类疾病检测仍面临几个关键挑战，最显著的是在资源受限的边缘设备上同时实现轻量级设计和高诊断精度的难度。一方面，鱼类图像中的病变区域通常较小、形状不规则且对比度低[9]，这些因素共同削弱了现实世界水产养殖环境中的检测鲁棒性。另一方面，许多最先进的方法通过结合越来越复杂的架构组件（如更深层次的骨干网络、注意力机制、多分支结构或复杂的多尺度融合模块）来追求更高的准确性。虽然这些设计可以提高决策性能，但它们通常会导致大量计算冗余，增加内存占用，并提高部署成本，限制了其在资源受限环境和水产养殖管理中的适用性。在运营中的水产养殖设施中，疾病检测系统不仅需要提供可靠的准确性，还必须在低功耗边缘设备上高效运行，以实现连续实时监控和早期预警[10]。因此，在检测性能和计算效率之间实现良好的权衡仍然是一个紧迫的挑战，因为现有的鱼类疾病检测方法尚未针对实际水产养殖监控系统中使用的边缘硬件进行充分优化。
为了解决这些挑战，本研究提出了一种适用于边缘设备的轻量级计算机视觉框架，用于现场鱼类疾病检测，该框架基于改进的YOLOv8n架构和结构化剪枝。首先，应用了双分支特征保留下采样（DFPD）模块来替代YOLOv8n中的原始stride-2下采样操作[11]。DFPD模块包括一个池化分支，用于保持稳定的结构响应，以及一个卷积分支，用于学习对病变敏感的局部表示。通过连接这两个分支的输出，DFPD旨在在不引入大量计算开销的情况下，在空间分辨率降低过程中保留微妙的体表疾病线索。在此基础上，进一步采用结构化剪枝来消除冗余通道并降低模型复杂性。与通过越来越复杂的网络设计来追求边际精度提升的方法不同，所提出的框架明确优先考虑了资源受限边缘部署所需的准确性和效率之间的权衡。具体来说，其贡献如下：
通过将所提出的DFPD模块集成到YOLOv8n中，基线检测器在下采样过程中增强了细微体表病变的表示，同时保持了紧凑的架构。这种保留特征的轻量级基线为资源受限场景中的鱼类疾病检测提供了更合适的基础，在这些场景中，诊断准确性和计算效率对水产养殖管理都至关重要。
在相同的实验设置下，全面评估了四种剪枝方法（包括Slim、GroupTaylor、基于层适应的幅度剪枝（LAMP）和基于L1的剪枝），以评估它们对检测性能和模型紧凑性的影响。通过这种比较分析，确定了一种最佳的剪枝策略，在轻量级鱼类疾病检测中实现了准确性和计算成本之间的良好平衡。
本研究从实际水产养殖相关场景收集了一个自建的数据集，包含4432张图像和6178个标注对象，涵盖八种疾病类别和一个健康类别。研究团队收集了红斑病、细菌性气单胞菌病、罗非湖病毒、白斑病和健康鱼类的图像，而其他四种疾病类别的图像是从鱼场请求的，以提高疾病覆盖率和类别多样性。该数据集保留了病变形态、鱼类姿势、光照条件和背景复杂性的真实变化。

本文的其余部分组织如下：第2节回顾了鱼类疾病检测的相关工作。第3节描述了所提出的方法，包括自建数据集、整体框架、DFPD模块和结构化剪枝策略。第4节展示了实验结果和讨论，包括与基线模型的比较、消融研究、每类性能评估以及在RK3588S设备上的边缘部署测试。最后，第5节总结了本文。

2. 相关工作
最近关于智能鱼类健康分析的研究可以大致分为 Oriented to Classification（分类导向）、Oriented to Detection（检测导向）和 Oriented to Deployment（部署导向）的方法。在深度学习用于鱼类疾病分析的早期阶段，大量的工作致力于图像级分类。例如，Huang和Khabusi[12]提出了一个多层融合框架，将卷积神经网络（CNN）与优化极值学习机（OSELM）以及注意力机制结合起来（即CNN-OSELM），表明特征融合和注意力增强可以提高判别能力。Tamut等人[13]验证了CNN在鱼类疾病检测中的有效性，证明当疾病类别具有可区分的视觉模式时，深度计算机视觉模型可以可靠地运行。Yu等人[14]改进了YOLOv4以识别多种常见的鱼类皮肤状况，表明轻量级的一阶段检测器改编也可以支持分类导向的疾病识别。Athiraja等人[15]提出了SLCAM-AquaNet，一种针对水产养殖疾病分类的增强注意力的轻量级模型，而Kumar等人[16]探索了一种用于鱼类疾病检测的优化驱动的神经框架。Harun等人[17]证明，结合CNN的对比度适应性颜色校正可以通过在特征学习之前提高图像质量来改善隐核虫病的识别。这些研究表明，基于分类的方法仍然是智能鱼类疾病分析的基础组成部分，特别是在疾病类别在图像级别可以可靠区分的情况下。
后来，研究重点逐渐从图像级分类转向了具有病变意识的检测和分割，这更符合现场疾病诊断的实际需求。例如，Ouyang等人[18]提出了YOLO-TPS，一种为复杂水产养殖环境设计的多模块协同检测模型。他们发现，增强的特征交互和多尺度表示有助于检测小型、视觉上模糊的疾病症状。Wang等人[19]设计了基于改进的YOLOv10的检测器，用于实时鱼类皮肤健康评估，强调了精确的病变定位和计算效率。Liu等人[20]提出了一个多任务框架FDMNet，同时执行鱼类疾病检测和分割，表明边界框回归和掩码预测的协调优化有利于整体诊断性能。Kabitha和Usha Nandini[21]提出了一个集成分割和分类的混合深度学习框架，用于鱼类疾病分析，反映了将各种计算机视觉识别任务统一在单一架构内的更广泛趋势。与图像级分类相比，检测导向和分割导向的方法提供了更丰富的病理信息，因此它们更适合于识别水产养殖管理中的可见体表病变。
此外，另一个日益突出的研究方向是轻量级和实时部署。尽管结合更强的特征提取模块、多分支架构和混合设计可以提高检测精度，但这些改进往往以增加计算负担和降低对资源受限边缘设备的适用性为代价。为了缓解这种权衡，Peng等人[22]提出了RT-GalaDet，一种用于表面相关鱼类健康异常的实时筛查模型，强调了共同优化推理速度和细粒度症状识别的重要性。Wang等人[23]进一步开发了一个基于机器学习的实时鱼类疾病检测系统，支持高效模型对于现场应用的重要性日益增长的认识。除了特定任务的模型设计之外，最近的研究在更广泛的水产养殖智能化发展中 contextualized 这些发展。Ma等人[24]研究了人工智能（AI）在水产安全中的应用，并强调将智能技术集成到疾病预防和健康管理中。Al-Abri等人[25]调查了计算机视觉鱼类监控系统，并确定鱼类健康分析是一个主要的应用领域。Xie等人[26]通过开发一种用于海洋水产养殖中隐核虫病的机器学习驱动的早期预警系统，推进了这一方向，表明数据驱动的疾病管理可以超越视觉诊断，扩展到疫情预测。这些努力表明，鱼类疾病分析正逐渐从孤立的识别任务转向全面的智能健康管理系统。然而，仍然存在一个显著的研究空白：很少有研究系统地采用两阶段策略，首先构建一个更强但更紧凑的基线检测器，然后应用结构化剪枝来进一步优化边缘部署的准确性和效率之间的权衡。受这一研究空白的启发，本研究开发了一个轻量级计算机视觉框架，该框架结合了架构增强和系统化的模型压缩，旨在为现场鱼类疾病检测提供实用的解决方案。

3. 所提出的方法
3.1. 数据集
本研究从实际水产养殖相关场景收集了一个自建的鱼类疾病数据集，包含4432张图像和6178个标注对象。它包含九个类别，包括一个健康类别和八个与疾病相关的类别：红斑病、细菌性背溃疡、白斑病、骨髓炎、红鳃病、细菌性气单胞菌病和罗非湖病毒。其中，研究团队收集了红斑病、细菌性气单胞菌病、罗非湖病毒和健康鱼类的图像。为了提高数据集的类别多样性，还在实际养殖条件下从鱼场获得了其他四种疾病类别（细菌性背溃疡、骨髓炎、红鳃病和链球菌）的图像。所有图像都手动标注了相应的水平边界框，以对应于可见的病变区域或与疾病相关的体表表现。研究团队在水产养殖专家的指导下进行了标注过程，随后检查了标签的一致性，以提高真实标注的可靠性和有效性。该数据集按照YOLO格式组织，通过固定的随机种子42，以70/20/10的比例被随机划分为训练集、验证集和测试集，分别获得了3102张、886张和444张图片，以及相应的4333个、1212个和633个标注的对象数量。如表1所示，数据集存在类别分布不平衡的问题。例如，红斑病的样本数量为1440个，而红鳃病和细菌性背溃疡病的样本数量分别为321个和451个。这种不平衡反映了在实际水产养殖条件下不同鱼类疾病症状的不均匀发生频率。因此，为了保持这种真实的分布，在构建数据集时没有进行额外的图像级重采样。训练集、验证集和测试集是使用固定的随机种子生成的，它们的类别分布与整个数据集大体一致。表1显示了这个自构建的鱼类疾病数据集的详细类别分布。此外，关于成像环境，数据集主要由水上检查图像组成，水下图像的比例较小。具体来说，在水下条件下收集了328张图像，其中训练集217张，验证集74张，测试集37张。其余的4104张都是水上检查图像。因此，大多数图像是在水面以上拍摄的，以便更清楚地观察可见的身体表面症状，如红斑、溃疡、鳞片脱落和表面变色。因此，这个自构建的数据集适合用于评估养殖场中的视觉疾病筛查和现场检查场景。自构建的鱼类疾病数据集中的示例图像如图1所示。

3.2. 整体框架
整体框架如图2所示。该框架基于YOLOv8n，首先应用基线增强，然后进行轻量级压缩。在第一阶段，通过应用DFPD模块对原始的YOLOv8n骨干进行优化，该模块受到YOLOv7中采用的过渡和下采样策略的启发，以最小的计算开销提取与疾病相关的细微特征。在第二阶段，对优化后的基线进行结构化剪枝，以消除冗余通道并降低计算复杂性，之后对剪枝后的模型进行微调以恢复任何性能下降。因此，通过结合架构改进和结构化压缩，该框架旨在实现适合资源受限环境中的现场鱼类疾病检测的准确性和效率之间的理想平衡。

在这项研究中，选择YOLOv8n作为主要基线而不是YOLO11n，主要是为了进行基于边缘的准确性和效率优化。尽管YOLO11n是更新的YOLO变体，但在RK3588S设备上的初步部署结果显示，在相同的输入分辨率和推理配置下，YOLOv8n的推理延迟低于YOLO11n。这表明，更新版本的YOLO变体不一定能在资源受限的边缘设备上提供准确性和效率之间的平衡。同时，YOLOv8n具有轻量级的架构，其stride-2下采样阶段可以被提出的DFPD模块清晰地替代。其以卷积为主的结构也适合与RK3588S进行结构化通道剪枝和边缘部署。因此，YOLOv8n被选为研究提出的两阶段优化框架的基础，该框架首先通过DFPD改进特征保留，然后通过结构化剪枝减少冗余计算[27]。从技术上讲，原始模型包含一个用于分层特征提取的骨干、一个用于多尺度特征融合的neck以及一个用于联合对象定位和分类的检测头。然而，它依赖于stride-2卷积的直接下采样，可能会无意中抑制与病变相关的细微信息，特别是在检测小型或视觉上不明显的鱼类身体表面异常时。为了缓解这一缺点，在YOLOv8n骨干的主要下采样位置应用了提出的DFPD模块，替换了原有的stride-2卷积层。具体来说，第3层、第5层和第7层的原始Conv层分别被DFPD取代，对应于P3/8、P4/16和P5/32特征阶段。通过结合池化分支和卷积分支以及后续的特征连接，DFPD模块旨在在空间分辨率降低的情况下保留更多具有诊断意义的疾病相关线索，同时保持轻量级的架构轮廓。

在建立增强后的基线后，采用结构化剪枝作为补充的压缩步骤，进一步消除冗余参数并降低计算复杂性。剪枝流程包括通道重要性评估、移除低重要性通道、结构重构以及随后的微调以恢复任何性能下降。通过这种结合架构优化和结构化压缩的方法，所提出的框架同时提高了特征提取能力和部署适用性。最终，得到的是一个参数数量（Params）和每秒千兆次浮点运算（GFLOPs）减少的轻量级鱼类疾病检测器，同时保持了令人满意的检测准确性。

3.3. DFPD模块
DFPD模块被引入到YOLOv8n的关键下采样位置，以替换原来的stride-2卷积。这种设计的主要动机是减少通常伴随激进空间分辨率降低而丢失的疾病相关信息。对于鱼类疾病检测，许多具有诊断意义的线索，如红斑、溃疡、鳞片脱落和细微的表面不规则性，本质上是小的、对比度低且空间分布不规则的。在下采样过程中过度抑制这些细粒度特征可能导致漏检和定位精度下降。为了解决这个问题，DFPD模块旨在在实现所需的空间下采样的同时保留更丰富的信息特征。从结构上讲，该模块包含两个并行分支：一个池化分支旨在保留相对稳定的结构响应，一个卷积分支负责学习更具区分性的局部病变表示。这两个分支的输出沿通道维度连接起来，生成最终的下采样特征图。

对于池化分支，首先应用最大池化来降低空间分辨率：然后，使用卷积来投影和细化池化特征。池化分支主要保留粗糙的结构线索和对局部噪声不太敏感的强烈响应。对于卷积分支，输入特征图经过两次连续的卷积变换处理。卷积分支旨在增强可学习的局部表示，并提高对细粒度疾病模式的敏感性。与池化分支相比，卷积分支在捕捉病变外观的细微变化（如不完整的边界、小斑点和细微的纹理差异）方面表现更好。DFPD模块的输出是通过通道连接得到的。如果两个分支输出ch channels个通道，则：因此，提出的模块同时完成了空间下采样和特征融合。与标准的单分支stride-2卷积不同，这种DFPD模块通过两个不同的变换路径聚集互补信息来生成最终表示。

接下来，输出的特征图可以看作是两种类型响应的组合。DFPD模块的输出通过通道连接获得：如果两个分支输出ch channels个通道，则：因此，提出的模块同时完成了空间下采样和特征融合。与标准的单分支stride-2卷积相比，这种DFPD模块通过聚合两种不同变换路径的信息来产生最终表示。接下来，输出的特征图可以被视为两种响应的组合：其中表示池化分支提取的相对稳定的结构信息，表示卷积分支学习的病变敏感的局部信息。这突显了DFPD的关键思想，即在空间分辨率降低过程中同时保留了粗略的语义上下文和精细的病理细节。相比之下，原始YOLOv8n中使用的标准下采样操作可以表示为：尽管这种操作效率很高，但它在一个步骤中同时进行特征提取和空间减少，当病变区域较小或视觉上较弱时可能会导致更多的信息丢失。相比之下，提出的DFPD模块可以表示为：根据（9），原始的单路径下采样被双路径聚合机制所替代，后者为后续特征提取提供了更丰富的中间表示。特别是，标准的stride-2卷积同时执行特征变换和下采样，而DFPD将这一过程分解为两个协调的路径。池化分支几乎不增加额外的计算开销，卷积分支专注于保留有区分性的病变线索。因此，DFPD在特征保留和效率之间实现了理想的平衡。这一属性对于检测鱼类疾病尤为重要，因为在多次下采样后，细微的身体表面症状通常会容易消失。

为了进一步描述DFPD模块的病变保留效果，设表示中包含的疾病相关的区分性信息。理想情况下，一个理想的下采样操作符应满足：从（10）可以看出，DFPD产生的下采样表示应至少保留与原始下采样操作符相同数量的疾病相关信息。为了更好地理解，DFPD模块的结构如图3所示，它被设计为一个适合鱼类疾病检测的下采样操作符。通过结合池化分支和卷积分支，它在空间分辨率降低过程中减少了计算机视觉中的信息丢失，有助于表示细微的身体表面病变，同时保持适合轻量级模型压缩的紧凑架构。

3.4. 结构化剪枝策略
3.4.1. 结构化剪枝的动机
尽管应用DFPD模块可以提高基线检测器的特征提取能力，但增强后的模型仍然包含冗余通道和不必要的计算，这限制了其在实际水产养殖应用中资源受限边缘设备上的部署效率。在现实世界的鱼类疾病检测中，部署通常要求模型在计算资源受限的情况下运行，同时保持可靠的识别性能。因此，接下来的重点是压缩优化后的检测器，以减少参数冗余和计算负担，而不降低检测准确性。与无结构化剪枝相比，结构化剪枝更适合用于面向部署的模型压缩。无结构化剪枝会移除个别权重，通常会产生不规则的稀疏矩阵，这通常需要专门的硬件或稀疏计算库才能实现真正的加速。相比之下，结构化剪枝移除通道、滤波器或其他规则的网络组件，从而直接减少特征图和卷积内核的维度。这意味着结构化剪枝可以有效地减少Params和GFLOPs，同时与常见的推理框架和硬件设备兼容。在鱼类疾病检测任务的背景下，这一优势尤其重要，因为实际系统通常更倾向于使用紧凑、高效的模型，而不是只提供有限加速效益的稀疏化模型。

设基线模型的检测准确率为，复杂性由表示，其中表示计算成本。结构化剪枝的目的是寻找一个满足以下条件的压缩模型：其中和分别表示剪枝模型和原始优化基线的检测性能。换句话说，目标不仅仅是简单地最小化模型大小，而是在紧凑性和检测能力之间实现平衡。这一动机对于鱼类疾病检测尤其相关，因为许多身体表面症状都是微妙、局部且视觉上不明显的。过度压缩往往会导致模型丢失细粒度的病理线索，从而导致漏检或定位性能下降。因此，本研究采用的剪枝策略旨在在尽可能保留疾病相关区分性信息的同时，移除结构上冗余的通道。基于此，评估了各种结构化剪枝策略，以确定一个适合轻量级鱼类疾病检测的策略。

3.4.2. 通道重要性评估
在结构化剪枝中，一个关键问题是如何估计每个通道的重要性。由于通道剪枝会移除整个特征通道并改变网络结构，因此需要一个适当的标准来识别哪些通道可以在对检测性能影响最小的情况下被移除。在这项研究中，在相同的计算减少目标下评估了Slim、GroupTaylor、LAMP和基于L1的剪枝方法，以确保公平比较。具体来说，目标FLOP减少量设置为相对于YOLOv8n+DFPD基线降低了47.44%，将计算成本从7.8 GFLOPs降低到4.1 GFLOPs。在这个一致的FLOPs预算下，比较了不同通道重要性标准对检测性能和模型紧凑性的影响。尽管这些剪枝策略具有相同的目标，即减少模型冗余，但它们在量化通道重要性方面有所不同。

对于第th层，设输出特征通道为，其中表示输出通道的数量。每个通道被赋予一个重要性分数，分数较低的通道被认为较不重要，因此更有可能被移除。通常，通道选择可以表示为：(12) 其中表示第层的剪枝阈值，表示保留的通道集合。请注意，不同的剪枝方法对的定义各不相同。具体来说，Slim剪枝基于批量归一化中的缩放因子来估计通道重要性，缩放因子较小的通道被视为重要性较低。GroupTaylor剪枝通过测量损失函数对特征移除的敏感性来评估通道重要性，从而反映每个通道对优化目标的贡献。LAMP使用基于幅度的评分和层适应性的重新缩放来提高跨层的剪枝决策的可比较性。基于L1的剪枝直接使用卷积核的L1范数来测量通道重要性，这使得实现效率较高且简单。在获得这些信息后，每层的通道将根据其得分进行排名，并根据预定义的剪枝比例移除最不重要的通道。由于结构化剪枝会改变网络的通道维度，因此后续层的输入通道会相应更新以保持结构一致性。因此，通道重要性估计是决定模型压缩是否能够有效去除冗余同时保留与疾病相关的判别信息的核心步骤。如图4所示，重要性较低的通道被移除以获得更紧凑的网络结构。

在这项研究中，这些估计策略在相同的设置下进行了比较，以分析它们对鱼类疾病检测性能和模型紧凑性的影响。请注意，由于基于L1的剪枝在后续实验中实现了最佳的整体权衡，因此对其剪枝过程进行了详细描述。

3.4.3 基于L1的通道剪枝
在调查的结构化剪枝策略中，基于L1的剪枝在检测性能和模型紧凑性之间实现了最佳的整体权衡。因此，它被选为本研究的主要剪枝方案。基于L1的通道剪枝的基本思想是根据卷积核的L1范数来估计通道重要性。权重幅度较小的通道被认为重要性较低，并从网络中移除。
对于第层的卷积层，权重张量可以表示为：(13) 其中和分别表示输出通道和输入通道的数量，是内核大小。然后，第个输出通道的重要性得分定义为：(14) 其中表示对应于第个输出通道的卷积核。较低的值表明该通道对特征提取的贡献较小，因此更有可能被剪除。
在获得通道重要性得分后，可剪枝通道会在符合条件的卷积层中进行全局排名，而不是对每个层独立应用相同的剪枝比例。移除重要性较低的通道，直到达到预定义的FLOPs减少目标。这样，不同层可能会根据其相对重要性保留不同比例的通道，这有助于保留关键的特征提取层，同时减少冗余计算。如果第层的剪枝比例表示为，则被剪除的通道数量为：(15) 现在，当前层的剩余输出通道和下一层的相应输入通道会同步更新，以保持剪枝后网络的结构一致性。因此，基于L1的剪枝直接产生了一个紧凑的密集模型，可以高效部署，而不需要依赖稀疏计算支持。与基于梯度的或基于敏感性的剪枝标准相比，基于L1的剪枝不需要额外的梯度积累或复杂的损失近似，使其适用于大规模的结构化剪枝实验。此外，本研究的实验结果表明，基于L1的剪枝在模型紧凑性和鱼类疾病检测性能之间提供了更有利的平衡。因此，它被选为所提出框架中的主要通道剪枝方法。更多结果在第4节中进行分析。

3.4.4 剪枝后的微调
现在，在进行了结构化通道剪枝后，网络拓扑根据保留的通道进行了重构，相应的权重继承自预剪枝模型。由于直接去除通道会干扰特征传播并降低检测准确性，因此进行了剪枝后的微调阶段以恢复压缩模型的检测性能。在微调期间，剪枝模型在相同的训练集上进行了训练，并使用与初始训练阶段相同的验证集和测试集进行评估。输入图像大小、批量大小、优化器和数据增强策略与初始训练协议保持一致。然而，由于剪枝模型已经从增强的基线中继承了主要的表示能力，因此只需要进行参数调整，微调时采用了较小的学习率和较短的训练计划。在这里，包括Slim、GroupTaylor、LAMP和基于L1的剪枝在内的所有剪枝方法都在相同的超参数设置下进行了微调，以确保公平比较。

4. 结果与讨论
4.1 实验设置和评估指标
深度学习实验在基于Linux的服务器上进行，运行Python 3.10.18、PyTorch 2.2.1和CUDA 11.8以加速计算，使用了RTX 3090（24 GB）和Intel Xeon Platinum 8358P（2.60 GHz）中央处理单元（CPU）。用于训练所提出框架的超参数列在表2中。
为了确保不同模型架构和剪枝策略之间的公平比较，所有模型都使用相同的数据分割、输入分辨率、优化器和训练计划进行训练。当前实验中没有引入额外的类重采样策略或成本敏感的损失函数。使用标准训练增强来提高泛化能力，同时保留了原始的类分布。这种设置允许比较重点关注所提出的DFPD模块和结构化剪枝策略的效果。尽管如此，类不平衡对少数类检测的影响在逐类评估中进一步分析，并作为一个局限性进行了讨论。对于剪枝后的阶段，每个结构化剪枝模型都使用与初始模型相同的训练、验证和测试分割进行了微调。优化器、批量大小、图像大小和增强设置保持不变，而学习率和训练周期进行了调整以适应微调。
随后，为了评估所提出框架的检测性能，精度、召回率、F1分数、mAP@0.5和mAP@0.5:0.95被用作主要的评估指标。同时，使用Params和GFLOPs来研究模型复杂性和轻量级效率。它们的详细信息如下：
精度衡量所有预测为正样本中正确预测的正样本的比例，而召回率揭示了所有真实目标中正确检测到的目标的比例，定义如下：(16) (17) 其中、和分别表示真正例、假正例和假负例。然后，为了平衡精度和召回率，评估了F1分数：(18) 关于检测性能，采用了平均精度（mAP），其中mAP@0.5表示在交并比（IoU）阈值0.5下的平均精度，mAP@0.5:0.95表示在0.5到0.95之间的多个IoU阈值上的平均检测性能，步长为0.05，这提供了定位质量和整体鲁棒性的评估。
关于轻量级性能，Params用于衡量模型存储复杂性，GFLOPs用于评估计算成本。因此，通过综合考虑检测准确性和模型复杂性，所提出的框架可以在资源受限的场景中评估现场鱼类疾病检测能力。

4.2 对比研究
使用不同方法的整体性能列在表3中。结果表明，所提出的DFPD增强方法在保持更紧凑的架构配置的同时，一致性地优于原始的YOLOv8n。具体来说，用DFPD模块替换原始的下采样操作将精度从0.864提高到了0.908，F1分数从0.852提高到了0.856，mAP@0.5从0.869提高到了0.871。同时，Params从3.01 M减少到了2.74 M，GFLOPs从8.1减少到了7.8。这些比较表明，DFPD在下采样过程中增强了病变敏感的特征表示，同时保持了紧凑的模型结构。应当注意的是，精度的提高伴随着召回率的降低，从0.841降低到了0.810，这表明DFPD增强模型仍然遗漏了一些细微或视觉上模糊的疾病实例。对于农场现场的筛查来说，更高的精度是有价值的，因为过多的误报会增加手动验证的工作负担，并降低实时检测的实用性。然而，召回率对于疾病管理和及时干预仍然至关重要。因此，DFPD的精度-召回率行为可以被视为一种权衡，而不是一个完整的解决方案，还需要进一步改进以增强轻量级模型对弱、小和少数类病变的敏感性。

表3. 使用不同方法的鱼类疾病检测性能比较。为了与轻量级YOLO变体进行更全面的比较，YOLOv5n和YOLO11n也被包含在表3中。YOLO11n实现了0.861的精度、0.791的召回率、0.846的F1分数和0.842的mAP@0.5，参数量为2.50 M和6.3 GFLOPs。尽管YOLO11n的计算成本低于YOLOv8n，但其召回率、F1分数和mAP@0.5低于YOLOv8n。这种比较表明，YOLO11n在自建的鱼类疾病数据集上并未获得卓越的诊断性能，特别是考虑到召回率对于减少疾病鱼的遗漏检测至关重要。此外，初步的边缘部署实验显示，YOLO11n在RK3588S设备上的 FPS达到了26.55，而YOLOv8n在同一推理设置下的FPS为29.39，这表明理论模型复杂性并不总是直接转化为边缘硬件上的实际推理速度，操作员支持、图形优化和硬件调度会影响部署效率。因此，YOLOv8n被保留为DFPD增强和结构化剪枝的基线。
如图5所示，YOLOv8n+DFPD表现出更精确的激活，专注于与疾病相关的身体表面区域，进一步证实了病变感知特征表示的定性改进。在四种结构化剪枝策略中，基于L1的剪枝实现了检测准确性和模型紧凑性之间最有利的权衡。基于L1的剪枝实现了0.911的精度、0.860的F1分数和0.853的mAP@0.5，同时Params减少到了1.36 M，GFLOPs减少到了4.1。与原始的YOLOv8n相比，参数量减少了54.7%，GFLOPs减少了49.4%。这些结果表明，所提出的轻量级框架可以在减少计算需求的同时保持显著的鱼类疾病检测性能，从而验证了其在资源受限的边缘部署场景中的适用性。
其余的剪枝方法表现出更明显的性能下降。虽然Slim剪枝和GroupTaylor剪枝都有效降低了模型复杂性，但它们的F1分数和mAP@0.5:0.95值始终低于基于L1的剪枝获得的值。值得注意的是，LAMP产生了最紧凑的模型。然而，其检测准确性下降最为显著，这意味着过度激进的压缩不成比例地损害了对可靠疾病检测至关重要的细粒度病理特征的表示。这些发现验证了所提出方法的好处，该方法通过基于DFPD的架构增强增强了基线检测器，并通过合理结构化剪枝得出了易于部署的模型。相应的性能比较和精度-复杂性权衡在图6和图7中进行了可视化。图6. 不同结构化剪枝策略的性能比较。图7. 检测性能与模型复杂性之间的权衡。

4.3 消融研究
为了确定适合轻量级鱼类疾病检测的最佳压缩级别，进行了一项消融研究，涵盖了不同的全局剪枝比例范围，结果显示在表4中，剪枝比例对检测性能的影响在图8中进行了说明。从表4和图8可以看出，随着剪枝强度的增加，模型紧凑性和检测性能之间出现了明显的权衡。在FLOPs减少了34.61%的情况下，模型达到了0.916的精度、0.835的F1分数、0.840的mAP@0.5和0.574的mAP@0.5:0.95，参数量和GFLOPs分别减少到了2.17 M和5.1。当FLOPs减少到41.03%时，性能仍然稳健，精度达到了0.909，F1分数达到了0.852，mAP@0.5达到了0.851，mAP@0.5:0.95达到了0.593。进一步减少到47.44%时，精度达到了0.911，F1分数达到了0.860，mAP@0.5达到了0.853，mAP@0.5:0.95达到了0.588，同时参数量减少到了1.36 M，GFLOPs减少到了4.1。这些发现表明，适度的剪枝（FLOPs减少量大约在41%到47%之间）可以有效压缩模型大小，同时保留大部分的检测能力。表4展示了不同剪枝比例的实验结果；图8显示了剪枝比例对检测性能和模型复杂性的影响。当剪枝比例超过50%时，性能下降变得更为明显：在FLOPs减少42.56%的情况下，mAP@0.5:0.95降至0.538；而在FLOPs减少57.69%时，这一数值进一步降至0.517，尽管模型变得更加紧凑。过度剪枝会去除一些对识别细微体表病变仍然重要的通道，从而削弱定位准确性和整体检测的鲁棒性。总体而言，实验结果表明，FLOPs减少量在41%到47%之间可以最优化模型紧凑性与检测性能之间的平衡。特别是47.44%的剪枝设置下，F1分数几乎与原始YOLOv8n相当，同时显著降低了计算成本。

4.4. 每类性能分析
为了评估所提出框架在类别层面的表现，图中展示了一个标准化的混淆矩阵，表5列出了每个疾病类别的检测结果。可以看出，该框架在具有相对明显视觉特征的类别上表现优异。健康鱼、链球菌病和细菌性气单胞菌病的整体指标最高，均超过0.90，说明这些类别具有更稳定且易于区分的形态特征。相反，一些类别的检测难度较大：细菌性背溃疡和骨髓炎的F1分数和mAP@0.5值较低，表明准确检测更为困难。造成这种情况的原因可能是病变区域较小、边界不明显，以及与其他体表异常的视觉相似度较高[28]。红斑病和白点病的表现较好，表明该框架在大多数情况下能够正确识别这些病症，但定位精度仍受细微视觉变化的影响。

另一方面，细菌性背溃疡和骨髓炎的召回率较低，这表明这些类别更容易被遗漏。这一局限对水产疾病管理至关重要，因为遗漏可能导致早期干预延迟，增加疾病传播的风险。这两个类别的表现不佳可能归因于多种因素：首先，它们的可见症状通常表现为小而不规则的低对比度病变区域，边界模糊，难以与正常体表纹理区分；其次，这些类别可能与其它体表异常具有相似的视觉特征，增加了类别间的混淆；第三，类别不平衡可能会减少少数类别的学习特征多样性。例如，细菌性背溃疡的样本数量远少于红斑病，导致模型更倾向于学习常见的疾病模式。这些发现表明，尽管所提出的轻量级模型在准确性和效率之间取得了良好的平衡，但其在处理某些关键且视觉上模糊的病理状况时的敏感性仍是一个问题。

4.5. 在RK3588S设备上的边缘部署
接下来，在RK3588S设备上进行了边缘部署实验，以评估所提出轻量级框架的实际推理效率。所有比较模型都被转换为Rockchip神经网络（RKNN）格式，并在相同的部署配置下运行。输入分辨率固定为640 × 640，置信度和非最大值抑制（NMS）IoU阈值均设定为0.35。在推理过程中，RK3588S的所有可用的神经处理单元（NPU）核心都被启用。为了公平比较模型级别的计算效率，报告的平均推理时间和每秒帧数（FPS）仅包括模型推理延迟，不包括视频解码、图像渲染、显示和其他端到端处理的开销。图10展示了在RK3588S平台上所提出方法的边缘部署设置和检测界面。在检测界面中，显示的信息包括帧索引、单帧推理时间、平均模型推理时间和模型FPS。部署结果总结在表6中。

表6显示，在RK3588S设备上，基于YOLOv8n+DFPD+L1的模型具有最高的推理效率，平均推理时间为30.26毫秒，FPS为35.99。相比之下，未剪枝的YOLOv8n+DFPD模型分别为32.54毫秒和32.76 FPS。这一结果表明，基于L1的结构化剪枝阶段在DFPD架构增强后显著降低了推理延迟。与原始YOLOv8n（34.03毫秒，29.39 FPS）相比，基于L1+DFPD+L1的模型减少了推理时间并提升了设备上的推理速度。YOLO11n在相同的RKNN部署配置下表现出37.67毫秒和26.55 FPS，这表明较低的模型复杂度并不一定保证在特定边缘硬件上的更快推理速度。总体而言，这些结果验证了所提出的DFPD增强和后续基于L1的剪枝在水产养殖疾病检测中的平衡效果。

4.6. 讨论
首先，本研究提供的实验结果为轻量级计算机视觉模型在水产疾病检测中的部署提供了见解。虽然YOLOv8n是本研究的主要基础，但所提出的两阶段优化框架并不限于YOLOv8n。DFPD模块旨在替换stride-2下采样操作，而结构化剪枝阶段在保留特征的基础上移除了多余的卷积通道。因此，相同的设计原则可以应用于其他YOLO风格的检测器，包括YOLO11和YOLO12，前提是它们的特征提取阶段包含可替换的下采样模块和可剪枝的卷积层。然而，由于不同的YOLO变体可能具有不同的操作组合和硬件优化特性，其实际的准确性和效率平衡需要在特定边缘设备上进行进一步验证。
其次，DFPD模块所实现的一致性能提升（即精度的提高和mAP值的增加，同时参数和GFLOPs的适度减少）表明，重新考虑下采样操作可以在不引入过多计算开销的情况下带来实质性的好处。标准的stride-2卷积虽然高效，但似乎会无差别地丢弃对识别细微体表病变有价值的空间信息。相比之下，DFPD的双分支设计结合了结构稳定的池化路径和可学习的卷积路径，提供了更平衡的空间分辨率降低机制。这一发现突出了面向部署的模型设计在水产应用中的更广泛原则：在关键信息瓶颈处进行架构修改以保留特征比无差别地加深或扩展网络更具成本效益。
此外，对四种结构化剪枝策略的评估表明，并非所有压缩技术都适合细粒度的水产疾病检测任务。其中，基于L1的剪枝在准确性和效率之间提供了最佳平衡。尽管LAMP采用了逐层自适应的幅度基剪枝策略，但它会在主干网络中过度修剪那些编码细微病变线索的通道（这些通道的权重幅度较小）。一旦这些通道被移除，轻量级模型的敏感性会降低，导致漏检和定位性能下降。在不同剪枝比例下的实验进一步阐明了这一关系，表明FLOPs减少量在41%到47%之间是检测任务的实际最佳范围。超过这个范围后，模型识别细微病理特征的能力会显著下降。这些结果表明，在水产疾病检测成像领域，模型压缩的目标不应是最大程度地减小模型大小，而应是保留具有诊断意义的表示。

最后，本研究存在几个局限性。一方面，当前的边缘部署评估是在RK3588S设备上进行的。尽管结果证明了在资源受限的边缘设备上进行实时推理的可行性，但需要在更多异构硬件平台和推理框架上进行进一步验证。另一方面，自建的数据集主要集中在水面以上的检测图像上，这些图像适合于农场疾病筛查，但未能完全反映连续水下监测中遇到的视觉退化情况。因此，未来的工作将使用在不同水产生态条件下收集的水下图像和视频流来评估所提出的框架。同时，数据集存在类别不平衡问题，这可能是少数类别（如细菌性背溃疡和骨髓炎）召回率较低的部分原因。尽管本研究保留了原始的类别分布以反映实际的水产养殖情况，但未来的研究将纳入缓解不平衡的策略，例如少数类别过采样[29]、病变级数据增强[30]和成本敏感的损失函数[31]。此外，还将研究多尺度特征增强或病变感知注意力机制，以提高轻量级模型对小型、不规则和低对比度疾病症状的敏感性。

5. 结论
本研究开发了一个面向边缘的轻量级计算机视觉框架，用于水产养殖中的鱼类疾病检测。该框架没有通过复杂的深度学习网络设计来追求更高的准确性，而是关注现场农场检测所需的准确性和效率之间的实际平衡。通过结合保留特征的降采样和结构化通道剪枝，该框架证明了一个轻量级的鱼类疾病检测模型可以在大幅降低计算复杂性的同时保持出色的检测性能。特别是，实验结果提供了两个重要见解：首先，下采样设计对于鱼类疾病检测至关重要，因为许多体表症状较小、不规则且对比度低；所提出的DFPD模块在降低空间分辨率的同时较好地保留了与病变相关的信息，为后续压缩提供了更强且更紧凑的基线；其次，模型剪枝应针对细粒度疾病检测任务进行精心调整。过度压缩可能会移除一些对识别细微病理特征仍然重要的通道，而适度的结构化剪枝可以在模型紧凑性和检测可靠性之间取得更好的平衡。
此外，从计算机视觉应用的角度来看，所提出的框架为资源受限的水产养殖环境中的边缘辅助鱼类疾病筛查提供了实用解决方案。在RK3588S设备上的部署结果表明，该模型支持实时推理，适用于农场内的常规采样、分级、转移和早期视觉筛查等场景。这样的面向部署的设计有助于减少对人工检查的依赖，从而更及时地管理鱼类健康状况。尽管结果令人鼓舞，但仍存在一些局限性：当前的部署评估仅在一个边缘平台上进行，需要在更多异构设备和推理框架上进行进一步验证；此外，自建数据集主要包含水面以上的检测图像，这可能影响模型在连续水下监测条件下的鲁棒性（包括浊度、光衰减、悬浮颗粒和颜色失真）。未来工作还将结合先进的数据分析技术来提高轻量级模型对少数类别和视觉模糊类别的敏感性。

热点排行