基于注意力增强YOLOv4-tiny的水下视频库页海豹自动识别:在鲑鱼定置网中的实时监测应用

《Smart Agricultural Technology》:AUTOMATIC IDENTIFICATION OF KURIL HABOR SEALS ( Phoca vitulina stejnegeri) IN UNDERWATER VIDEO FOOTAGE RECORDED AT A SALMON SET-NETS

【字体: 时间:2026年02月20日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  为解决北海道襟裳地区鲑鱼定置网中库页海豹侵扰导致的渔业损害,研究人员融合高效通道注意力(ECA)机制于YOLOv4-tiny框架,开发轻量级水下目标检测模型。该模型在复杂水下环境中对海豹的检测平均精度(AP)达98.26%,推理速度达28.62 FPS,实现自动化监测并显著降低人工劳动强度,为海洋哺乳动物管理与渔业共存提供可靠技术支撑。

  
在日本北海道襟裳地区的鲑鱼定置网渔业中,一种名为库页海豹(Phoca vitulina stejnegeri)的海洋哺乳动物时常闯入网中捕食鲑鱼,造成显著的渔业经济损失。为缓解这一问题,日本环境省自2016年起推广在定置网入口安装绳网(rope-grid)威慑装置,并持续进行水下视频监控以评估其效果。然而,海量的监控视频依赖人工目视分析,耗时耗力且难以覆盖全部数据,限制了长期、全面的效果评估。因此,开发一种能够自动、快速且准确识别水下海豹的技术,成为支持渔业管理和生态保护的关键需求。
为此,由Jincheng Zhang、Yasuzumi Fujimori、Makoto Tomiyasu、Fumie Kumagai和Zonglin Yang组成的研究团队,在《Smart Agricultural Technology》上发表了一项研究,旨在构建一个轻量级的水下目标检测模型,实现库页海豹的自动识别。这项研究不仅直接应对渔业实践中的监测难题,也为复杂水下环境中的海洋生物自动化监测提供了新的技术思路。
研究人员采用了几项关键技术方法:首先,利用2019年至2021年在襟裳地区定置网内拍摄的水下监控视频,构建了一个包含海豹、鲑鱼、其他鱼类和水母等生物的图像数据集,共计8288张标注图像。其次,以轻量化的YOLOv4-tiny模型为基础架构,并集成了高效通道注意力(Efficient Channel Attention, ECA)模块以增强模型在复杂水下环境(如光照不均、浑浊度高、目标姿态多变)下的特征聚焦能力。此外,研究还通过K-means算法对数据集的真实标注框进行重聚类,以优化模型预设的锚框(anchor boxes)尺寸,使其更贴合实际水下目标的尺度分布。模型训练使用了基于COCO数据集的预训练权重,并在特定的硬件平台(Windows 11系统,Intel? Core? i5-14600KF CPU, NVIDIA GeForce GTX 4060 Ti GPU)上,使用PyTorch框架进行。
研究结果
模型性能评估
优化后的YOLOv4-tiny+ECA模型在测试中表现出色。在包含高浑浊度、密集鱼群干扰等挑战性水下条件的图像上,其海豹类别的平均精度(AP)达到了98.26%,整体平均精度均值(mAP)为73.23%,同时推理速度达到28.62 FPS。与基线模型YOLOv4-tiny及其他注意力机制变体(如SE、CBAM)相比,ECA模块在几乎不增加参数量和计算量的前提下,实现了更高的mAP和更低的损失值。
消融实验验证
消融研究系统比较了不同注意力机制(SE、CBAM、ECA)及其插入位置(主干网络、颈部网络、全阶段)的影响。结果表明,ECA模块在全阶段插入时效果最佳,能将mAP提升0.82%,并且其设计避免了SE和CBAM中因全连接层导致的维度缩减瓶颈,在轻量化模型上表现更为稳健。效率-准确性权衡分析也显示,ECA-enhanced模型在帕累托前沿占据优势位置。
目标识别结果分析
在真实视频序列上的定性分析进一步验证了模型的有效性。在一段23分钟、干扰中等的视频中,ECA-enhanced模型产生的海豹入侵事件检测结果更为集中,有效抑制了因相机抖动和强水流引起的瞬态误报。在一段18分钟、包含密集鱼群和快速瞬变海豹运动的极具挑战性视频中,该模型同样表现出更紧密的事件聚类和更少的类别误判。类激活热图(Grad-CAM)显示,与基线模型相比,ECA-enhanced模型对海豹区域的激活更集中、更尖锐,对网纹、鱼群等背景干扰的响应明显被抑制。
结论与讨论
本研究成功开发了一种集成ECA模块的轻量级YOLOv4-tiny模型,用于定置网水下环境中库页海豹的自动检测。该模型在保持高推理速度(满足实时性要求)的同时,显著提升了在复杂光学条件和背景干扰下的检测精度。其重要意义在于为渔业管理中劳动密集型的海豹监测任务提供了可行的自动化解决方案,有望大幅降低人工成本,并支持对海豹入侵频率和缓减措施(如绳网)效果进行长期、系统的评估。
尽管模型在海豹检测上表现优异,但研究也指出其在极端情况下的局限性,如快速运动、重度遮挡或极低对比度场景下仍会出现残余误报或漏检。这揭示了单帧检测在动态、低能见度水下环境中的固有挑战。与更新、更复杂的轻量级模型(如YOLOv8-nano)相比,本研究模型在整体mAP上虽未达到最高,但在海豹AP上表现相当,且推理速度优势明显(快约66%),这对于在资源受限的水下边缘设备上实现实时监测更具实用价值。
未来研究可通过引入多帧时间上下文信息(如LSTM或光流)来进一步抑制运动伪影,提升在湍流环境下的检测稳定性。同时,在更多样的数据集上进行测试,以及在实际水下边缘计算平台(如Jetson Nano)上部署验证,将进一步证实该技术的工程实用潜力。总之,这项研究为实现高效、自动化的海洋哺乳动物水下监测迈出了坚实的一步,为促进渔业与生态保护的协调发展提供了有力的技术工具。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号