《Smart Agricultural Technology》:Apple Flower Detection Based on Dynamic Slicing with YOLO-FRNet
编辑推荐:
研究人员为应对自然果园中苹果花目标小、分布密、遮挡多导致检测困难的问题,开展了基于密度引导双阶段高分辨率检测框架DG-DSHRD与增强型YOLO-FRNet架构的研究。该方法在自建远视图数据集上实现了66.6%的mAP50和10.3 FPS的推理速度,有效平衡了准确性与实时性,为果园智能花果管理提供了可部署的解决方案。
春天来了,果园里苹果花竞相开放,这本是丰收的希望。然而,对于果农和农业科学家来说,准确地知道一棵树上到底开了多少花、它们分布在哪里,却是一个令人头疼的难题。这可不是为了赏花,而是因为花朵的数量和空间分布直接关系到未来的果实产量、品质,乃至整个果园的智能化管理水平。传统的“人眼估算”费时费力,误差大;而早期的自动检测方法,在复杂的自然果园环境中——光线多变、枝叶遮挡、花朵目标又小又密——常常“力不从心”,要么漏掉很多花,要么把背景错认成花。
为了解决这个“小而密”的检测难题,来自河北大学的研究团队在《Smart Agricultural Technology》上发表了一项创新研究。他们认识到,问题的核心在于如何让检测模型既能“明察秋毫”地看清每一朵小花,又能“顾全大局”地处理整棵树的远视图,同时还要算得快,以便在实际果园中部署。为此,他们提出了一套“组合拳”:一个名为DG-DSHRD(Density-guided Dual-stage High-resolution Detection framework,密度引导双阶段高分辨率检测框架)的智能调度策略,加上一个专门为小目标优化的增强版检测器YOLO-FRNet。
简单来说,这项研究的主要技术方法包括:首先,构建并标注了一个大规模的远视图苹果花数据集,涵盖了不同花期、光照和视角;其次,提出了DG-DSHRD框架,它采用“先粗筛、后精查”的两阶段策略,先对整图进行快速粗检测,生成密度图,再智能地只对花朵密集的区域进行高分辨率细检测,从而大幅减少计算冗余;最后,设计了YOLO-FRNet检测器,通过感知增强的轻量级特征金字塔网络(PELFPN)和定位质量感知检测头(LQE)来提升对小而密目标的特征表征和定位精度。
研究人员通过系统的实验验证了各个模块的有效性以及整体方案的优越性,主要研究结果如下:
3.3. 数据增强与类别平衡的效果
实验表明,标准的数据增强(如水平翻转、亮度抖动、高斯噪声注入)和一种结构保持的类别平衡策略(针对花期中“盛开”、“气球期”、“粉红期”样本数量不均衡的问题)能够有效提升模型性能。结合了这两种策略的YOLOv11s基线模型,其精确率(P)、召回率(R)和F1分数分别达到了50.7%、54.6%和52.6%,为后续的模型改进奠定了基础。
3.4. 网络模块的消融研究
对YOLO-FRNet的两个核心改进模块——PELFPN和LQE进行了消融实验。结果显示,PELFPN主要通过优化检测层结构(保留P2、P3、P4,去除冗余的P5层)和引入上下文混合动态卷积(ContMix)来增强多尺度特征融合,主要提升了模型整体的平均精度(mAP50)。LQE模块则通过一个额外的分支来预测边界框的定位质量分数,并将其与分类得分融合,主要提升了模型召回率,减少漏检。当两个模块结合形成完整的YOLO-FRNet时,相比原始YOLOv11s,mAP50、精确率、召回率和F1分数分别提升了3.2、1.9、1.8和1.8个百分点,达到了51.2%、52.6%、56.4%和54.4%,证明了模块设计的有效性和互补性。
3.5. 与主流检测模型的对比
将YOLO-FRNet与多种主流轻量级检测器(包括RT-DETR-L, YOLOv5/8/9/10/11s)在相同数据集和设置下进行对比。YOLO-FRNet在mAP50、精确率、召回率和F1分数上均取得了最佳成绩,全面超越了作为其基础的YOLOv11s以及其他YOLO系列变体。虽然其推理速度(37.8 FPS)略低于YOLOv11s(42.5 FPS),但仍能满足实时性要求,且在计算复杂度(25.4 GFLOPs)和精度之间取得了更好的平衡。
3.6. 不同推理机制的对比分析
这部分实验至关重要,它对比了三种推理策略:1) 直接在原图上检测;2) 使用基于SAHI(Slicing Aided Hyper Inference)的静态切片再检测;3) 使用本文提出的DG-DSHRD动态密度引导切片。实验以YOLOv11s和YOLO-FRNet作为基础检测器进行。结果清晰地表明,无论是搭配哪个检测器,DG-DSHRD都显著优于静态切片方法。特别地,YOLO-FRNet + DG-DSHRD 这一组合达到了峰值性能:mAP50为66.6%,F1分数为66.3%,同时将推理速度从静态切片下的2.85 FPS提升至10.3 FPS,实现了接近实时的检测能力。这证明了DG-DSHRD能够智能地将计算资源集中在目标密集区域,在保证甚至提升精度的同时,极大提升了效率。
综上所述,这项研究通过创新的算法框架设计,成功解决了自然果园环境下远视图苹果花“小、密、遮挡”的检测难题。其核心贡献在于:提出了密度引导的双阶段动态切片推理框架DG-DSHRD,显著优化了计算资源分配和推理效率;开发了针对小目标增强的检测器YOLO-FRNet,提升了特征表达和定位质量;并将两者结合,构建了一个高效、准确的检测系统。实验表明,该系统在自建数据集上超越了主流检测器和静态切片方法,在精度和速度上取得了更优的权衡。这项研究不仅为苹果花的精准监测和计数提供了切实可行的技术方案,其提出的密度引导、自适应推理的思想,也为其他农业场景(如果实、病害检测)乃至通用计算机视觉领域中的高密度小目标检测问题提供了有价值的参考。最终,这项技术有望支撑果园数字化监测、智能疏花疏果和产量预测,推动智慧农业的发展。