《Smart Agricultural Technology》:SDE-DET: A Precision Network for Shatian Pomelo Detection in Complex Orchard Environments
编辑推荐:
为应对复杂果园环境下沙田柚检测面临的多尺度、枝叶遮挡、小目标识别等挑战,研究人员基于YOLOv8n模型提出SDE-DET检测网络,通过引入Star Block、Deformable Attention和EMA机制,在STP-AgriData数据集上取得了0.838的mAP@0.5和0.823的F1分数,为自动化采摘机器人开发提供了关键技术支撑。
在广阔的果园中,如何让机器人像经验丰富的果农一样,准确地找到并定位每一颗成熟的沙田柚,是实现水果自动化采摘、提升农业现代化水平的关键一步。然而,这并非易事。沙田柚个头大、重量沉,传统的人工采摘方式费时费力,尤其在规模化种植园中,效率瓶颈尤为突出。更棘手的是,果园环境复杂多变:远处的柚子看起来很小(多尺度问题),近处的又可能被茂密的枝叶遮挡得严严实实;果实的颜色、纹理与树干、树叶颇为相似,让机器“眼花缭乱”;而距离摄像头较远的柚子,在图像中只剩下寥寥像素,特征信息严重丢失(小目标检测难题)。这些挑战使得现有的通用目标检测模型在沙田柚检测任务上表现不尽如人意。为了解决这一系列难题,来自海南大学的研究团队决心为沙田柚量身打造一款“火眼金睛”。他们的研究成果《SDE-DET: A Precision Network for Shatian Pomelo Detection in Complex Orchard Environments》发表在了《Smart Agricultural Technology》期刊上。
为了开展这项研究,研究人员主要运用了以下几项关键技术方法:首先,他们构建了首个专门针对沙田柚的混合数据集STP-AgriData,其中既包含在江西太平山村实地采集的果园图像,也整合了来自公开网络资源的图片,共计317张原始图像,并通过亮度调整、对比度调整、去噪、灰度变换、水平翻转和垂直翻转等六种数据增强手段将训练集扩充至1330张。其次,他们以轻量级模型YOLOv8n为基线,进行了三项核心改进:在模型早期引入Star Block以在不过度增加计算开销的前提下有效获取并保留高维特征信息;在骨干网络中加入Deformable Attention(可变形注意力)模块,使其能够动态调整感受野,更好地关注被遮挡的柚果区域;在颈部网络集成多个EMA(Efficient Multi-Scale Attention,高效多尺度注意力)机制,以降低计算开销并提取深层视觉表征,从而提升对小尺寸柚子的检测能力。整个模型在Linux系统下,使用PyTorch框架,在NVIDIA GeForce GTX 4090 GPU上进行训练和评估。
研究结果
4.3. 对比实验
研究人员将提出的SDE-DET模型与YOLO系列及其他主流检测模型进行了全面对比。实验结果显示,在STP-AgriData数据集上,SDE-DET在精确率(Precision)、召回率(Recall)、mAP@0.5、mAP@0.5:0.95和F1分数上分别达到了0.883、0.771、0.838、0.497和0.823,均优于对比模型。例如,其mAP@0.5比基线YOLOv8n提升了5.1%,比YOLOv9c提升了3.4%,比最新的YOLOv10n提升了7.3%。与Faster R-CNN、CenterNet、RT-DETR等其他主流模型相比,SDE-DET在保持参数量仅3.29M、计算量32.4 GFLOPs的轻量化优势下,检测精度显著领先,证明了其在沙田柚检测任务上卓越的准确性和效率。
4.4. 消融实验
通过系统的消融实验,验证了模型中三个关键改进模块的有效性。实验从原始YOLOv8n(模型0)开始,逐步添加Deformable Attention(模型1)、Star Block(模型2)和EMA机制(模型3,即完整的SDE-DET)。结果显示,每一项改进都对性能有正向贡献。最终的SDE-DET模型相较于基线,在精确率、召回率、mAP@0.5、mAP@0.5:0.95和F1分数上分别提升了2.1%、7.7%、5.1%、3.9%和5.0%。训练曲线也表明,SDE-DET在100轮训练中性能持续稳定提升,未出现明显过拟合,展现了强大的学习能力和泛化能力。
4.5. 网络性能可视化
通过检测结果的可视化对比和Grad-CAM(梯度加权类激活映射)热力图分析,直观展示了SDE-DET的优越性。与YOLOv8n相比,SDE-DET能够更准确地检测出图像角落的小尺寸沙田柚,在强光照、果实颜色与背景相似(如树叶)、果实密集分布等复杂场景下,误检和漏检的情况显著减少。Grad-CAM热力图显示,SDE-DET能够更精准地将高置信度区域(图中红色部分)聚焦在沙田柚本体上,有效抑制了对背景干扰物的关注,证明了模型特征提取和定位的准确性。
结论与讨论
本研究成功构建了沙田柚检测数据集STP-AgriData,并提出了一种新颖的检测网络SDE-DET。该模型通过整合Star Block、Deformable Attention和EMA机制,有效解决了复杂果园环境中沙田柚检测所面临的多尺度、遮挡和小目标难题。实验证明,SDE-DET在检测精度和效率上均达到了领先水平,且模型轻量化(仅6.69 MB),非常适合部署于资源受限的嵌入式系统,为自动化收获机器人的实际应用奠定了坚实基础。
尽管取得了显著成果,研究团队也指出,误检和漏检问题尚未完全解决。未来的工作将集中于收集更多样化的训练数据以提升模型泛化能力,并探索引入更先进的技术如强化学习或自监督学习来进一步增强模型的鲁棒性和适应性。此外,团队计划将研究拓展至其他水果的检测,并开发覆盖自动采摘、果实分级和产量预测的全流程智能化系统,为农民提供数据驱动的生产工具,推动可持续农业和农业生产效率的提升。
综上所述,这项研究不仅为沙田柚的精准检测提供了可靠的理论模型和解决方案,也为智慧农业领域的果实检测与自动化收获技术发展提供了重要的技术参考和实践方向。