基于Inception-ResNetV2的Faster R-CNN框架PotatoGuardNet在复杂环境下马铃薯叶部病害精准检测与定位研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Frontiers in Plant Science》：PotatoGuardNet: a refined deep learning framework for potato leaf disease detection

【字体：大中小】 时间：2026年01月30日 来源：Frontiers in Plant Science 4.8

编辑推荐：

　　本文提出了一种改进的深度学习框架PotatoGuardNet，该框架基于Inception-ResNetV2的Faster R-CNN模型，用于马铃薯叶部病害的精准定位与分类。研究通过整合区域提议网络（RPN）和卷积神经网络（CNN），有效解决了传统方法在复杂环境下识别细微病害症状的局限性。模型在PlantVillage数据集上实现了99.41%的分类准确率和0.9556的mAP，并通过热力图验证了其解释性。该研究为农业病害自动监测系统提供了可靠的技术支持，有助于实现早期干预和精准施药。

1 引言

马铃薯是全球消费量最大的蔬菜作物之一，但环境变化与各类病害对其产量和品质造成显著影响。传统人工分类方法存在效率低、依赖专业知识等局限，因此开发自动化病害识别系统至关重要。然而，病害区域大小、结构差异及复杂环境因素增加了准确识别的难度。深度学习（DL）技术，特别是卷积神经网络（CNN）和循环神经网络（RNN），在农业图像分析中展现出强大潜力，但现有模型仍面临过拟合、可解释性差及计算成本高等挑战。本研究旨在通过改进的Faster R-CNN框架——PotatoGuardNet，实现马铃薯叶部病害的高精度检测与分类。

2 相关研究

现有研究已应用多种机器学习和深度学习方法进行马铃薯病害识别。例如，Sinshaw等人综述指出DL方法优于传统机器学习；Mahum等人采用DenseNet-201和迁移学习提升分类效果，但缺乏病灶精确定位能力；Zhao等人引入注意力机制改进Inception网络，仍存在泛化能力不足的问题。此外，基于YOLO-V5和CNN的混合模型（Rashid等人）虽能定位病害区域，但对小尺度病灶识别效果有限。这些研究多侧重于分类而弱于定位，且对复杂环境适应性较差。

3 方法论：PotatoGuardNet

PotatoGuardNet以Faster R-CNN为基础框架，选用Inception-ResNet-V2作为特征提取主干网络。该结构通过多尺度卷积核和残差连接增强特征多样性，避免梯度消失问题。其残差学习单元通过公式y = F(x) + x实现恒等映射，加速模型收敛。区域提议网络（RPN）采用锚点框（Anchor Boxes）生成候选区域，并通过非极大值抑制（NMS）剔除冗余提案。分类子网络使用交叉熵损失函数区分病害类别，回归子网络则通过Smooth-L1损失优化边界框坐标。整体损失函数定义为分类损失与回归损失之和，确保模型同步优化检测与定位任务。

4 结果与分析

4.1 评估参数与数据集

实验采用PlantVillage数据集中的马铃薯叶片图像，包含健康、早疫病（Alternaria solani）和晚疫病（Phytophthora infestans）三类样本。评估指标包括精确率、召回率、F1分数、交并比（IoU）和平均精度均值（mAP）。

4.2 定位与热力图分析

模型在测试集上达到mAP 0.9556和IoU 0.9504，显著优于传统方法。热力图（Grad-CAM）显示模型注意力集中于病斑区域（如图6所示），验证了其特征捕捉能力。定位结果（图5）表明模型能准确框定早期和晚期病斑，且对背景干扰具有鲁棒性。

4.3 模型性能比较

与基线模型（如RCNN、Fast-RCNN、YOLO-V4）相比，PotatoGuardNet的准确率（99.41%）提升5.88%。与深度学习模型（VGG-16、ResNet-101等）对比，其F1分数（99.29%）和错误率（0.71%）均优于最优对比模型（DenseNet-121的98.50%）。此外，该模型在ML分类器（SVM、KNN等）比较中准确率优势显著（最高提升8.33%）。

4.4 先进技术对比

与最新研究（如Mahum的改进DenseNet、Zhang的VGG16+CBAM）相比，本模型在保持低计算成本的同时，准确率提高1.15%-4.59%，尤其在小病灶和复杂背景样本中表现优异。

4.5 跨数据集验证

在PlantDoc野外数据集上的跨域测试中，模型未经过微调仍达到72.45%的准确率，证明其具备一定的现实场景泛化能力。

5 结论

PotatoGuardNet通过融合Inception-ResNet-V2的深层特征提取能力与Faster R-CNN的精准定位机制，实现了马铃薯叶部病害的高效识别。模型在控制环境和野外条件下均表现出色，为农业病害智能监测提供了可行方案。未来工作将聚焦于真实农田数据验证和领域自适应方法集成，以进一步提升实用性与普适性。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号