基于渐进式自适应网络与低匹配成本的密集叶片检测新方法：Leaf-DETR

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Plant Phenomics》：Leaf-Detr: Progressive Adaptive Network with Lower Matching Cost for Dense Leaves Detection

【字体：大中小】 时间：2026年02月20日 来源：Plant Phenomics 6.4

编辑推荐：

　　为解决复杂农田场景下叶片高度重叠、密集导致的特征混淆和网络收敛困难问题，研究人员开展了一项名为Leaf-DETR的密集叶片目标检测框架研究。该研究构建了当前最大的猕猴桃叶片数据集（1,696张图像，85,375个标注框），并提出渐进式特征融合金字塔网络（P-FPN）和拥挤查询精炼策略（CQR），显著提升了模型性能（mAP@50提升1%，AR@300提升1.4%）和训练效率。其成果为叶片表型分析、病害识别和产量估算等精准农业关键任务提供了有效的技术基础，具备重要的应用价值。

在精准农业的宏伟蓝图中，对作物进行高效、智能的监测是实现可持续生产、保障粮食安全的核心。作为植物的“能量工厂”，叶片是光合作用和生长状况的最直接指示器，它们的数量、分布、形态和健康状况直接影响着最终的收成。因此，精准地识别和计数每一片叶子，就像为每一株作物建立一份详细的“健康档案”，是进行表型性状提取、疾病早期预警、乃至最终产量预测不可或缺的基石。然而，理想很丰满，现实却很“骨感”。当我们把目光投向真实的农田，特别是像猕猴桃这类藤架作物，映入眼帘的往往是叶片层层叠叠、相互遮挡、密度极高的复杂场景。传统基于手工巡检的方式不仅效率低下、主观性强，更难以应对这种大规模、高密度的监测需求。

那么，能否借助计算机视觉的力量，让机器自动“数叶子”呢？这正是近年来农业人工智能领域的热点方向——密集目标检测。尽管通用物体检测技术（如Faster R-CNN、YOLO系列）已在众多领域大放异彩，但当它们面对农田中叶片的“亲密无间”时，却显得有些力不从心。现有方法主要面临三大“拦路虎”：首先，缺乏高质量、大规模的密集叶片专用数据集，导致模型“学”不到足够的真实世界知识；其次，叶片间高度相似的外观和严重的相互遮挡，使得网络在提取特征时容易“张冠李戴”，无法清晰区分彼此；最后，密集排列的叶片会产生大量高度重叠的候选检测框，这不仅大幅增加了模型匹配的计算成本（如匈牙利匹配算法负担重），还导致网络训练困难、收敛缓慢，难以精准定位每一片叶子。

为了攻克这些难题，一项发表于《Plant Phenomics》的研究提出了一套名为Leaf-DETR的创新解决方案。该研究由贵州大学等机构的研究团队完成，旨在为密集叶片检测提供一个从数据到算法的完整框架。

研究人员为开展此项研究，主要运用了以下几项关键技术方法：首先，利用无人机（UAV）搭载高分辨率相机，在中国贵州省修文县的猕猴桃基地进行了系统的田间数据采集，构建了迄今最大的密集猕猴桃叶片检测数据集（KiwiFruitLeaf），包含1,696张图像和85,375个高质量标注框。其次，提出了Leaf-DETR检测框架，其核心由渐进式特征融合金字塔网络（Progressive Feature Fusion Pyramid Network, P-FPN）和拥挤查询精炼策略（Crowded Query Refinement, CQR）构成。P-FPN通过多阶段特征融合和自适应特征聚合模块（Adaptive Feature Aggregation, AFA），增强高低层级信息的交互，以缓解叶片重叠导致的特征混淆。CQR策略则通过引入额外查询分支和一对多（one-to-many）匹配机制，有效降低了密集候选框的匹配成本，加速了网络收敛。此外，模型还采用了改进的联合训练辅助头（Improved Jointly Trained Auxiliary Head）来丰富训练样本。实验在NVIDIA A30 GPU上进行，使用AdamW优化器等标准配置进行评估。

研究结果

3.2. 不同模型的比较实验

•
3.2.1. 定量比较：在自建的猕猴桃叶片数据集上，Leaf-DETR与多种主流检测器（包括单阶段、两阶段、端到端及专用密集检测器）进行了对比。结果显示，Leaf-DETR在多项指标上均达到最优，其平均精度均值（mean Average Precision, mAP）为66.9%，在交并比阈值为0.5和0.75时的平均精度（mAP@50和mAP@75）分别达到93.2%和79.2%，平均召回率（Average Recall, AR@300）达到79.5%，全面超越了基线模型CO-DETR及其他对比模型。
•
3.2.2. 定性比较：通过可视化对比发现，相较于Sabl、Faster R-CNN、DDQ等模型，Leaf-DETR在叶片高度重叠、遮挡的边缘区域表现出更全面的检测能力，漏检率更低，能够更准确地框出重叠、多尺度的叶片。
•
3.2.3. 与多模态模型的比较：与当前先进的多模态检测模型（如T-Rex、Grounding-DINO、YOLO-World）相比，Leaf-DETR在专为密集场景设计的架构加持下，展现出了更优的检测性能，尤其是在处理严重遮挡叶片时优势明显，说明了针对特定领域任务进行专门模型设计的必要性。

3.3. 消融实验

•
3.3.1. 模块有效性验证：训练损失曲线表明，集成CQR策略和P-FPN的Leaf-DETR模型收敛速度显著快于基线模型，尤其在训练中后期，证明了CQR在稳定训练和加速收敛方面的作用。
•
3.3.2. CQR有效性验证：实验显示，当查询数量增多时，配备CQR策略的模型能保持性能稳定，而无CQR的基线模型性能会因相似查询过多导致的匹配负担而下降，验证了CQR在管理密集查询、提升计算效率方面的关键作用。

3.4. 泛化实验

•
在未参与训练的、由监控设备拍摄的图像（存在拍摄角度、光照、叶片枯萎等差异）上测试，Leaf-DETR仍能成功检测超过90%的叶片，其mAP@50达到74.5%，显著优于其他对比模型，显示了强大的跨场景泛化能力。
•
进一步在黄瓜、马铃薯、甘薯、茶叶等其他多种作物叶片图像上进行测试，Leaf-DETR在未经特定训练的情况下，依然表现出了良好的检测性能，mAP@50均在60%以上，证明了其强大的跨作物泛化潜力。

研究结论与讨论

本研究成功构建了当前最大的密集叶片检测数据集KiwiFruitLeaf，并提出并验证了Leaf-DETR这一高效的密集叶片检测框架。该框架通过P-FPN模块有效解决了叶片重叠导致的特征混淆问题，通过CQR策略显著降低了密集检测任务中的匹配成本并加速了网络训练收敛。实验结果表明，Leaf-DETR不仅在自建数据集上取得了最优的检测精度和召回率，而且在监控图像和其他多种作物叶片上展现了卓越的泛化性能。

在讨论部分，作者指出Leaf-DETR虽然表现出色，但在实际部署中仍需考虑一些挑战和优化方向。例如，叶片在整个生长周期中的形态、纹理变化（如发病、衰老）要求模型可能需要针对不同生长阶段进行微调，而Leaf-DETR快速的训练收敛特性为此提供了便利。模型目前采用背景与叶片的二分类策略，而非直接识别病害或物种，这主要源于农业数据集中健康与病叶样本极度不均衡的现实限制，但该策略也突显了其作为基础检测器的强泛化能力。此外，模型在处理非垂直视角（如山地环境的斜拍图像）时，因透视变形会导致性能下降（mAP降低16.1%），这主要是由于训练数据中缺乏此类视角的样本，未来可通过合成数据增强或多视角融合策略来改善。在叶片密度极高的场景（如茶园），部分检测框可能无法完全包围整个叶片，但P-FPN模块保留了足够的低层级边缘特征，使得许多叶片仍能被成功检测，而CQR策略则能有效应对此类高密度场景带来的计算挑战。

总之，这项研究通过高质量数据集和创新的算法设计，为复杂农田环境下的密集叶片检测提供了切实可行的解决方案。Leaf-DETR框架在精度、效率和泛化能力上的平衡，使其在作物表型分析、病害监测、产量预估等精准农业应用中具有重要的实用价值和发展前景，为构建更智能、更全面的田间监测系统奠定了坚实的技术基础。

联系信箱：

粤ICP备09063491号

热点排行