面向小农户的移动端咖啡浆果产量自动估算：基于枝条分割与遮挡校正的深度学习框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Smart Agricultural Technology》：Field-deployable coffee yield estimation from mobile phone images using branch segmentation and occlusion correction

【字体：大中小】 时间：2026年02月20日 来源：Smart Agricultural Technology 5.7

编辑推荐：

　　【编者推荐】为实现高效、准确的咖啡产量估算，研究人员提出了一种基于智能手机图像和深度学习的自动化框架。该框架通过枝条分割、浆果检测和遮挡校正三大步骤，克服了传统人工计数在劳动强度、误差和可扩展性方面的局限。在来自多国的7025张图像数据集上验证，该模型在最优条件下（背景完全隔离）达到了高达0.96的R2和低至10%的地块级MAPE。这项研究为小农咖啡系统的规模化、低成本产量估算奠定了坚实的技术基础。

咖啡是全球最重要的经济作物之一，其产量估算对于从田间管理、劳动力规划到供应链金融和欧盟《反毁林条例》合规等一系列环节都至关重要。然而，传统的产量估算依赖于人工对咖啡浆果进行计数，这种方法不仅劳动密集、耗时费力，还容易因调查员疲劳和认知偏差而产生误差。尤其是在种植结构多样化、管理参差不齐的小农户环境中，获取准确、可扩展的产量数据更是挑战重重。因此，开发一种能够适应实地复杂条件、操作简便且成本低廉的自动化产量估算方法，成为了产业和研究的迫切需求。

为了应对这一挑战，一项题为《Field-deployable coffee yield estimation from mobile phone images using branch segmentation and occlusion correction》的研究应运而生，并发表在《Smart Agricultural Technology》期刊上。该研究由国际热带农业中心的研究团队领衔，旨在构建一个专门针对小农环境、利用中低端智能手机图像进行咖啡浆果自动计数的深度学习框架。

研究人员采用了几个关键技术方法来构建和验证其自动化框架。首先，他们在哥伦比亚、秘鲁、洪都拉斯和乌干达等四个主要咖啡生产国，历时五年收集了超过150个小农农场的7025张标注图像，覆盖了阿拉比卡和罗布斯塔两个咖啡品种，确保了数据的多样性和代表性。研究采用了两阶段抽样协议：在地块层面按“X”形模式系统选取代表性咖啡树，然后在每棵样本树的上、中、下三个产量区域各随机选取一根生产性枝条进行拍摄和人工计数作为真值。图像采集设置了三种背景隔离条件（无隔离、部分隔离、完全隔离）以模拟不同拍摄难度。其次，研究构建了一个顺序数据处理流水线，其核心包括三个基于深度学习的模块：利用YOLOv11模型进行生产性枝条分割，以隔离目标枝条；利用YOLOv11模型进行浆果检测与颜色分类（绿、黄、红、棕）；以及一个基于二次回归的遮挡校正模块，用于估算因浆果紧密簇生而被遮挡的果实数量。最后，他们将完整的流水线性能与仅使用检测的模型（YOLO detection-only）以及先进的计数回归模型TasselNetv2+进行了对比评估，使用决定系数（R²）、均方根误差（RMSE）和平均绝对百分比误差（MAPE）作为主要评估指标。

4. 结果

4.1. 单个组件评估

各组件模型在其各自的验证集上表现良好。检测模型在mAP@50和mAP@[50:95]上的得分分别为0.81和0.59。分割模型的得分分别为0.63和0.42。遮挡校正模型的R²为0.81，RMSE为4.81个浆果。相比之下，TasselNetv2+在检测数据集验证集上取得了0.91的R²。

4.2. 流水线评估

完整流水线的性能在不同图像采集条件下均显著优于两个基线模型。

•
在背景完全隔离条件下：完整流水线与仅检测模型性能接近（R²分别为0.769和0.765），但TasselNetv2+表现较差（R²=0.396）。
•
在背景部分隔离条件下：完整流水线优势扩大，R²达到0.753，而仅检测模型为0.700，TasselNetv2+则降至-0.073。
•
在无背景隔离条件下：仅检测模型和TasselNetv2+性能崩溃（R²分别为-6.58和0.100），而完整流水线凭借其枝条分割能力，仍能保持0.448的R²。
•
在混合背景条件下：完整流水线R²为0.695，远高于仅检测模型（-1.22）和TasselNetv2+（0.169）。

结果表明，自动枝条分割对于在复杂背景下防止过度计数（将背景中的浆果误计入目标枝条）至关重要。此外，研究还发现，当计数结果从枝条层面聚合到树层面和地块层面时，由于误差相互抵消，预测精度会进一步提升。例如，在洪都拉斯一个高质量数据子集上，地块层面的R²从枝条层面的0.90提升至0.96，MAPE从23%降低至10%。

5. 讨论与结论

该研究成功开发并验证了一个适用于实地部署的咖啡浆果自动计数深度学习框架。其核心结论和重要意义在于：

1.
解决了关键实践难题：该框架通过整合枝条分割和遮挡校正模块，有效应对了实地图像采集中的两个主要挑战——背景干扰和浆果遮挡。这使得模型在无需严格背景隔离的困难条件下也能保持可用性，部分背景隔离被证明是精度与操作便利性之间的良好折衷。
2.
实现了高精度与强鲁棒性：在最优条件下，模型达到了与精心人工计数相媲美的高精度（R²高达0.96，MAPE低至10%）。更重要的是，其在多样化、非受控的小农环境中的鲁棒性远超现有的先进计数方法，为大规模应用奠定了基础。
3.
突出了背景隔离的重要性：研究量化了不同图像采集协议对精度的影响，为设计用户友好的田间操作指南提供了实证依据。建议使用与浆果颜色对比鲜明、易于获取的材料进行背景部分隔离，以平衡精度与成本。
4.
指明了未来改进方向：当前框架的主要局限在于枝条分割精度，尤其是在无背景隔离时，这主要受限于分割标注数据的规模。未来的工作应持续扩充训练数据，并探索端到端的轻量化模型以实现设备端处理。此外，将分支级计数外推至地块级产量，仍需优化采样方案并纳入植株密度、单果重等转换因子。
5.
具有广泛的产业应用潜力：该方法显著降低了人工计数的劳动强度和主观误差，有助于提高咖啡价值链的透明度、规划效率和金融产品（如保险、信贷）的精准性。它尤其适合资源有限的小农户和需要遵守新兴溯源法规的供应链参与者。

综上所述，这项研究不仅提供了一种创新的技术解决方案，更通过详尽的实地验证和与现有方法的对比，清晰地展示了其在真实世界农业场景中的可行性和优越性，为推动咖啡产业的数字化和可持续发展提供了有力的工具。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号