全球农业正在向自动化和智能系统转型(Lezoche等人,2020年;Misra等人,2020年;Sharma等人,2022年),这一趋势主要受到劳动力短缺加剧、生产成本上升以及对可持续农业实践迫切需求的影响(Oliveira等人,2021年;Cheng等人,2023年;Getahun等人,2024年)。在这一背景下,以水果和蔬菜为代表的园艺生产因其高劳动强度和重要的经济价值而成为自动化技术的重点应用领域。在水果和蔬菜生产中,尤其是对于苹果等高价值作物而言,收割是一个典型的劳动密集型操作。因此,迫切需要能够替代人工劳动的自动化系统(Zhang等人,2020年;Zhang等人,2024年;Huang等人,2024年)。为了进一步提高自动化效率,将自主收割机器人的操作窗口扩展到夜间条件——从而实现全天候自主作业——已成为该领域的发展趋势(Tang等人,2023年;Hou等人,2023年)。这一研究方向不仅使得24小时连续作业成为可能,还有助于减轻白天高温对果实质量和机器性能的不利影响,同时提高了对动态农业调度需求的适应性。
然而,将操作扩展到夜间条件带来了相当大的技术挑战。自主收割机器人严重依赖视觉系统进行精确的果实检测和定位,但在夜间或低光照条件下,图像质量会急剧下降。传感器捕捉到的图像通常具有对比度低、颜色失真、信噪比低和细节模糊等问题(Tang等人,2023年;Shi等人,2025年)。这种视觉质量的下降直接削弱了现有检测算法的鲁棒性和准确性,导致检测遗漏或定位错误,从而阻碍了自动化收割系统在全天候场景中的可靠部署。因此,开发一种能够在农业环境中有效处理低光照条件的图像增强技术对于充分发挥自主收割系统的潜力并实现真正的全天候智能操作至关重要。
尽管近年来在夜间农业作物视觉感知方面付出了大量努力,以提高在低光照条件下的果实检测和定位的鲁棒性和准确性,但仍存在一些挑战。首先,传统的物理先验和经典增强方法对光照变化非常敏感,且缺乏实时性能(Linker和Kelman,2015年;Liu等人,2016年;J. Wei等人,2018年)。因此,当夜间果园光照波动、噪声增加以及纹理变弱时,这些方法难以稳定地恢复对检测至关重要的结构和细节信息。
其次,深度学习方法——特别是YOLO系列——在夜间检测性能上有了显著提升;例如,YOLOv4实现了昼夜检测(Mirhaji等人,2021年),而YOLOv3结合U-Net则支持联合检测(Liang等人,2020年)。然而,在实际田间条件下,如极低光照、复杂背景干扰和密集果实重叠/遮挡的情况下,它们的鲁棒性和适应性仍有待提高,这常常导致细节丢失、边界模糊以及检测和定位错误增加。
第三,为了克服这些限制,最近的研究转向了Transformer和生成模型:前者利用全局依赖性来处理模糊的夜间图像(Wang等人,2024年;Sun等人,2022年),后者(如CycleGAN,Wu等人,2024年)用于数据增强和减少光照偏差。然而,这些努力通常只解决孤立的问题,缺乏一个能够同时优化全局亮度、局部纹理、颜色一致性和实际夜间果园效率约束的集成框架。因此,在复杂光照和密集果实场景下,同时实现高增强质量、忠实细节保留和检测性能提升仍然具有挑战性。
为了解决上述挑战,本研究专注于夜间苹果树,并提出了一种基于生成扩散的框架,专门用于增强夜间果园图像。该方法旨在改善低光照条件下的果实感知的视觉质量和鲁棒性。为了支持模型开发和评估,我们通过合成低光照图像构建了一个数据集,这些图像模拟了夜间条件下的果园情况。基于该数据集,模型采用了U-Net框架,并在瓶颈处加入了Transformer模块以捕捉全局依赖性。进一步集成了卷积块注意力机制(CBAM),通过强调果实和树枝-叶子的细节来增强特征表示,同时抑制低光照图像中的背景干扰。此外,还采用了基于金字塔的分辨率采样策略:低分辨率阶段模型处理全局亮度,而高分辨率阶段恢复局部纹理细节,从而平衡了实时效率和增强质量。最后,应用了全局校正模块来补偿低光照苹果树图像中的颜色偏移。
一系列系统实验验证了所提出方法的有效性和优越性。在定量和定性评估中,该模型在三个图像质量指标上均取得了最佳性能。在测试的调度策略中,配置[1,1,2,2]几乎保持了与基线[1,1,1,1]相同的图像质量,同时将推理速度提高了约65%,从而在性能和计算效率之间实现了最佳平衡。最后,在苹果树图像检测任务中,增强后的性能显著提升:应用于YOLOv13时,mAP50达到了0.627,mAP50–95达到了0.352。这些结果证明了所提出框架在夜间果园自动化收割中的实际价值。
总结来说,本研究的主要贡献如下:
- 我们构建了一个夜间苹果果园场景的低光照-正常曝光配对数据集,并通过亮度和噪声的统计分析确认其分布与真实夜间图像一致。
- 我们提出了一种基于金字塔的条件扩散框架,结合了基于Transformer的全局建模和基于CBAM的局部增强,实现了全局光照一致性和局部细节恢复的联合优化。
- 系统性的消融研究和下游检测实验表明,增强后的图像在物体检测性能上有了显著提升,凸显了该方法在夜间自动化收割中的实际价值。