在全球人口快速增长、可耕地大幅减少、自然资源逐渐枯竭以及气候变化日益严重的背景下,人类对食物的需求持续增长(Chandio等人,2023年;Parra-López等人,2024年)。为了在有限的土地资源上增加粮食产量,农业生产模式正逐渐从传统方式向现代化方式转变。现代农业通过集成数字技术、传感器技术和空间地理技术等先进技术,促进了自动化和智能化。为了准确计算作物种植面积,一些研究者提出了使用遥感作物图像的语义分割方法(Muruganantham等人,2023年)。尽管这些方法在地形相对规则的平原地区取得了显著成果,但很少有研究关注山区高原地区。高原地区的作物种植环境比平原地区复杂得多,中国的贵州省就是一个典型的例子。
贵州省是中国西南部一个重要的农业区,以高原山脉和喀斯特地貌为特征。部分地区严重的岩石荒漠化导致了独特的农田布局:耕地分散,山地地形中可耕地有限,且坡地耕作比平地更为普遍。这种复杂性不仅体现在不规则的农田形状和碎片化的分布模式上,还体现在同一作物类型由于山脉和丘陵的交织及其阴影效应而产生的显著光谱特征变化上。此外,山区农业的特点——包括小规模种植、混合作物品种、与森林和草地的交错分布以及边界模糊——加上复杂的山脊、道路和建筑物分布,破坏了作物图像的整体结构,从而给遥感作物图像的语义分割带来了巨大挑战。
在传统的遥感作物图像信息提取方法中,视觉解释、基于像素的分类算法、基于图像元素的分类算法和面向对象的分类算法都显示出了一定的实用性。然而,这些方法通常存在效率低下、准确性有限、适应复杂场景变化能力差以及依赖人工干预程度高的问题。随着计算机技术的快速发展,基于深度学习的语义分割算法已在信息科学(Shan等人,2018年)、生物医学(Abhishek等人,2021年)、航空航天(Shafay等人,2020年)和农业(Kim等人,2020年)等多个领域得到成功应用并趋于成熟。深度学习通过模拟人脑的神经网络结构和学习算法,实现了从大规模数据中自动分析和提取特征,为解决复杂问题提供了有效手段。
无人机遥感技术利用安装在无人驾驶飞行器上的遥感仪器,通过航空摄影和遥感获取地面目标信息,为监测和分析地表特征、植被、作物和水质等环境要素提供了有力支持。深度学习在无人机遥感中的应用极大地提升了遥感技术在环境监测(Yuan等人,2021年)、灾害评估(Irwansyah等人,2023年)、土地利用规划(Vali等人,2021年)和作物面积统计(Cué La Rosa等人,2019年)等领域的有效性。通过对深度学习算法的训练和优化,可以显著提高无人机遥感数据的解释和识别能力,这对于自动对象识别和分类至关重要。
然而,将深度学习和遥感技术结合应用于山区作物分割以获取作物种植面积统计仍面临许多挑战。首先,山区复杂的农业环境对作物分割提出了严峻挑战。其次,不同作物类别之间的样本量差异较大,以及背景类别样本占比高,导致模型训练偏差。这导致样本较少的作物类别学习不足,特征不清晰或相似的类别分割性能较差,进而引发过拟合和鲁棒性低下。第三,数据质量差和注释复杂性高可能导致手动注释出现错误、遗漏或不一致,影响模型训练效果和分割精度。第四,现有的成熟高效的语义分割模型通常规模较大,计算复杂度高,需要大量的计算资源和存储空间,难以在无人机和便携式传感器等小型设备上部署。
为了解决这些挑战,本研究旨在开发一种适用于山区农业区域实时作物监测的轻量级语义分割模型,利用无人机遥感图像。具体而言,我们的目标是在中国贵州省复杂的地形条件下,准确分割多种作物(烟草、玉米和某种未明确提及的作物),同时保持适合资源受限平台部署的计算效率。我们的轻量级分割模型为山区环境中的实时作物产量估算和种植面积统计提供了更大的灵活性和可靠的数据支持,从而推动了复杂地形下的精准农业实践。本研究的主要贡献如下:
1. 我们提出了MCS-YOLO,这是一种基于改进的YOLOv8n架构的轻量级作物遥感图像分割模型,集成了多尺度特征融合模块、混合局部通道注意力机制、轻量级特征融合模块和优化的损失函数。该模型在满足资源受限无人机平台的实时分割需求的同时,提高了分割精度。
2. MCS-YOLO模型为解决山区不规则农田图像分割这一难题提供了新方法。以中国贵州省的大麦遥感数据集作为实验数据,验证了该模型在多种作物种类、显著差异和复杂背景条件下的有效性。
3. 我们设计了详细的消融研究、对比实验和可解释性实验,证明了MCS-YOLO在平衡精度和处理速度方面的显著优势。此外,我们还展示了MCS-YOLO在处理山区农业作物图像方面的优越性。
本文的其余部分安排如下:第2节回顾相关工作;第3节详细介绍我们提出的分割模型;第4节描述实验细节和结果,包括大麦遥感数据集、实验环境和结果;第5节提出结论和未来展望。