《Information Processing in Agriculture》:A deep learning framework for extracting extensive farm roads by integrating road geometric structures and dual-temporal information
编辑推荐:
本文针对中分辨率遥感影像中农田道路提取难题,提出了一种双时相分支网络(DTBnet)。该研究通过引入时序交互注意力模块(TIAM)和动态蛇形卷积(DSC)编码器,有效融合了不同作物生长期的遥感影像特征,显著提升了农田道路网络的提取精度与连通性。在自制数据集及多个公开数据集上的实验表明,该方法在F1分数等关键指标上优于现有主流模型,为实现大范围、高效的农田基础设施评估提供了可靠的技术支持。
在广袤的农田中,纵横交错的田间道路如同血脉一般,连接着村庄与田地,支撑着农业生产资料运输、农机作业和作物收成的生命线。这些被称为农田道路(包括田埂和田间生产路)的特殊通道,相较于普通道路,通常更为狭窄、分支更多,且其可见性深受农作物不同生长阶段的影响。春季,作物初长,道路尚可辨认;到了夏季,茂盛的作物可能将道路完全遮蔽;而秋季收获后,道路特征再次显现。这种随季节变化的“捉迷藏”特性,使得及时、准确地从遥感影像中提取农田道路网络变得至关重要,它不仅可用于评估区域农田设施建设水平,还能为农机路径规划、提升农业生产效率提供关键依据。
然而,传统的道路提取方法在面对农田道路时遇到了巨大挑战。现有研究多集中于高分辨率(<2米)遥感影像上的通用道路提取,虽然能清晰描绘道路特征,但存在覆盖范围有限、实时性差、成本高等问题,难以满足大范围农田道路提取的应用需求。相比之下,中分辨率数据(如10米的Sentinel-2数据)具有覆盖广、成本低、更新快等显著优势,尽管细节有限,但农田道路与周围环境在光谱上的差异确保了其即使在中分辨率数据中仍具可识别性。另一个核心难题是时间变异性。农田道路在不同时相的特征差异显著,受人类管理或农业生产周期的影响,其物理特征和外观会发生明显变化,这种复杂的时空动态使得使用单时相数据难以实现全面、精确的道路提取。
为了攻克这些难题,发表在《Information Processing in Agriculture》上的这项研究,提出了一种创新的深度学习框架——双时相分支网络(Dual-Temporal Branch Net, DTBnet),用于从中分辨率双时相遥感影像中大规模提取农田道路。该研究巧妙地利用作物生长周期内两个关键时期(4-6月植被出苗生长期和8-10月植被开花结果期)的Sentinel-2影像,设计了一个双分支网络结构。两个分支分别处理不同时相的影像,通过新设计的时序交互注意力模块(Temporal Interactive Attention Module, TIAM)深度融合不同时相的特征,利用动态蛇形卷积(Dynamic Snake Convolution, DSC)编码器更好地捕捉道路的细长几何特征,并引入了U结构优化模块(U-structure Optimization Module, UOM)和改进的间隙损失函数(Improved Gap Loss)来优化提取结果,重点关注道路连接处的完整性。
关键技术方法概述
研究构建了包含中国东北地区21个数据采集区的双时相农田道路数据集(共544组512x512图像及标签,按4:1划分为训练集和测试集)。DTBnet模型的核心在于其双分支架构,每个分支使用DSC编码器提取特征。浅层特征通过提出的时序特征注意力模块(TFAM)融合,深层特征则通过更复杂的TIAM进行交互。解码器末端加入UOM对初步结果进行优化。损失函数结合了Dice Loss和改进的Gap Loss,后者通过放大道路断点和交叉点处的交叉熵损失,有效提升道路连通性。模型在自建数据集以及DeepGlobe Road、WHU RUR+、FUSU等公开数据集上进行了验证。
研究结果
2.1. 双时相道路数据集上的比较
在自制双时相数据集上,DTBnet的Buffer IoU达到0.646,F1分数达到0.806,Recall为0.698,长度准确率为0.777,各项指标均优于U-Net、DeeplabV3、D-LinkNet、SGCNet、NL-LinkNet和ResUnetFormer等对比模型。DTBnet预测的道路连通性明显优于其他模型,其预测偏差更倾向于漏提而非错提,这与Gap Loss函数放大断点处损失,使模型预测更为严格有关。
2.2. 在其他道路数据集上的比较
在DeepGlobe Road单时相数据集上,DTBnet(通过将同一RGB图像输入两个分支进行训练)的IoU为0.678,F1分数为0.799,Recall为0.810,表现优异。在WHU RUR+农村道路数据集上,DTBnet的IoU为0.602,F1分数为0.590,显示其在不同类型乡村道路上的适用性。在包含双时相数据的FUSU数据集上,DTBnet的优势更为明显,IoU达到0.641,Precision为0.838,F1分数为0.778,显著领先于对比模型,证明其结构特别适合处理双时相数据。
2.3. 单时相与多时相图像比较
通过比较水田和旱地两种农田类型在不同时相(4-6月、6-8月、8-10月、10-12月)及双时相组合(4-6月 & 8-10月)下的提取精度,发现双时相组合(水田:Buffer IoU 0.674, F1 0.863;旱地:Buffer IoU 0.637, F1 0.744)始终优于任何单时相数据。6-8月是旱地道路提取最差的时期,因作物覆盖度最高;10-12月是水田道路提取最差的时期,因收割机作业产生易误判的线性纹理。水田道路的提取精度普遍高于旱地,归因于水田道路结构更规则、使用更频繁、地形更平坦、作物更矮不易遮蔽道路。
2.4. DTBnet在大范围农田道路提取中的应用
将DTBnet应用于中国东北地区(约121°11′E-135°05′E, 43°26′N-53°33′N)的大范围农田道路提取,结果证明了该方法在数据成本和模型性能上的优势,能够高效、准确地提取大范围的农田道路网络,为农业管理和规划提供了有力工具。
2.5. 消融实验
消融实验验证了各模块的有效性:TIAM显著提升了模型判别能力(Precision从0.826升至0.951);UOM以少量参数增加了Recall;DSC-Encoder通过可变形卷积核更好地拟合道路结构,获得最高Precision(0.953)。三者结合达到最佳性能(F1 0.806)。实验还表明,将TIAM置于编码器最深层(Encoder 5)效果最好。在损失函数对比中,改进的Gap Loss结合Dice Loss表现最佳。
结论与讨论
本研究提出的DTBnet模型,通过创新性地融合双时相遥感信息、引入针对道路几何特征的DSC编码器和TIAM模块,以及优化损失函数,成功实现了基于中分辨率遥感影像的大范围、高精度农田道路提取。该研究的意义在于:其一,证明了利用免费、易得的Sentinel-2中分辨率双时相数据可以有效提取细微的农田道路,降低了大规模应用的数据成本;其二,所提模型架构和模块针对农田道路的特点进行了优化,在连通性、完整性方面表现突出;其三,在大范围应用实验中验证了方法的可行性和有效性,为农田道路网络的动态监测、农业设施评估、农机路径规划等实际应用提供了重要的技术手段。
未来研究可考虑融合地形(DEM)信息以改善山区道路提取,并针对水稻田收割后易产生干扰纹理的问题,增加相关样本以提升模型在特定区域的鲁棒性。该研究为利用遥感技术高效管理农田基础设施提供了新的思路和解决方案。