基于改进Mask R-CNN的多模态深度学习框架:集成土壤剖面图像解析、土壤组识别与有机质定量预测的新方法

【字体: 时间:2026年03月10日 来源:Soil Systems 3.5

编辑推荐:

  本文综述了一种新颖的多模态深度学习框架,其核心在于基于改进的Mask R-CNN架构,实现了端到端的土壤剖面图像解析、土壤组识别与土壤有机质(SOM)同步预测。该研究通过评估三种过渡层标记方案并整合数据增强与迁移学习,有效解决了传统方法在过渡层识别、主观性及小数据集应用上的局限,为高通量、自动化土壤资源评估提供了稳健的技术方案。

  
引言
综合土壤调查需要整合多维度的土壤学信息,包括从土壤发生层的形态学划分、土壤组的分类学鉴定,到土壤有机质(SOM)的定量评估。这些属性共同构成了解释土壤发生过程和指导可持续土壤管理的基础。然而,传统方法受限于专家判断土壤发生层和土壤组的主观性,以及SOM量化实验室分析的耗时性。近来,土壤近端传感器和光学传感设备的发展为快速表征土壤提供了可能,但传统图像识别技术在处理颜色渐变明显的过渡层时常表现出不稳定性,而现有的深度学习模型多为单一任务,且受限于小规模数据集,难以同时精准预测多个相关的土壤属性。为了应对这些挑战,本研究提出了一种基于改进Mask R-CNN架构的新型多模态深度学习框架。
材料与方法
研究区域与土壤剖面
研究区域位于中国安徽省,地处长江中下游过渡带,具有多样的地貌条件。研究共采集了451个土壤剖面样本,采样时间为2021年10月至2022年6月。每个土壤剖面的发生层由专家根据颜色、根系分布、砾石含量、石灰反应强度等视觉标准,以及土壤结构、紧实度和湿度条件等触觉标准进行划分,并进行了拍照记录。土壤剖面图像使用佳能数码相机拍摄,确保高分辨率和一致的视角。土壤组根据中国土壤发生分类(GSCC)进行划分,数据集包含10个不同的土壤组(土类)。
标记方案
研究评估了三种处理过渡层(如AB、AC、BC)的标记方案,以应对其边界模糊、专家划分不一致的问题:
  • 方案1:将过渡层划归到颜色或质地差异占主导的相邻主发生层。
  • 方案2:将过渡层标记为与两个相邻主发生层重叠的区域。
  • 方案3:将过渡层视为独立的类别进行处理,从而产生A、B、C、AB、AC、BC共六个标签。研究证明,方案三取得了最佳的整体性能。
数据增强
为了应对标记数据有限的挑战,研究对原始训练集(从451张图中选出的400张高质量图像)进行了数据增强,将数据集扩展至1200张。增强操作包括亮度调整、高斯噪声添加、随机像素扰动、图像平移和随机翻转,从而增强了模型在各种图像变换条件下识别土壤发生层结构的能力。
改进的Mask R-CNN模型架构
模型基于改进的Mask R-CNN构建。其骨干网络采用ResNet-50,并结合特征金字塔网络(FPN)进行多尺度特征融合,以稳健地表征不同大小的精细分层模式。区域提议网络(RPN)生成可能包含发生层边界的候选区域。除了标准的检测和分割头之外,模型还引入了一个土壤属性分支,用于在图像级别预测土壤属性。该分支处理来自FPN的多尺度特征,通过全局平均池化(GAP)和串联生成一个共享的全局向量,随后通过一个轻量级的多层感知机(MLP)输出两个并行结果:一个用于土壤组分类,另一个用于SOM回归。这个土壤属性分支与检测和分割头共享骨干网络和FPN,通过多任务联合损失函数进行训练。
损失函数
改进Mask R-CNN模型的损失函数包含五个部分:分类损失(Lcls)、边界框回归损失(Lbbox)、掩模分割损失(Lmask)、土壤组分类损失(Lgroup)和SOM回归损失(Lsom)。总损失L是这五项之和。土壤组分类损失采用交叉熵损失函数,SOM回归损失采用均方误差损失函数。这些额外的损失项以可调整的权重被纳入原始Mask R-CNN的多任务损失函数中,从而实现端到端的联合优化。
结果与讨论
模型性能评估
在三种标记方案中,方案三(将过渡层视为独立层)取得了最优的整体性能。具体表现为:发生层划分的准确率(accuracy)= 0.925,召回率(recall)= 0.933,F1分数 = 0.929,分割平均精度(seg-mAP)= 0.918;土壤组分类准确率 = 0.717;SOM预测的R2= 0.565。这些结果证明,将过渡层作为独立层处理能产生更优的分割效果。
研究意义与贡献
本研究的主要贡献有三方面:首先,实现了土壤发生层划分、土壤组识别和SOM预测的端到端联合执行多任务学习策略,利用共享骨干网络提取协同的视觉特征。其次,系统地评估了三种标记方案,验证了将过渡层明确建模为独立层的有效性,从而减少了传统专家划分中固有的模糊性。最后,整合了迁移学习与先进的数据增强技术,确保了在小规模土壤数据集上的鲁棒泛化能力。这种集成方法不仅减轻了人工方法的主观性,还为精准农业和环境监测提供了可扩展的解决方案。
结论
本研究开发的基于改进Mask R-CNN的多模态深度学习框架,成功实现了对土壤剖面图像的自动发生层划分、土壤组分类和SOM含量的同步预测。通过将过渡层作为独立类别处理,并结合数据增强与迁移学习,该框架显著提升了在复杂、小规模土壤数据集上的性能与泛化能力。该集成框架为高通量、自动化的土壤资源评估提供了强大、稳健的工具,有助于推动土壤调查向更客观、高效和全面的方向发展,在土壤科学、精准农业和环境保护领域具有重要的应用前景。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号