《The Plant Phenome Journal》:Assessing robustness and transferability of image-based semantic segmentation models for major field crops
编辑推荐:
植物育种是实现作物改良的核心途径,但其进展常受限于田间表型鉴定方法效率低、劳动强度大且主观性强的问题。基于机器学习的高通量表型(High-Throughput Phenotyping, HTP)技术为突破这一瓶颈提供了可能,然而在分析同一作物内不同基因型及跨越
植物育种是实现作物改良的核心途径,但其进展常受限于田间表型鉴定方法效率低、劳动强度大且主观性强的问题。基于机器学习的高通量表型(High-Throughput Phenotyping, HTP)技术为突破这一瓶颈提供了可能,然而在分析同一作物内不同基因型及跨越生殖发育阶段时,模型的鲁棒性与泛化能力仍面临严峻挑战,直接影响性能表现与表型特征的精准提取。本研究以玉米(Zea mays L.)、高粱(Sorghum bicolor L.)和小麦(Triticum aestivum L.)为研究对象,系统评估了语义分割模型在不同基因型组合及特定作物生殖生长阶段下的表现。研究目标包括:(i)分析各作物聚合数据集上的整体预测性能;(ii)按基因型与采集日期分层评估性能差异;(iii)评估模型在跨越生育阶段与未见基因型时的时空与基因型可迁移性。研究人员利用四款智能手机相机,采集了涵盖160份玉米、80份高粱和40份小麦基因型的生殖结构图像,总计玉米3840张、高粱4000张、小麦2000张。测试了DeepLabv3+、MaskFormer、SegFormer、SegNet和U-Net五种语义分割模型。结果显示,SegFormer模型在玉米(交并比,Intersection over Union, IoU 0.90)和高粱(IoU 0.92)上表现最优,而U-Net模型在小麦(IoU 0.89)上表现最佳。模型在不同基因型间测试时性能仅有轻微下降(IoU差异最高达0.1),但在跨生育阶段训练与推理时,时间可迁移性显著下降,IoU降幅可达0.5。这种性能变化的主要原因可能是模型在跨生育阶段迁移时,训练集与测试集之间存在的自然颜色与器官构型的时间动态差异。研究结果强调了在开发可靠田间高通量表型方法时,亟需优先考虑模型的鲁棒性与可迁移性。
该研究发表于《The Plant Phenome Journal》。全球人口持续增长与气候波动对粮食安全构成严重威胁,加速培育高产且抗逆的作物品种迫在眉睫。植物育种虽是关键手段,但传统田间表型鉴定过程耗时费力且主观性强,成为限制育种效率的瓶颈。基于机器学习的高通量表型技术虽展现出巨大潜力,但现有模型多关注单一数据集上的高指标,忽视了在不同基因型、不同生育阶段及复杂田间环境下的泛化能力,导致模型往往停留在概念验证阶段,难以真正应用于田间实战。
研究人员针对玉米、高粱和小麦三种主要大田作物,构建了包含不同基因型与多个生育期的田间图像数据库。关键技术方法如下:研究人员于2025年生长季在美国普渡大学农学研究中心采集数据,涵盖160份玉米、80份高粱和40份小麦基因型,利用四款不同品牌智能手机在自然条件下重复拍摄生殖结构图像,共获得9840张图像。采用Segment Anything Model 2生成初始掩膜并进行人工校正。选取U-Net、DeepLabv3+、SegNet、SegFormer及MaskFormer五种模型,在不使用预训练权重的前提下从零开始训练。通过计算交并比(IoU)、精确率、召回率及F1分数评估性能,并利用变异系数(Coefficient of Variation, CV)量化稳定性。通过设置跨基因型与跨生育期的特异性训练-测试策略,系统评估了模型的鲁棒性与迁移能力。统计分析采用方差分析(ANOVA)与t检验。
研究结果如下:
3.1 聚合数据集性能
在汇总所有数据后,SegFormer在玉米(IoU 0.90)和高粱(IoU 0.92)上取得了最高的精度与最低的变异系数,表现出最佳的综合性。U-Net则在小麦上表现最优(IoU 0.89)。统计分析表明,基因型、采集日期及其交互作用均对IoU值有显著影响。
3.2 基于基因型与采集日期的分层性能
模型性能在不同基因型间存在显著差异。玉米基因型间最大IoU差距达0.10,高粱达0.11,小麦达0.09。对于高粱,紧凑穗型比松散穗型表现更好;对于小麦,无芒品种优于有芒品种;而玉米的基因型间视觉差异不明显。相比之下,模型在不同采集日期间的性能波动较小。
3.3 跨采集日期的时间可迁移性
当模型仅在单一生育期数据上训练并应用于其他时期时,性能大幅下降。玉米的时间迁移能力最差,最大IoU损失可达0.6;小麦次之,最大损失约0.53;高粱表现最为稳健,即使跨期推理,IoU波动也控制在0.1以内。这表明仅使用单一阶段的图像训练无法满足全生育期监测的需求。
3.4 面向未见基因型的基因型可迁移性
玉米因生殖器官形态均一,模型在不同基因型子集间迁移时性能几乎无损失。高粱和小麦则表现出不对称的迁移特性:在具有复杂特征(如开放穗型或长芒)的基因型上训练的模型,迁移到简单特征基因型时性能提升;反之则性能显著下降,证明了形态特征复杂性对模型泛化的影响。
讨论部分指出,尽管聚合数据上的指标令人满意,但忽视基因型与生育期异质性会导致严重的性能误判。高粱模型之所以在时间迁移上表现优异,可能归功于其基因型间的颜色与结构多样性增强了模型的特征捕捉能力。此外,研究未使用预训练权重,避免了外部数据带来的偏差,确保了结果的可比性。这些发现表明,未来的田间表型工作必须纳入形态感知的数据集平衡策略,并在训练中包含足够的生育期多样性。
结论部分总结道,本研究系统评估了五种语义分割模型在田间复杂条件下对玉米果穗、高粱穗与小麦穗的分割鲁棒性与可迁移性。SegFormer与U-Net分别在禾本科作物与小麦中表现最佳。基因型多样性对模型影响各异,高粱与小麦受器官构型影响显著,而玉米相对稳定。时间可迁移性在高粱中表现良好,而在玉米和小麦中受限。基因型迁移呈现出从复杂特征向简单特征迁移的增益效应。该研究建立的影像数据库为未来高通量表型研究奠定了基础,并强调在开发可靠田间表型流程时,必须超越聚合指标,充分考虑表型与时间变异性。