基于无人机系统的表型分析程序研发与部署:支持大豆育种成熟度评估

《The Plant Phenome Journal》:Developing and deploying an unmanned aerial system–based phenotyping program for maturity to support soybean breeding

【字体: 时间:2026年03月13日 来源:The Plant Phenome Journal CS5

编辑推荐:

  本综述(研究性论文,非综述文章)介绍了一款名为“Matti”的高通量表型(HTP)分析程序,旨在利用无人机系统(UAS)遥感数据,通过追踪冠层绿度指数(GLI)在衰老期的变化,实现对大豆成熟度的准确、实时评估。该QGIS插件结合分段(piecewise)和局部多项式(LOESS)回归模型,为大豆育种项目(特别是美国东南部晚熟、有限性生长习性品系)提供了一种直观、可访问且精准的成熟度测定工具,能够显著减少人工记录的劳动强度和主观误差,有助于大规模筛选和评价育种品系。

  
1 引言
大豆是一种短日照光周期敏感植物,其生殖发育由黑夜长度超过特定阈值引发。大豆品种根据相对成熟度组(MG)进行分类,对应于品种最适应的近似区域,在美国和加拿大,目前定义了从000到X的13个MG区域。对于种植者,成熟度是决定种植品种的关键性状;对于育种家,则是作为比较基因型的协变量。传统的视觉成熟度记录耗时、费力且易受人为错误和主观性影响。因此,开发高效、准确的成熟度表型分析方法对大豆育种至关重要。
先前研究已探索利用无人机系统(UAS)进行高通量表型(HTP)分析,通过大豆田块的光谱数据估算成熟日期。已有方法包括使用随机森林模型分类、通过绿度指数(GLI)时间序列跟踪衰老期绿度衰减、以及使用偏最小二乘回归模型等。然而,现有方法大多在衰老期结束后回溯性估算成熟度,或需要同年种植的材料进行模型训练,且目前尚无公开的、便于大豆育种项目实施的、能在生长季进行实时估算的程序。此外,针对美国东南部种植的晚熟(MG VI-VIII)、有限性生长习性大豆品系的评估尚未见报道。东南部气候(基本无霜冻、高湿度持续时间长)带来了独特挑战。因此,本研究旨在开发一款直观、可访问且精准的HTP程序,用于田间大豆品种成熟度测定,并可直接部署于大豆育种项目。
2 材料与方法
2.1 植物材料
研究使用了两种材料集。第一种是早期世代材料,包括数千个F4或F5衍生的单行,成熟度以3-4天为一个日期块记录。第二种是高级育种材料,包括乔治亚大学(UGA)大豆育种项目的初步产量试验(PYT)、高级产量试验(AYT)以及乔治亚州品种测试(SVT)的品系,为多行小区。所有材料均种植在乔治亚州雅典附近,主要为有限性生长习性的MG VI-VIII品系。此外,还使用了由Volpato等人公开的、美国明尼苏达州(MN)的MG 0-II(无限性生长习性)育种材料的航空影像数据进行验证。地面真实成熟度定义为当特定田块中至少95%的豆荚呈现棕色或棕褐色成熟颜色时记录。
2.2 航空影像
使用多款消费级无人机(如DJI Phantom 4 Pro, Autel Evo II, DJI Mavic 3 M)在衰老期(主要在每年10月)采集RGB航空影像。飞行高度36.6米,图像地面分辨率约1厘米/像素。产量试验约每2-3天飞行一次,单行材料约每周飞行一次,频率与人工记录频率相对应。使用地面控制点(GCP)和RTK GNSS接收器进行地理校正(2021年除外)。使用Pix4Dmapper生成正射影像,并在QGIS中利用“SHP Buddy”插件生成整合了田间记录信息的小区矢量文件。
2.3 绿度指数
绿度指数(GLI)的计算公式为:(2G - R - B) / (2G + R + B),其值范围在-1到1之间,负值通常对应非植被影像。基于雅典产量试验小区在记录成熟日期的平均GLI值范围(0.002-0.046),本研究将GLI阈值设定为0.01,用于关联衰老水平与成熟状态。
2.4 “Matti”插件
研究团队开发了一款名为“Matti”的QGIS插件程序。该插件使用Python和PyQGIS库编写,部分代码在ChatGPT(GPT-4)的协助下完成。用户界面通过Qt Designer设计。Matti的核心创新在于能够跟踪衰老期GLI的变化,在生长季持续提供实时成熟度估算,而非仅事后回溯计算。
用户只需在包含最新正射影像和小区矢量文件的QGIS项目中运行Matti。首次运行后,程序会自动生成记录每个小区GLI时间序列的CSV文件。详细的安装、界面说明和工作流程可在GitHub仓库页面找到。
2.5 成熟度估算算法
Matti的算法流程如文档中图示所示。首先,评估每个小区的GLI时间序列,扫描其值是否低于用户定义的GLI阈值(默认0.01)。对于符合条件的田块,根据时间序列中已有的数据点数量采用不同策略估算成熟日期:若第一个点即低于阈值,则使用该影像日期作为成熟日期;若有2-4个点,则使用线性回归;若有5个或更多点,则使用局部加权回归(LOESS)模型进行插值。一旦某小区被估算出成熟日期,便从后续运行中排除。
对于GLI值接近阈值(例如低于0.1,表明可能正在衰老)的小区,Matti会尝试进行短期预测。它使用piecewise_regressionPython包,将GLI值拟合为关于天数的分段回归模型。当有4个数据点时拟合一个断点模型,有7个或更多点时拟合两个断点模型。这些阈值作为质量控制检查,以减少过拟合。程序提取具有负斜率且终点低于0.1的线段的方程,用于估算GLI达到阈值所需的天数,从而预测成熟日期。预测窗口通常设定为最近影像日期后的3天内。在生长季最后一次飞行时,若小区仍未获得估算,则使用最陡负斜率线段进行外推,有效预测窗口延长至最后一次飞行日期后的7天内。
算法还提供了“按日期块”模式,以适应飞行频率较低(如每周一次)的早期世代材料评级系统,并将最终估算转换为用户定义的成熟度日程表中的对应日期块。
2.6 验证
通过计算每个品系(entry)的平均观测成熟日期(MDobs)和平均估算成熟日期(MDest),并计算两者之间的斯皮尔曼(Spearman)相关系数来评估性能。斯皮尔曼相关系数更能反映育种家关心的品系间相对成熟度的单调关系。同时,计算了估算日期在观测日期±3天(产量试验)或±1个日期块(单行材料)内的准确度比例。此外,还通过方差分析估算了基因型方差和残差方差,并计算了MDobs和MDest的广义遗传力,以比较两种方法在识别基因型间成熟度差异方面的能力。
3 结果与讨论
3.1 估算与观测成熟日期的比较
Matti能够为各年份材料集中98.3%–100%的小区提供成熟度估算。对于所有年份和地点的所有植物材料,MDest与MDobs均呈现中度至强相关。
  • 雅典产量试验:斯皮尔曼相关系数范围为r = 0.52 至 0.89。2023和2024年的估算与观测值拟合线最接近1:1线,表明估算能较好反映实际值。2021年相关性尚可,但拟合线偏离1:1线,可能与当年“青秆”(叶片未衰老荚果已成熟)现象较多有关。2022年相关性最弱,可能与当年10月发生的多次早霜事件有关,这些事件导致成熟表型突然、广泛出现。
  • 雅典单行材料:相关性(r = 0.43–0.72)普遍低于同年的产量试验。这可能是由于单行小区易受相邻冠层(特别是成熟度不同的)入侵影响遥感测量,以及较低的飞行频率(每周一次)导致数据点稀疏,影响了衰老曲线估算的精度。此外,单行材料的人工记录本身可能精确度较低。
  • 明尼苏达(MN)材料:MDest表现出最一致的高相关性(r = 0.83–0.97),且拟合线紧密围绕1:1线。其相关性强度与原始研究(Volpato等,2021)中报道的结果几乎相同,验证了Matti算法在早期MG无限性生长习性材料上的有效性和准确性。
3.2 估算成熟日期的准确度
将MDest在MDobs±3天(产量试验)或±1个日期块(单行材料)范围内视为准确。在所有年份和材料中,估算残差的分布均接近正态分布。
  • 雅典产量试验:准确度在48.5%到77.9%之间,与相关性强度呈正相关关系。尽管不同年份准确度有差异,但残差的标准差相近(3.0-3.6),表明GLI作为成熟度指示指标在不同年份间虽有一定波动,但仍可用于有效评估相对成熟度。
  • 雅典单行材料:所有材料的准确度在27.4%到74.2%之间,与相关性趋势一致。
  • 明尼苏达材料:准确度在33.8%到91.1%之间变化,其中相关性最强的三个地点-年份组合准确度均超过80%。
3.3 成熟度估算的实用性
Matti的关键新颖之处在于能像人工记录一样,在生长季提供“当天”的成熟度估算。导致成熟度估算的影像日期分布,与观测成熟度的分布在很大程度上重叠。Matti通常能在至少50%的小区被记录地面真实成熟度之前,估算出至少50%小区的成熟度,这种趋势体现了Matti在接近实际成熟日期时进行短期预测的能力。估算日期与观测日期的累积分布曲线在多数年份紧密跟随,表明基于GLI可以在同一天内以相似的精度估算大豆成熟度。
此外,MDest和MDobs的变异系数(CV)分布在各年份内相似,表明Matti的估算在很大程度上捕捉到了品系内的成熟度差异。MDest和MDobs的广义遗传力在多数试验中也表现相当,甚至在某些情况下估算值的遗传力更高,说明Matti估算在识别基因型间成熟度差异方面与人工观测具有可比性。
3.4 影响准确度的因素
通过对雅典产量试验中的异常值(残差异常大)进行分析,确定了导致估算误差的几个主要因素:
  1. 1.
    青秆:是导致59%异常值的唯一原因,均造成晚估。从航空影像看,青秆植株冠层正常,其衰老曲线与实际荚果成熟脱节。
  2. 2.
    相邻冠层干扰:导致13%的异常值,均造成晚估。相邻晚熟冠层的绿色叶片的遮挡,会抬高被侵入小区的GLI值。
  3. 3.
    过早落叶:如虫害导致叶片在荚果成熟前脱落,造成12%的异常值,均导致晚估。
  4. 4.
    其他因素:包括小区内成熟度不均一、杂草存在,以及早期成熟小区GLI值在阈值之上进入平台期等。后者可通过在最早熟材料开始衰老前启动无人机飞行来缓解。
需要注意的是,地面真实数据本身也存在因评级人员经验差异、判断主观性或日期插值带来的人力误差。Matti程序在很大程度上减少了人为错误和主观性的机会,并且保存的影像记录允许对疑似异常值进行回溯检查。
3.5 成熟度表型分析的进展
Matti是首个公开可用的、能在生长季持续测定大豆成熟度的HTP方法。它与Narayanan等人和Volpato等人的方法相似,都利用GLI跟踪冠层衰老,但区别在于Matti在每次飞行后监控每个小区时间序列接近阈值的程度,并通过拟合的分段回归模型进行预测,而非依赖于完整的、包含明确衰老阶段的曲线。
本研究也是首个同时评估了有限性无限性生长习性大豆品系成熟度估算的研究。针对美国东南部有限性品系的估算相关性和准确度低于中西部无限性品系,可能与东南部衰老期更潮湿的气候导致叶片衰老完成与荚果成熟之间的脱节更常见有关。尽管如此,结果表明通过GLI跟踪叶片衰老足以区分有限性大豆品系的相对成熟度。
此外,本研究首次开发了能适应替代评级系统(如用于单行材料的日期块系统)的HTP大豆成熟度估算程序。
3.6 Matti在应用育种项目中的部署
Matti原生运行于QGIS中,这是农业研究中用于查看和分析田间正射影像及小区矢量文件的流行开源软件。它可直接在QGIS中安装和运行,无需编码或命令行知识,使得不同计算技能水平的研究人员都能轻松使用。目前,Matti是QGIS上唯一能够为任何作物提供及时成熟度估算的插件。未来研究可评估Matti在其他衰老通常与成熟度相对应的作物上的效用。
Matti能够适应不同的无人机平台和相机,本研究中三款不同无人机在2021、2023和2024年都取得了高相关性,证明了其鲁棒性。
基于研究结果,作者建议每周飞行两到三次足以获得精确的相对成熟度估算。建议在最早期成熟小区开始衰老前开始飞行,以充分捕捉衰老阶段。对于早期世代材料,建议将飞行频率提高到与每周日期块数量相同,以增加用于拟合线性模型的数据点分辨率。
4 结论
Matti为大豆育种项目提供了一种方便、精准的方法,用于在田间品系成熟时估算其成熟度。通过监控每个小区GLI时间序列是否低于预定阈值,或通过外推拟合的分段回归模型的衰老阶段线段生成短期预测,实现了实时估算。在所有植物材料和环境中,各品系的平均估算成熟度与观测成熟度之间呈现中度至强相关。导致估算的影像日期分布普遍遵循观测成熟度的分布,表明估算是及时的。当在一个公开的早期MG无限性材料数据集上验证时,Matti达到了与基于完整衰老曲线估算相似的相关性。这一验证,加上本研究中对晚MG有限性材料的评估结果,表明Matti在估算无限性和有限性大豆品系的成熟度方面均具有实用价值。它是一款开源QGIS插件,可通过QGIS插件仓库和GitHub免费获取、使用和修改。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号