《Smart Agricultural Technology》:Aerial-Ground Integrated High-Throughput Phenotyping: A Novel Pipeline for Efficient Elite Individual Selection and Accelerated Genetic Gain in Larix olgensis
编辑推荐:
通过高效遗传选择和林木育种提高人工林的生产力和质量,对于加速现代林业的遗传增益至关重要。高通量表型分析(High-throughput phenotyping)是育种计划中遗传选择的基础,能够实现最大的遗传增益并提高选择精度。然而,在高冠层密度、成熟的林分中,
通过高效遗传选择和林木育种提高人工林的生产力和质量,对于加速现代林业的遗传增益至关重要。高通量表型分析(High-throughput phenotyping)是育种计划中遗传选择的基础,能够实现最大的遗传增益并提高选择精度。然而,在高冠层密度、成熟的林分中,现有模型存在严重的分割错误和光学指数饱和问题,且缺乏标准化的高通量工作流程来衔接性状获取与精英个体选择。在此研究中,研究人员建立了一个多源表型分析流程,通过开发名为DeepTree的定制化单木分割算法,突破了这些瓶颈,该算法在密集林分中实现了轻量级效率与高检测精度之间的最优平衡。研究人员调查了来自三个种源(小北湖、穆棱和江山娇)的近40年生黄花落叶松(Larix olgensis)种群,并应用DeepTree划分单木树冠(ITCD)并提取关键的结构表型性状。这些表型数据进一步用于估算广义遗传力(Heritability)、最佳线性无偏预测(BLUP)育种值和精英无性系选择的遗传增益。结果表明,估算的树高、胸径(DBH)、冠幅直径和冠面积与实地测量值表现出强一致性,R2分别为0.95、0.92、0.84和0.84。研究人员发现穆棱种源更适合精英无性系选择,树高排名前五的无性系(466, 456, 675, 645, 517)和冠面积排名前五的无性系(709, 494, 635, 526, 766)表现出明显的变异。这凸显了整合多性状指标和多种遗传参数进行综合评估的必要性。本研究介绍了一种新颖且鲁棒的单木分割工具(DeepTree),并建立了一个由基于高通量表型分析的多模态空地数据驱动的、便于育种者使用的遗传选择流程,用于精英个体选择。该研究在未来为提高林木育种中的遗传增益提供了有效的解决方案。
研究背景与意义
提高人工林的生产力和质量是现代林业的首要目标,而通过高效的遗传选择和育种来加速遗传增益(Genetic gain)则是实现这一目标的关键。传统的表型性状测量主要依赖人工,耗时费力且难以大规模应用,限制了遗传变异的捕获和育种效率的提升。此外,在成熟、高郁闭度的林分中,现有的单木树冠勾绘(Individual Tree Crown Delineation, ITCD)模型面临严重的分割错误、光学指数饱和以及缺乏标准化高通量(High-throughput)工作流程等问题,阻碍了精准的精英个体筛选。为此,研究人员以具有重要经济和生态价值的黄花落叶松(Larix olgensis)为对象,开展了一项集成空天地多源数据与深度学习技术的研究,旨在建立一套从表型性状高效提取到遗传分析的完整流程,以实现林木育种的精准化和加速化。该论文发表在《Smart Agricultural Technology》。
主要关键技术方法
研究人员在黑龙江青山林场选取了近40年生的黄花落叶松(Larix olgensis)种源试验林(包括小北湖、穆棱和江山娇三个种源)作为样本队列。技术上,利用搭载Zenmuse L1传感器的无人机(UAV)挂载激光雷达(LiDAR)获取点云以生成冠层高度模型(CHM),同时利用Phantom 4 RTK获取高分辨率RGB影像并制作数字正射影像(DOM);地面使用手持LiDAR(LiGrip H300)获取胸径(DBH)数据。核心算法方面,研究人员基于Mask R-CNN框架改进提出了DeepTree模型,采用MobileNetV3轻量级主干网络、神经架构搜索特征金字塔网络(NAS-FPN)和Cascade RoI Head,以实现密集林分中高精度的ITCD。随后,整合分割结果与CHM提取树高、冠幅等性状,并基于线性混合模型计算广义遗传力(H2)、最佳线性无偏预测(BLUP)育种值及遗传增益,从而进行精英无性系(Clone)选择。
研究结果
3.1 基于DeepTree的单木树冠勾绘结果
研究人员利用DeepTree模型结合高分辨率RGB影像与CHM进行ITCD,模型能有效捕捉单木实际形态,尤其在形状不规则或重叠的树冠中表现出精确的勾绘能力。在验证数据集中,模型的边界框平均精度均值(bbox mAP)达53.30%,分割掩膜平均精度均值(segm mAP)达52.20%,精确率为90.30%,召回率为78.30%。在Zone 48区域,整体检测准确率为84.81%;在跨种源验证的Zone 54区域,检测率高达93.70%,证明了模型具有较强的泛化能力。
3.2 消融研究结果
研究人员设计了四组消融实验以验证各模块的贡献。结果显示,标准的Mask R-CNN基线模型计算量大(249.88 GFLOPs)。仅替换轻量级前端(Light M-RCNN)大幅提升了精度并降低了计算负载(10.58 GFLOPs)。仅引入Cascade RoI Head反而增加了复杂度且降低了分割精度。最终的DeepTree模型(结合轻量级前端与级联检测头)取得了最优综合性能,bbox mAP达0.53,segm mAP达0.52,同时将计算负载降低了约92.98%,参数数量减少了59.11%。
3.3 表型性状提取结果评估
研究人员将多源传感器提取的表型性状与实测值进行对比验证。树高(基于UAV LiDAR)与实测值高度相关(R2=0.95,RMSE=0.60 m);胸径(DBH,基于手持LiDAR)的R2达0.92,RMSE为0.01 m;冠幅直径和冠面积的R2均为0.84,RMSE分别为0.48 m和3.09 m2。这表明多源传感器与图像分析方法在单木水平关键性状的高通量提取上具有可靠性。
3.4 基于多源传感器的表型性状统计
描述性统计显示,不同种源(小北湖、穆棱、江山娇)的性状均值相似,但穆棱种源的变异程度稍高,尤其是冠面积(变异系数CV=42.02%)。江山娇种源的大部分结构性状均值较高(如树高21.23 m),但胸径均值与其他种源一致(0.27 m)。
3.5 遗传分析
研究人员计算了各性状的广义遗传力(H2),树高在所有种源中遗传力最高(0.60~0.64),表明受遗传控制强。穆棱和江山娇种源的冠幅直径和冠面积遗传力高于小北湖。标准化后的BLUP值均符合正态分布。基于BLUP值,研究人员筛选出各性状排名前五的精英无性系,如穆棱种源树高前五为466、456、675、645、517,冠面积前五为709、494、635、526、766。遗传增益分析显示,随选择比例增加增益减小,穆棱种源在树高和冠面积上表现出较高的遗传增益潜力,总体育种效率排序为:冠面积 > 树高 ≈ 冠幅直径 > 胸径(DBH)。
讨论与结论总结
在讨论部分,研究人员指出,DeepTree模型通过轻量级主干、多尺度特征融合(NAS-FPN)和级联回归(Cascade RoI Head)有效解决了标准Mask R-CNN在密集林分ITCD中的低效和边界模糊问题,且模型倾向于轻微过分割而非漏检,保证了遗传评估的可靠性。多源传感器提取的表型性状精度虽受地形和传感器角度影响,但其R2远超基准阈值,足以支持下游遗传分析。综合多性状遗传分析比单一性状更能全面反映无性系变异,穆棱种源因较高的表型变异和遗传参数被判定为更适合精英选择。研究也存在局限性,如仅分析四个数量性状、手动标注工作量大等,未来将结合多组学数据与机器学习进一步完善。
结论部分指出,该研究证明高通量表型分析技术在黄花落叶松种源群体遗传分析和精英无性系选择中的有效性。建立的多源集成流程及DeepTree算法提高了筛选效率,明确了穆棱种源的优势,强调了基于遗传力、育种值和遗传增益进行综合评估的必要性,为林木育种提供了高效的工具。