《Plant Biotechnology Journal》:Machine Learning-Driven Construction of High-Yielding Cucumber Plant Architectures in Greenhouse Environments
编辑推荐:
本研究利用机器学习模型(GBDT+SVM)结合263个品种的表型数据,首次实现了基于地上部与根系整合特征的黄瓜产量早期预测(R2=0.6155),揭示了紧凑型地上结构(首雌花节位≤3、叶宽≥26 cm)与浅根窄角根系(浅角根比例≥0.4、平均直径≥1.25 mm)的协同增效机制,为设施黄瓜理想株型设计提供了理论框架。
高精度根系表型获取与模型构建
通过U-Net深度学习模型对黄瓜幼苗根系图像进行语义分割,实现了在发芽纸背景下根系的高通量提取(mIoU=0.885,F1_score=0.9366)。该模型通过对2000张训练图像进行200轮训练,在230张独立测试集上达到R2=0.9605的分割精度,为后续整合地上-地下表型分析奠定了技术基础。
关键表型性状与产量的关联解析
对263个黄瓜品种的产量与表型性状进行标准化分析发现,高产品种(如170号)在叶片长宽、叶面积、茎粗等地上部性状及根尖数、根深等根系性状上显著优于低产品种。相关性分析表明,单果重(Cuc Wt)、叶长/叶宽/叶面积(Blade Len/Wdth/Area)、茎粗(Stem Dia)及盛果期叶绿素含量(Chl Content 8 W)与产量呈极显著正相关(p<0.01),而早期株高(Plant Ht 2 W)、节间长(Int Spacing)和首雌花节位(1st Fem Flower Node)与产量负相关。根系性状中,平均根直径(AveDia)、浅角根比例(ShaAF)和直径1-2 mm根比例(RLR2/TRLen)与产量正相关,而陡角根比例(SteAF)和细根长度(RLR1)呈负相关。
多模型协同的产量预测框架
分别采用支持向量机(SVM)、随机森林(RF)和梯度提升决策树(GBDT)构建产量预测模型。单一根系性状预测效果有限(最佳R2=0.4007),而地上部性状模型表现更优(R2=0.5050)。通过整合不同生长阶段(第10/15/20天)的根系动态特征,组合模型预测精度显著提升(R2最高提升0.31)。其中SVM模型在"地上部+第10/20天根系"组合中预测效果最佳(R2=0.6080,RMSE=0.2629),而GBDT+SVM集成模型在"地上部+第10/15天根系"组合中达到最优预测精度(R2=0.6245)。
高产品种聚类与理想株型特征
对67个高产品种(产量≥1.8 kg)进行K-means聚类,识别出四种高产株型结构。聚类c(产量最高)表现为大叶宽(≥26 cm)、粗茎(≥8.5 mm)与细根系(细根比例<0.2)的组合;聚类b则具早花特性(首雌花节位≤3)与发达浅层根系。通过157464种虚拟表型组合的模拟预测发现,20%表型组合的预测产量超过参考组合,最优组合产量提升达20%。高产组合普遍呈现首雌花节位集中于第3节(100%)、叶宽26 cm(97.8%)、茎粗8.5 mm(73%)等收敛特征。
地上-地下互作机制解析
通过计算期望加性效应发现,单一性状改变可导致产量波动0%-15.4%,其中首雌花节位影响最大。在154764种组合中,3.5万种表现协同效应(实际产量高于期望值0.01-0.2 kg),923种存在拮抗效应。主成分分析表明,协同组合多表现为弱势地上部(小叶、晚花)与强势根系(大直径、浅角根)的互补配置,而拮抗组合则为强势地上部与细弱根系的失衡搭配。研究提出高产黄瓜的理想架构:紧凑型地上部(早花、宽叶、粗茎)配合窄角浅根系(浅角根比例≥0.4,平均直径≥1.25 mm),在温室高肥水环境下可实现资源利用最优化。
研究意义与应用前景
该研究建立了表型组学与机器学习结合的作物株型设计新范式,明确了设施黄瓜"地上促光合、地下保功能"的株型构建原则。所提出的表型组合参考范围(如盛果期叶绿素含量45-50,节间长>10.2 cm)为分子育种与栽培调控提供了量化指标,为设施蔬菜轻简化栽培提供了理论支撑。