基于机器学习的油菜黑胫病表型严重程度评分：一种标准化抗性育种的新型图像分析方法

【字体：大中小】 时间：2026年03月06日 来源：The Plant Phenome Journal CS5

编辑推荐：

　　这篇综述介绍了利用深度学习图像分析技术对油菜黑胫病严重程度进行自动表型评分的研究。传统依赖专家人工评分的方法昂贵且不一致，而本文提出的机器学习模型表现优于中等水平的人工评分者，并保持了相似的遗传力。这项研究为通过标准化疾病评分来改善油菜育种结果提供了一种高效、准确的解决方案，具有重要的应用前景。

引言

油菜是世界第二大油料作物，具有重要的经济价值。然而，由真菌病原体Leptosphaeria maculans和Leptosphaeria biglobosa引起的黑胫病，是威胁全球油菜生产的主要病害之一，可导致严重的产量损失。控制该病害最有效的方法之一是栽培抗性品种。因此，对感病植株进行黑胫病严重程度的定量评分，是识别和选择抗性品种的关键指标。传统的评分方法依赖专家评分员，他们根据既定的评级标准和参考图像评估茎秆横截面的病害情况。但人工评分存在成本高、评分不一致（不同评分者之间及同一评分者跨年度评分均存在差异）等问题，为抗性评级引入了显著的噪声。田间评估茎秆基部的病害严重程度，目前仍是评估数量抗性及品种整体表现的最佳方法，其标准做法是测量感病植株茎秆横截面变色区域的比例。

材料与方法

田间试验设置：研究于2018年和2019年在加拿大阿尔伯塔省、萨斯喀彻温省和马尼托巴省的三个地点进行田间表型试验。试验包含40个具有不同已知黑胫病反应的品种。在结荚期至成熟期，从每个小区中部采集25-30株植株，使用定制的成像平台采集茎秆的横截面和侧面图像。图像为RGB色彩空间，分辨率为2592×2048像素。

人工评分：由五位具有至少两个季节评分经验的专家，通过观察图像对样本进行评分。采用1-9级评分系统，其中1分表示内部组织100%感病（最严重），9分表示无病斑（最不严重），中间分数对应不同的感病组织比例。此外，还包括“不确定”类别。地面真值由所有评分者评分的中位数确定。

图像处理架构：研究采用两阶段深度学习模型。第一阶段为基于YOLO V3的目标检测模型，用于检测图像中是否存在有效的、可评分的茎秆横截面，并将其裁剪、居中，以标准化输入。若未检测到有效横截面，则直接判定为“不确定”。第二阶段为基于ResNet架构改进的图像分类模型，其输入为第一阶段裁剪后的横截面图像与对应的侧面图像（堆叠为6通道），输出为1-9的严重程度评分。该两阶段架构旨在处理图像中横截面视野较小、位置随机的问题，并综合利用双视角信息。

模型训练：第一阶段模型使用2018年的数据（仅横截面图像）进行训练和测试。第二阶段模型则使用2018年和2019年的数据组合进行训练，其中2019年数据仅1%用于训练，99%用于测试，以评估模型的泛化能力。训练中采用了迁移学习和数据增强技术。

遗传力和最佳线性无偏预测评估：利用2019年单个地点的数据，通过线性混合模型计算了所有评分方法（五位评分员、地面真值和机器学习评分）的广义遗传力，并估算了各基因型的最佳线性无偏预测值，以比较不同评分方法在育种应用中的一致性。

结果

表型分析与人工评分：2018年和2019年采集的数据在地面真值评分分布上存在差异。对专家评分员的分析显示，评分者内部及评分者之间存在显著不一致性。评分员相对于地面真值的准确率在年份间和个体间波动较大。对同一批2018年样本在2019年进行重新评分的跨年度一致性分析表明，个体评分员的年度间准确率仅为54%至60%，而汇总多个评分员意见得到的地面真值则表现出更高的一致性。这凸显了对客观、标准化评分方法的需求。

图像级评估与模型性能：第一阶段模型在检测有效横截面任务上准确率高达99.613%。第二阶段机器学习模型在测试集上的表现略优于中等水平的人工评分员，但略逊于前两位最佳评分员。模型性能对置信度阈值的选择不敏感。消融研究表明，在训练中加入少量（1%）新年份数据有助于提升模型在新数据上的泛化能力和稳定性。

机器学习评分的遗传力：统计分析表明，机器学习自动评分获得的黑胫病严重程度性状，其遗传力估计值与专家评分员及地面真值得出的估计值相似。这表明机器学习评分能够有效地捕获基因型间的真实遗传变异。

最佳线性无偏预测的相关性：对不同评分方法计算出的各基因型最佳线性无偏预测值进行分析，结果显示机器学习评分与专家评分员的最佳线性无偏预测值高度相关，其相关性范围与不同人工评分员之间的相关性范围相当。尽管不同评分方法给出的绝对分数均值存在偏移，但对各基因型的排序非常相似。易感对照品种WESTAR在所有评分方法中均得到最低分。机器学习评分的整体平均分与五位专家评分员的整体平均分接近。

讨论

准确的黑胫病评分对于降低病害的经济影响、指导育种决策以及克隆抗性基因都至关重要。虽然专家团队是评分的“金标准”，但人工评分存在成本高、耗时长、主观性强且难以在短时间内大规模实施等局限。相比之下，本研究开发的机器学习模型在平均准确率上可与中等水平的专家相媲美，且具备预先训练、可大规模一致化部署的优势，能节省时间和成本，并维持高标准的评分质量。模型使用1-9级评分，可通过公式y = -0.625x + 5.625转换为加拿大油菜委员会标准的0-5级评分以供报告。

研究结果也揭示了模型性能存在年度间差异，这可能与不同年份数据的疾病压力分布、图像质量或评分员表现差异有关。未来，可通过简化成像系统（如使用手动暗箱配合消费级相机）来降低成本、提高可及性。此外，探索使用多光谱或高光谱传感器替代RGB相机，可能有助于检测更细微的病害进程。

本研究所展示的基于图像分析的机器学习框架具有广泛的应用潜力。例如，可开发用于跨地区标准化黑胫病评分的模型，或在遗传定位群体中应用，以期更准确地鉴定数量性状位点，从而发现新的基因编辑靶点，最终培育出更优良的油菜品种。

热点排行