机器学习驱动的高光谱-形态组学表型分析揭示真菌病原体化学应激响应的“化学先验”指纹

《Smart Agricultural Technology》：Taxonomy-agnostic hyperspectral–morphological phenotyping of fungal pathogen chemical-stress responses using machine learning

【字体：大中小】 时间：2026年02月20日 来源：Smart Agricultural Technology 5.7

编辑推荐：

　　为应对合成杀菌剂的抗药性与环境风险，本研究发展了一套整合定量形态学、高光谱成像（HSI）与机器学习（ML）的非破坏性表型分析工作流。研究人员通过标准化的化学应激，成功从多谱系的咖啡与可可相关炭疽菌（Colletotrichum）中，提取出可预测样本来源标签（作物来源）的、分类学不可知的应激响应表型指纹，验证了基于“化学先验”假说的筛选新思路，为开发环境友好型抗真菌剂及高通量表型筛选提供了可扩展的传感器驱动决策支持。

在农业生产中，由真菌病原体引起的病害是导致全球重要经济作物（如可可和咖啡）严重减产的主要原因。长期以来，人们依赖合成化学杀菌剂来应对这些威胁，但这一策略正面临双重挑战：病原体不断进化出抗药性菌株，以及化学残留物带来的环境与毒理学担忧。因此，开发既有效又生态可持续的新型抗真菌策略迫在眉睫，其中从天然来源中筛选和设计环境友好型化合物是关键方向。然而，一个基础性难题在于，如何从真菌在受到化合物刺激后展现的、可观察的应激表型中，提取出具有重现性和预测性的信号。这就像是在寻找一种独特的“指纹”——它能够稳定地反映病原体对特定化学压力的反应模式，并可用于高效筛选和分类。为了回答这个问题，一项发表在《Smart Agricultural Technology》上的研究，创新性地将定量形态测量、高光谱成像与机器学习技术相结合，为真菌病原体的化学应激响应表型分析打开了一扇新窗。

研究人员为了探究标准化的化学应激是否能揭示可预测样本来源标签（即真菌分离株所来源的作物）的表型指纹，开展了一项整合性的研究。他们首先构建了两个作物相关的真菌分离株群组（面板）：一组是六株咖啡相关的炭疽菌（Colletotrichum spp.），另一组是之前已表征过的可可相关菌株（包含 Pestalotiopsis sp. 和 C. gloeosporioides）。研究采用了四种来源于可持续原料的酚基支链化合物（包括两种脂肪酸及其对应的乙二胺携带的脂肪酰胺衍生物）作为化学探针。在均匀、各向同性的体外培养条件下，对真菌进行标准化应激处理。随后，利用高分辨率相机进行菌落成像，并通过SmartGrain软件提取七项定量形态特征。同时，为了探究表型背后的生理基础，研究选用了高光谱成像技术，在荧光、可见光-近红外反射和短波红外反射三种模态下，对特定菌株和化合物进行剂量依赖的成像分析。数据分析方面，研究运用了主成分分析、多变量方差分析和机器学习分类模型（如神经助推模型、支持向量机等），以评估形态特征对作物来源标签的预测能力，并采用交叉验证策略来评估模型的稳健性。所有分析均在统一、可比的实验条件下进行，以最大限度地减少批次效应。

3.1. 酰胺衍生物PhSOAM和BCBGAM具有强效但不同的效应

两种乙二胺携带的酰胺衍生物PhSOAM和BCBGAM是测试中最有效的生长抑制剂。PhSOAM表现出强效但选择性的抗真菌活性，而BCBGAM在某些菌株中诱导了更紧凑、圆形的形态，并且在P24-192中显著增加了菌落的伸长。这揭示了大小与形状指标的脱钩，为下游多变量和预测分析提供了动机。

3.2. 脂肪酸类似物的效应可变且相反

两种酚基支链脂肪酸PhSOFA和BCBGFA的总体抗真菌活性弱于其对应的酰胺衍生物，但各自触发了高度独特且菌株特异性的形态响应。值得注意的是，BCBGFA非但没有抑制，反而促进了P24-85的生长，暗示了可能的毒物兴奋效应或菌株特异性代谢能力。

3.3. 多变量分析揭示了处理对真菌形态的主导效应

对咖啡数据集的主成分分析和多变量方差分析显示，化学处理和菌株身份都对形态有显著影响，但线性排序方法提供的组间分离有限，大量重叠表明需要非线性方法来识别诊断性模式。

3.4. 系统发育分析揭示咖啡相关分离株是多系群并与可可相关分离株混合

多基因座系统发育分析表明，六株咖啡相关分离株是多系群的，分布在几个不同的进化支中，而非形成一个单系群。基于ITS区域的分析进一步显示，一些咖啡分离株与可可相关分离株的亲缘关系比与其他咖啡分离株更近，强调了群组内混合的谱系结构。

3.5. 咖啡和可可面板的比较多变量分析

将咖啡与可可数据集合并后进行主成分分析，发现前两个主成分无法清晰分离两个作物来源的样本。多变量方差分析也显示，作物来源标签仅能解释总方差的约1.7%，这表明线性多变量方法不足以解析这些表型，从而证明了使用非线性机器学习的必要性。

3.6. 机器学习模型根据化学应激形态分类作物来源标签

在传统线性方法失效后，机器学习模型成功地从化学应激诱导的形态中挖掘出可预测作物来源标签的信号。在九种算法中，神经助推模型在5折交叉验证中达到了86.7%的验证准确率。特征重要性分析显示，菌落圆形度是区分两个作物面板的最主要预测因子，其次是面积和周长等大小指标。即使移除圆形度这一关键特征，模型仍能保持86.1%的高准确率，表明预测信号冗余地编码于多个特征中。敏感性分析和基于菌株分组的交叉验证进一步证实了预测信号的稳健性，并非仅由单一高度响应的基因型驱动。

3.7. CGH5在PhSOAM处理下呈现剂量依赖的高光谱指纹

对可可来源的高响应菌株Pestalotiopsis sp. CGH5进行高光谱成像分析，发现在荧光、可见光-近红外反射和短波红外反射三种模态下，PhSOAM处理均能诱导出剂量依赖性的显著光谱变化，揭示了与形态抑制相伴的生理扰动。

3.8. 耐受性咖啡分离株的高光谱响应减弱

相比之下，对PhSOAM耐受性较强的咖啡分离株P24-85则表现出减弱的、非线性的高光谱响应，特别是在对水分敏感的短波红外区域（如~1930 nm附近）变化较弱，表明其生理受干扰程度较低。

3.9. Colletotrichum sp. P24-192的化合物特异性高光谱指纹

在同一种咖啡分离株P24-192中，不同的化合物（BCBGAM与PhSOAM）诱导了独特的光谱指纹，例如在短波红外区域产生不同的诊断性波段，这支持了在标准化条件下化合物特异性光谱指纹的存在。

本研究成功开发并验证了一套分类学不可知的高通量表型分析工作流。研究结果表明，在标准化的化学应激下，真菌能够产生可重现的形态学和高光谱学指纹。尽管基于谱系的分类无法有效区分来自不同作物的分离株，但机器学习模型能够以高准确率（86.7%）预测其“作物来源”标签，揭示了隐藏在化学应激响应中、与作物背景相关的可学习表型信号。研究提出“化学先验”作为一个工作假说，认为长期的环境暴露可能印刻在应激响应通路中，并能在简单、标准化的化学探针下变得可读。该工作流展示了强大的工程鲁棒性，即使移除关键形状特征，预测性能也几乎不受影响，这证明表型指纹是多特征冗余编码的。在讨论部分，作者强调了对结果应持保守解释：由于作物来源标签与系统发育结构部分混杂，因此预测信号应被视为与本研究混合谱系面板中作物背景相关的、分类学不可知的表型指纹，而非宿主适应性的直接证据。高光谱成像结果被谨慎地解释为与处理相关的光谱变异，可用于区分菌株，特别是对水分敏感的短波红外区域（~1930 nm）的光谱变化，在未进行水效应建模前，不宜直接归因于特定生化机制。这项研究的意义在于，它建立了一个可扩展的、传感器驱动的表型分析平台，将标准化的化学扰动与可重现的、可预测的表型指纹联系起来，为高通量筛选环境友好型抗真菌剂以及基于表型的生物安全监测提供了新的决策支持工具，使表型分析不再受限于严格的物种鉴定瓶颈。未来工作将致力于在植物体内验证这些表型指纹，解析应激响应的分子与基因组基础，并在更广泛的病原体系统中测试“化学先验”假说的普适性。

热点排行

新闻专题