基于轻量级CNN-Transformer混合模型与可解释AI的药用植物叶部病害精准诊断研究

《Scientific Reports》:A lightweight hybrid CNN and transformer model for medicinal leaf disease classification with explainable AI

【字体: 时间:2026年02月12日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对药用植物叶部病害威胁产量及活性成分完整性的问题,开发了轻量级混合CNN-Transformer架构LSeTNet。该模型在12类病害数据集上达到99.72%准确率,参数量仅9.38M,通过Grad-CAM、LIME等可解释AI技术验证了病理区域关注机制,为药用植物智慧植保提供了高效可靠的解决方案。

在传统医学和现代药学中,药用植物如神圣的罗勒(Ocimum tenuiflorum L.)、被誉为"乡村药房"的印楝(Azadirachta indica A. Juss.)以及具有神奇愈合能力的落地生根(Kalanchoe pinnata (Lam.) Pers.)扮演着不可或缺的角色。这些植物富含的生物活性成分是人类健康的重要保障,然而叶部病害的侵袭不仅导致产量锐减,更可能破坏其珍贵的植物化学成分完整性。当前,尽管深度学习技术在植物病害诊断中取得显著进展,但传统模型往往存在参数量大、计算成本高、可解释性差等瓶颈,严重制约了在资源受限的边缘设备上的实际应用。
针对这一挑战,发表在《Scientific Reports》上的研究开发了名为LSeTNet的创新模型。这项研究巧妙地将卷积神经网络(CNN)的局部特征提取能力与Transformer的全局上下文建模优势相结合,并引入挤压激励(Squeeze-and-Excitation, SE)模块增强特征表征。令人印象深刻的是,该模型仅用938万个参数和2.50 GFLOPs的计算量,就在12类药用植物叶部病害分类任务中实现了99.72%的惊人准确率,宏观F1分数达到完美的1.00,曲线下面积(AUC)同样为1.00。
研究人员采用五折交叉验证进一步验证了模型的稳健性,平均准确率达到99.74%±0.14%,且训练过程表现出快速收敛特性,无过拟合现象。为增强模型透明度,研究团队系统应用了多种可解释人工智能(Explainable Artificial Intelligence, XAI)技术。梯度加权类激活映射(Grad-CAM)显示模型注意力精准聚焦于病理区域(平均强度0.1664-0.2702),局部可解释模型-无关解释(LIME)提供了局部决策解释,而t-分布随机邻域嵌入(t-SNE)可视化则展现出清晰的类别分离(轮廓分数0.87)。
在独立外部验证集BD-MediLeaves(8个类别,8000个样本)上,LSeTNet同样表现出色,达到99.42%的准确率和0.99的宏观F1分数。实际部署性能方面,单张图像推理延迟仅6.98毫秒,模型大小35.81MB,完全满足实时边缘计算需求。
与现有先进模型对比分析显示,LSeTNet显著优于DenseNet169(95.56%)、ViT-B16(95.61%)和LW-CNN+SE(95.39%),统计检验表明差异极具意义(p < 10-7,配对t检验)。这些结果充分证明了该模型在精度、效率和泛化能力方面的综合优势。
关键技术方法包括:构建轻量级混合CNN-Transformer架构并集成SE注意力模块;采用数据增强技术将每类样本扩展至1000张图像;使用五折交叉验证评估模型稳健性;应用Grad-CAM、LIME和t-SNE等XAI技术进行模型可解释性分析;在BD-MediLeaves独立数据集上进行外部验证。
模型架构设计
LSeTNet创新性地融合了CNN的局部特征提取能力和Transformer的全局依赖建模优势。CNN分支负责捕获叶部病灶的局部纹理特征,而Transformer模块则建立不同病理区域间的空间关联。SE块的引入实现了特征通道的自适应重校准,增强了判别性特征的表征。
性能评估结果
在12类药用植物叶部病害数据集上,LSeTNet实现了近乎完美的分类性能(准确率99.72%,宏观F1分数1.00,AUC=1.00)。五折交叉验证结果(99.74%±0.14%)证实了模型的稳健性,训练过程快速收敛且无过拟合。
可解释性分析
Grad-CAM热力图显示模型注意力集中于病理相关区域(平均强度0.1664-0.2702),LIME提供了局部决策解释,t-SNE可视化呈现出清晰的类别分离(轮廓分数0.87),证实了模型决策的生物学合理性。
泛化性能验证
在独立外部数据集BD-MediLeaves上的测试结果(99.42%准确率,0.99宏观F1分数)证明了LSeTNet强大的泛化能力,表明模型学到的特征具有跨数据集的稳定性。
效率优势分析
与DenseNet169、ViT-B16和LW-CNN+SE等基准模型相比,LSeTNet在显著减少参数量的同时实现了更高的分类精度(p < 10-7),单图推理延迟6.98ms,模型大小35.81MB,适合边缘设备部署。
研究结论表明,LSeTNet通过轻量级混合架构设计和可解释AI技术的系统集成,成功解决了药用植物叶部病害诊断中的精度、效率和可解释性平衡难题。该模型不仅为精准植物病理学建立了新的技术标准,更为可持续药用植物栽培提供了可靠的技术支撑。其卓越的性能和边缘部署能力预示着在智慧农业领域的广泛应用前景,特别是在资源受限环境下的实时病害监测中具有重要价值。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号