基于高光谱成像与卷积神经网络相结合的方法对藜麦(Chenopodium quinoa Willd.)进行分类

《Microchemical Journal》:Classification of quinoa(Chenopodium quinoa Willd.) based on hyperspectral imaging combined with convolutional neural network

【字体: 时间:2026年01月04日 来源:Microchemical Journal 5.1

编辑推荐:

  高效鉴定藜麦种质资源需融合高光谱成像与深度学习技术。本研究构建双波段(378–1018 nm和855–1705 nm)藜麦高光谱数据库,提出改进的CNN模型集成通道注意力与Transformer模块,通过Savitzky-Golay预处理实现96%的品种分类准确率,证实近红外波段更具区分性。该技术为精准育种提供新工具。

  
王晓江|韩俊英|刘成中|魏玉明
甘肃农业大学信息科学与技术学院,兰州730000,中国

摘要

随着功能性农业的快速发展,高通量和智能鉴定藜麦种质资源已成为实现精准育种和品种优化的关键要求。在这项研究中,我们提出了一种结合高光谱成像技术和卷积神经网络(CNN)的藜麦种子质量鉴定方法。为了进一步提高光谱特征提取的效率,在CNN模型中引入了注意力机制,包括通道注意力模块和变换器模块。首先,我们在两个光谱范围(378–1018 nm和855–1705 nm)获取了藜麦的高光谱图像,并使用阈值分割方法提取了有效的光谱信息。然后,我们采用PCA和LDA对藜麦品种进行了聚类分析。在此基础上,构建了15个分类模型,结合了各种光谱预处理方法和分类算法。结果表明,Savitzky-Golay预处理方法是最佳方法,所提出的改进CNN模型在藜麦品种鉴定方面表现出更优的性能。与可见光-近红外光谱相比,近红外光谱范围产生了更好的分类结果,准确率高达96%。总之,本研究表明了高光谱成像与深度学习方法结合在藜麦种子品种鉴定中的显著优势,为智能育种提供了新的见解。

引言

藜麦(Chenopodium quinoa Willd.)是一种一年生短日照植物,属于苋科,原产于南美洲的安第斯地区。尽管其主要种植区域仍在南美洲,但在欧洲和澳大利亚的部分地区也有小规模的引入[6]。由于其显著的生物多样性和营养价值,藜麦引起了科学界的广泛关注[4]。它的种子不仅富含高质量蛋白质和平衡的氨基酸组成,还含有丰富的矿物质、酚类化合物和具有生物活性的黄酮类物质。重要的是,不同藜麦品种之间存在显著的质量差异,这直接影响了它们的经济价值[19]。然而,由于不同品种的种子形态特征往往非常相似,依赖形态特征的传统鉴定方法不可靠且效率低下。这一技术瓶颈阻碍了品种鉴定工作,并导致相关行业缺乏专业人才[39]。因此,开发一种快速、准确且无损的藜麦品种鉴定方法对于确保市场诚信、支持优良品种的培育以及推进工业应用具有重要意义。
藜麦质量和品种的鉴定传统上依赖于化学分析或遗传分析[24,31]。近年来,高光谱成像(HSI)作为一种有前景的无损技术出现,为农产品质量评估提供了显著优势[10]。通过将光谱学与计算机视觉相结合,HSI能够获取样本图像每个像素的光谱信息,从而比传统的单点光谱技术提取更全面和详细的特点。此外,HSI可以在不需要化学试剂的情况下表征材料的吸收特性[40]。目前,HSI已广泛应用于各种农产品的质量评估,包括蔬菜[28]、水果[42]、谷物[21]和肉类[15]。
在质量分析领域,研究人员开始探索整合多个光谱范围以提高性能。例如,[46]使用可见光-近红外(Vis-NIR)和近红外(NIR)高光谱系统以及机器学习算法成功预测了鱼中的挥发性基本氮(TVB-N)含量。类似地,[18]应用类似的双范围设置与偏最小二乘回归(PLSR)来准确测定鸡肉中的内部营养成分。相比之下,迄今为止的大多数品种鉴定研究都集中在单一光谱范围。例如,基于覆盖900–1700 nm的HSI数据并结合支持向量机(SVM)模型的研究实现了19种山核桃品种96.5%的分类准确率[3]。另一项研究[7]使用385至1000 nm的HSI数据结合各种机器学习模型有效区分了水稻品种。同样,使用NIR区域(975.01–1645.82 nm)的HSI提取了玉米籽粒的光谱特征,径向基函数神经网络(RBFNN)的准确率达到91.00%[49]。尽管取得了这些进展,但系统评估不同光谱范围在品种鉴定中协同潜力的研究仍然较少,这突显了进一步研究的必要性。
高光谱成像(HSI)技术在农产品检测中展示了显著的优势。然而,HSI数据的高维特性给传统机器学习算法带来了重大挑战[41]。传统方法通常依赖于手动特征提取,这往往无法有效捕捉光谱和空间特征之间的复杂关联。相比之下,深度学习方法——特别是卷积神经网络(CNN)——能够直接从原始数据中自动学习层次特征,从而显著提高模型性能[11]。例如,有研究表明1D CNN模型在大豆品种鉴定中的准确率可达98%,优于传统机器学习技术[17]。同样,基于CNN的模型在甜玉米品种鉴定中的准确率也超过了95%[38]。对于小麦籽粒质量评估,3D CNN和混合CNN架构的应用实现了高达98%的识别准确率[50]。这些发现共同表明CNN从高光谱数据中提取深度光谱-空间特征的能力非常强大,突显了它们在农产品品种鉴定任务中的技术优势。
近年来,高光谱成像在众多高端科学和工程领域取得了快速进展,显示出HSI技术的日益成熟和跨学科潜力。例如,AMMIS机载多模块成像光谱仪实现了高分辨率的地球观测,具有增强的空间-光谱保真度[13]。人工智能越来越多地与高光谱数据处理相结合,提高了在不同信噪比和光谱/空间分辨率下的鲁棒性[14]。先进的深度学习架构,如光谱-空间双分支融合Transformer,在复杂的高光谱分类任务中表现出色[48]。HSI还广泛应用于生物医学检测、材料结构分析、异常检测和非破坏性食品成分评估,包括自适应图频异常检测[20,32]、生物活性多糖的结构分析[5,9]、藜麦质量评估[35]、微流控多相流特性分析[2]以及植物工厂中的高精度环境感知[8]。这些研究表明,现代高光谱成像正朝着更高的空间-光谱分辨率、更深入的AI集成和更广泛的跨学科应用方向发展。这突显了开发更先进的光谱-空间建模框架用于农业品种鉴定的必要性。
为了解决这些挑战,本研究提出了一种改进的CNN架构,该架构结合了通道注意力机制和Transformer编码器用于藜麦品种鉴定。该框架增强了局部特征提取和全局光谱依赖性建模。使用从Vis-NIR和NIR范围获取的高光谱图像,我们系统地比较了多种预处理技术、传统和深度学习分类器以及三种代表性的特征选择算法。本研究的主要贡献如下:
(1) 构建了一个包含30个藜麦品种的大规模高光谱数据集,覆盖两个光谱范围;
(2) 开发了一个结合通道注意力和Transformer模块的改进CNN,以增强光谱-空间表示;
(3) 系统比较了预处理策略、特征选择方法和分类模型,以确定最佳的藜麦品种鉴定建模流程;
(4) 在浅层和深层学习框架中全面评估了全光谱和选定波长的建模。
本文的其余部分组织如下:第2节描述了材料、成像系统和方法论;第3节展示了实验结果和讨论;第4节总结了研究并概述了未来的研究方向。

样本制备

藜麦样本于2023年在云南省元谋县的南方农业实验站收集(坐标:23.48°N, 101.95°E)。为了确保样本的一致性,所有藜麦种子都在同一时期完全自然成熟时收获,并来自同一批田间试验,从而最小化了成熟度差异对品种鉴定的潜在影响。收集后,样本立即密封并在干燥凉爽的环境中储存

藜麦品种间光谱特征的比较分析

图3(A)展示了使用Vis-NIR(320个波段)和NIR(402个波段)光谱数据集收集的30个藜麦品种的原始反射光谱。尽管品种间的遗传变异导致反射强度存在一些差异,但所有样本的整体光谱轮廓显示出一致的趋势。如图3所示,光谱曲线具有相似的形状,仅在特定波长区域观察到轻微波动。

结论

本研究旨在基于Vis-NIR和NIR光谱数据集调查30个藜麦品种的品种鉴定性能。尽管所有样本的光谱曲线在两个光谱范围内显示出相似的趋势,但品种内部组成的细微差异导致了特定波长区域的可区分光谱变化。最初,评估了三种预处理算法——MSC、SNV和SG——以确定最合适的方法

CRediT作者贡献声明

王晓江:写作 – 审稿与编辑,写作 – 原稿撰写,可视化,验证,软件,方法论,概念化。韩俊英:写作 – 审稿与编辑,写作 – 原稿撰写,验证,资源获取,方法论,调查,资金获取。刘成中:写作 – 审稿与编辑,验证,资源获取,资金获取,正式分析,概念化。魏玉明:资源获取,调查,正式分析,概念化。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

本工作得到了国家自然科学基金(编号:32360437)和甘肃省自然科学基金(编号:25YFNA040)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号