藜麦(Chenopodium quinoa Willd.)是一种一年生短日照植物,属于苋科,原产于南美洲的安第斯地区。尽管其主要种植区域仍在南美洲,但在欧洲和澳大利亚的部分地区也有小规模的引入[6]。由于其显著的生物多样性和营养价值,藜麦引起了科学界的广泛关注[4]。它的种子不仅富含高质量蛋白质和平衡的氨基酸组成,还含有丰富的矿物质、酚类化合物和具有生物活性的黄酮类物质。重要的是,不同藜麦品种之间存在显著的质量差异,这直接影响了它们的经济价值[19]。然而,由于不同品种的种子形态特征往往非常相似,依赖形态特征的传统鉴定方法不可靠且效率低下。这一技术瓶颈阻碍了品种鉴定工作,并导致相关行业缺乏专业人才[39]。因此,开发一种快速、准确且无损的藜麦品种鉴定方法对于确保市场诚信、支持优良品种的培育以及推进工业应用具有重要意义。
藜麦质量和品种的鉴定传统上依赖于化学分析或遗传分析[24,31]。近年来,高光谱成像(HSI)作为一种有前景的无损技术出现,为农产品质量评估提供了显著优势[10]。通过将光谱学与计算机视觉相结合,HSI能够获取样本图像每个像素的光谱信息,从而比传统的单点光谱技术提取更全面和详细的特点。此外,HSI可以在不需要化学试剂的情况下表征材料的吸收特性[40]。目前,HSI已广泛应用于各种农产品的质量评估,包括蔬菜[28]、水果[42]、谷物[21]和肉类[15]。
在质量分析领域,研究人员开始探索整合多个光谱范围以提高性能。例如,[46]使用可见光-近红外(Vis-NIR)和近红外(NIR)高光谱系统以及机器学习算法成功预测了鱼中的挥发性基本氮(TVB-N)含量。类似地,[18]应用类似的双范围设置与偏最小二乘回归(PLSR)来准确测定鸡肉中的内部营养成分。相比之下,迄今为止的大多数品种鉴定研究都集中在单一光谱范围。例如,基于覆盖900–1700 nm的HSI数据并结合支持向量机(SVM)模型的研究实现了19种山核桃品种96.5%的分类准确率[3]。另一项研究[7]使用385至1000 nm的HSI数据结合各种机器学习模型有效区分了水稻品种。同样,使用NIR区域(975.01–1645.82 nm)的HSI提取了玉米籽粒的光谱特征,径向基函数神经网络(RBFNN)的准确率达到91.00%[49]。尽管取得了这些进展,但系统评估不同光谱范围在品种鉴定中协同潜力的研究仍然较少,这突显了进一步研究的必要性。
高光谱成像(HSI)技术在农产品检测中展示了显著的优势。然而,HSI数据的高维特性给传统机器学习算法带来了重大挑战[41]。传统方法通常依赖于手动特征提取,这往往无法有效捕捉光谱和空间特征之间的复杂关联。相比之下,深度学习方法——特别是卷积神经网络(CNN)——能够直接从原始数据中自动学习层次特征,从而显著提高模型性能[11]。例如,有研究表明1D CNN模型在大豆品种鉴定中的准确率可达98%,优于传统机器学习技术[17]。同样,基于CNN的模型在甜玉米品种鉴定中的准确率也超过了95%[38]。对于小麦籽粒质量评估,3D CNN和混合CNN架构的应用实现了高达98%的识别准确率[50]。这些发现共同表明CNN从高光谱数据中提取深度光谱-空间特征的能力非常强大,突显了它们在农产品品种鉴定任务中的技术优势。
近年来,高光谱成像在众多高端科学和工程领域取得了快速进展,显示出HSI技术的日益成熟和跨学科潜力。例如,AMMIS机载多模块成像光谱仪实现了高分辨率的地球观测,具有增强的空间-光谱保真度[13]。人工智能越来越多地与高光谱数据处理相结合,提高了在不同信噪比和光谱/空间分辨率下的鲁棒性[14]。先进的深度学习架构,如光谱-空间双分支融合Transformer,在复杂的高光谱分类任务中表现出色[48]。HSI还广泛应用于生物医学检测、材料结构分析、异常检测和非破坏性食品成分评估,包括自适应图频异常检测[20,32]、生物活性多糖的结构分析[5,9]、藜麦质量评估[35]、微流控多相流特性分析[2]以及植物工厂中的高精度环境感知[8]。这些研究表明,现代高光谱成像正朝着更高的空间-光谱分辨率、更深入的AI集成和更广泛的跨学科应用方向发展。这突显了开发更先进的光谱-空间建模框架用于农业品种鉴定的必要性。
为了解决这些挑战,本研究提出了一种改进的CNN架构,该架构结合了通道注意力机制和Transformer编码器用于藜麦品种鉴定。该框架增强了局部特征提取和全局光谱依赖性建模。使用从Vis-NIR和NIR范围获取的高光谱图像,我们系统地比较了多种预处理技术、传统和深度学习分类器以及三种代表性的特征选择算法。本研究的主要贡献如下:
(1) 构建了一个包含30个藜麦品种的大规模高光谱数据集,覆盖两个光谱范围;
(2) 开发了一个结合通道注意力和Transformer模块的改进CNN,以增强光谱-空间表示;
(3) 系统比较了预处理策略、特征选择方法和分类模型,以确定最佳的藜麦品种鉴定建模流程;
(4) 在浅层和深层学习框架中全面评估了全光谱和选定波长的建模。
本文的其余部分组织如下:第2节描述了材料、成像系统和方法论;第3节展示了实验结果和讨论;第4节总结了研究并概述了未来的研究方向。