不同近红外波段在红木物种鉴别准确性上的比较分析

《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Comparative analysis of discrimination accuracy across different near-infrared bands for rosewood species

【字体: 时间:2026年02月27日 来源:Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 4.3

编辑推荐:

  近红外光谱技术结合波长窗口优化和机器学习模型,可有效鉴别八种玫瑰木物种,其中1100-2150 nm波段与S-G+中心化预处理结合的LSTM模型准确率达98.53%。

  
余丹琦|谢广强|李耀祥|陈成武
东北林业大学机电工程学院,哈尔滨 150040,中国

摘要

红木因其温暖的色泽、独特的纹理、高密度和优异的机械性能而备受全球重视。它在许多文化和地区都有着悠久的使用历史。随着全球红木资源的减少,伪造、掺假和走私在红木贸易中变得普遍,这凸显了迫切需要一种快速、无损且准确的物种鉴定方法。近红外光谱技术在木材鉴定中显示出巨大潜力,但目前尚未就最佳光谱窗口达成共识。为了解决这一难题,我们比较了四种常用的波长区间:可见光-近红外(Vis–NIR,350–2500 nm)、短波近红外(SW-NIR,700–1100 nm)、截短长波近红外(tLW-NIR,1100–2500 nm,去除了2150–2500 nm之间的噪声部分)以及完全截短的近红外(tFULL-NIR,700–2150 nm,去除了2150–2500 nm之间的所有噪声部分)。研究分析了中国国家标准中列出的八种常见红木物种:Pterocarpus santalinus、Dalbergia bariensis、Pterocarpus erinaceus、Pterocarpus macrocarpus、Millettia laurentii、Dalbergia cochinchinensis、Dalbergia louveliiDalbergia retusa。在应用了七种预处理方法后,每种“波长区间+预处理”组合都通过偏最小二乘判别分析(PLS-DA)、支持向量机(SVM)和长短期记忆(LSTM)网络进行了评估。结果显示,经过Savitzky–Golay(S-G)滤波和均值中心化(S-G + Center)处理后,再用LSTM进行分类的tLW-NIR方法具有最高的整体准确性(98.53%)。结合带优化的近红外技术和LSTM是一种快速、无损的红木鉴别策略。本研究为波长窗口选择和模型泛化提供了实用指导,并为打击红木贸易中的非法活动提供了强有力的技术工具。

引言

红木以其温暖的色泽和优雅的纹理在木材市场上一直备受青睐。中国的红木国家标准(GB/T 18107–2017)共列出了29种红木物种。这些物种大多原产于南美洲和南亚的热带地区。它们常用于制造高端家具以及修复文物和历史建筑。随着全球森林资源的减少,对这些珍贵硬木的市场需求持续增长,然而非法采伐、走私和木材欺诈仍然猖獗,即使在《濒危野生动植物种国际贸易公约》(CITES)及相关国家法规的保护下也难以根除[1]、[2]、[3]。这种情况危及了濒危物种的生存,并破坏了合法贸易,因此迫切需要快速、无损且高效的红木鉴定方法。
准确鉴定红木物种是树木学、木材科学、国际木材贸易和历史建筑保护等领域的重要研究课题。传统的鉴定方法主要包括宏观和微观方法[4]、[5]。宏观方法依赖于可观察的特征,如纹理、颜色和气味。尽管这些方法是无损的,但需要丰富的专业知识,且准确性有限[6]。相比之下,微观方法涉及样品制备和光学或电子显微镜的使用。光学显微镜需要切片和软化木材等步骤来观察解剖结构[7],而电子显微镜则需要通过镀金等方式来提高木材的导电性[8]。
微观方法本质上具有破坏性,可能会损坏珍贵的木材样本。此外,宏观和微观鉴定过程都耗时且成本高昂,且高度依赖于操作者的专业水平。虽然区分常见的商业木材和珍贵木材相对简单,但准确鉴定亲缘关系密切的珍贵木材则更具挑战性。这类任务需要具备详细物种解剖特征知识的训练有素的专业人员[6]。这些限制凸显了快速、可靠且无损的木材鉴定方法的迫切需求。
近红外光谱(NIR)是一种广泛应用的无损分析方法,因其速度快、效率高且能保持样本完整性。在木材科学和林业领域,NIR已被用于评估含水量[9]、测定密度[10]和鉴定物种[11]、[12]。其广泛应用还体现在农业[13]、化学工程[14]和医学[15]等领域。
多项研究已成功应用NIR技术对常见木材物种进行分类。例如,Zhen-Yu等人[16]使用950–1650 nm范围内的NIR光谱对20种商业木材进行了分类;Mancini等人[17]对100个废弃木材样本的NIR数据进行了标准正态变量(SNV)和Savitzky–Golay(S-G)平滑处理,使用三种不同算法获得了高识别性能。
这些研究证明了NIR在通用木材分类中的可行性,为进一步应用于更复杂的木材类型奠定了基础。
在成功识别常见木材类型的基础上,研究人员将NIR光谱技术的应用扩展到了高价值、濒危和热带硬木物种。Raobelina等人[18]使用偏最小二乘判别分析(PLS-DA)区分了马达加斯加的四种Dalbergia物种,心材的识别准确率为83.3%,边材为81.8%;Park等人[19]在更宽的680–2600 nm光谱范围内分析了三种经济价值较高的软木(花旗松、辐射松和杉木),并确定了影响模型性能的关键因素。
为了进一步提高鉴定准确性,多项研究探索了不同的光谱预处理策略。Rojas-Rioseco等人[20]使用NIR光谱(400–1037 nm)结合SNV预处理成功区分了种子的地理来源;Tuncer[21]应用了多种预处理技术(包括MSC、SNV和S-G平滑)及其组合,利用833–2500 nm范围内的光谱区分了亲缘关系密切的物种。
此外,Xue等人[22]使用PLS-DA和支持向量机(SVM)模型基于982–2562 nm光谱数据对五种热带硬木进行了分类;Novaes等人[23]使用1100–2500 nm范围内的数据实现了99.2%的识别准确率。
尽管这些研究证明了NIR光谱在高级木材鉴定中的可行性,但大多数以往的研究依赖于全光谱或固定带宽分析。目前对波长区间选择和光谱预处理方法组合对鉴定性能影响的系统评估关注较少。解决这一问题是提高基于NIR的木材鉴定系统稳健性、准确性和可解释性的关键。
NIR光谱在木材鉴定中的有效性与其光谱配置和光谱仪性能密切相关。这类仪器通常分为便携式现场光谱仪和实验室台式光谱仪[24]。这类仪器的广泛可用性促进了NIR技术的广泛应用。然而,不同仪器之间的光谱覆盖范围存在差异,且缺乏标准化,因此研究人员通常根据具体设备和实验目的选择不同的光谱范围。
本研究提出了以下假设:(I) 来自不同波长区间的近红外光谱——可见光-近红外(Vis–NIR,350–2500 nm)、短波近红外(SW-NIR,700–1100 nm)、长波近红外(LW-NIR,1100–2500 nm)和全光谱范围(700–2500 nm)——对所研究的八种红木物种具有不同的鉴别能力;(II) 光谱预处理技术的选择显著影响鉴定性能;(III) 本研究中考虑的三种机器学习分类器(PLS-DA、SVM和LSTM)在区分目标物种方面具有相当的总体准确性。
基于这些假设,本研究探讨了结合多种预处理策略和机器学习算法的近红外光谱技术,以开发用于中国国家标准中规定的八种红木物种的快速、无损且可靠的鉴定模型:Pterocarpus santalinusDalbergia bariensisPterocarpus erinaceusPterocarpus macrocarpusMillettia laurentiiDalbergia cochinchinensisDalbergia louveliiDalbergia retusa

样本收集与制备

本研究分析了八种珍贵木材物种:Pterocarpus santalinusDalbergia bariensisPterocarpus erinaceusPterocarpus macrocarpusMillettia laurentiiDalbergia cochinchinensisDalbergia louveliiDalbergia retusa
所有样本均经过专业植物学家的验证,以确保物种鉴定的准确性和数据集的可靠性(图1)。

预处理效果评估

在近红外光谱中,预处理是减少噪声、校正基线漂移和补偿散射及其他光谱失真的关键步骤。为此,我们采用了一系列预处理技术来提高光谱质量并突出特征信息:MSC和SNV用于校正光散射效应,S-G平滑用于减弱高频噪声,均值中心化(Center)用于消除恒定的光谱数据偏移。
Savitzky–Golay(S–G)平滑

讨论

本研究系统评估了七种光谱预处理方案、四种波长窗口和三种识别算法(LSTM、PLS-DA和SVM)对八种红木物种鉴定的联合效果,共获得了84种模型-预处理组合。结果表明,预处理的效果既依赖于方法也依赖于顺序。Savitzky–Golay(S-G)平滑在抑制高频噪声方面表现出优越能力,而SNV和

结论

研究表明,近红外光谱技术,特别是在截短长波区域(1100–2150 nm),提供了一种稳健且无损的精确红木物种鉴别方法。通过系统优化预处理策略、光谱带和分类算法,所提出的框架实现了高识别性能,最佳模型的准确率达到98.53%。
尽管取得了这些有希望的结果,但目前的模型仍需进一步改进

研究伦理

不适用。

研究资金

本研究得到了中央高校基本科研业务费(2572025AW84)、黑龙江省重点研发计划(GA21C030)和国家重点研发计划(2024YFD220070406)的支持。

未引用参考文献

[50]

利益冲突声明

作者声明他们没有已知的可能会影响本文研究工作的财务利益或个人关系。

致谢

在本文的翻译过程中,我们使用了ChatGPT进行英文翻译和润色。但需要注意的是,本研究中的实验数据是真实可靠的,研究思想和方法基于积累的经验,而非人工智能生成。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号