基于FTIR光谱技术的苜蓿营养成分定量分析:一种用于解决光谱重叠问题的网络拓扑方法
《Microchemical Journal》:FTIR spectroscopy-based quantification of nutritional components in alfalfa: A network topology approach for resolving spectral overlap
【字体:
大
中
小
】
时间:2026年01月18日
来源:Microchemical Journal 5.1
编辑推荐:
基于FTIR光谱和NTA特征提取算法,本研究有效解决了苜蓿中淀粉、ADF、NDF因光谱重叠导致检测精度不足的问题。通过构建样本相似性网络,筛选关键波长和区域特征,结合PLSR、CatBoost、KNN模型,预测R2值达0.9112-0.9602,RPD分别为3.35-5.03-2.2,显著优于传统方法,准确率提升23.6%。
杜海军|张雅茹|范春茂|马艳华|宣创中|苏禾
内蒙古农业大学机电工程学院,中国呼和浩特 010018
摘要
快速准确地检测苜蓿中的营养成分对于控制饲料质量至关重要。目前的光谱方法面临重大挑战,因为淀粉、酸性洗涤纤维(ADF)和中性洗涤纤维(NDF)之间存在光谱共线性,这些成分具有相似的化学基团,在傅里叶变换红外光谱(FTIR)中表现出重叠的光谱特征。传统的特征提取方法往往无法区分这些重叠的光谱特征,导致预测精度较低。为了更准确地预测苜蓿中淀粉、ADF和NDF的含量,并解决这三种营养成分在FTIR光谱中的近似和吸收峰重叠问题,提出了一种网络拓扑分析(NTA)特征提取算法。该算法通过评估网络拓扑相似性和节点重要性来确定关键的光谱波长、相应的比例和区域特征。使用NTA对苜蓿的三种营养成分进行预测时,决定系数(R2)分别为0.9112、0.7940和0.9602,性能偏差比(RPD)分别为3.35、5.03和2.2。通过堆叠元学习器进一步优化预测结果,使ADF预测集的R2和RPD分别提高到0.824和2.4。FTIR和NTA特征提取的结合可以准确分析苜蓿的三种营养成分。这种技术有效解决了光谱重叠问题,同时保持了强大的预测稳健性。
引言
苜蓿常被称为“牧草之王”,是反刍动物的主要饲料来源[28]。根据2022年的数据,全球苜蓿干草(包括苜蓿干草和其他牧草)的贸易量约为3600万吨,价值约120亿美元。除了蛋白质含量外,评估苜蓿品质的指标还包括淀粉、酸性洗涤纤维(ADF)和中性洗涤纤维(NDF)等营养成分的水平。淀粉是反刍动物的有效能量来源[8]。NDF有助于调节干物质摄入量,减缓消化物的通过速度,影响瘤胃健康,并提供能量[31]。反刍动物瘤胃中的ADF限制了细胞壁中碳水化合物的降解;饲料中的ADF含量越低,其营养价值和能量价值越高[30]。因此,反刍动物饲料需要平衡淀粉与NDF以及ADF的比例,以防止瘤胃酸中毒(由快速淀粉发酵引起)或能量不足(由过量ADF引起)。目前,检测饲料中淀粉、NDF和ADF的含量主要依赖于ISO标准,但这些方法具有破坏性、耗时且成本高昂。为了满足苜蓿产品流通的检测需求,使用光谱技术快速检测饲料营养成分已成为一种重要趋势[23]。
傅里叶变换红外光谱(FTIR)以其速度快、无破坏性和高灵敏度而著称,在预测食品成分方面显示出巨大的潜力,有望取代传统的食品分析技术。作为一种无破坏性检测方法,FTIR在预测小麦蛋白质、淀粉、面筋和脂肪含量方面表现出有效性[32]。Hell等人使用FTIR光谱预测麸皮中的淀粉含量时获得了0.86的R2值,预测不溶性膳食纤维时获得了0.90的R2值[21]。Wen将FTIR与机器学习方法结合,预测玉米秸秆中的木质素含量,获得了高达0.91的R2值[39]。Du等人利用FTIR快速准确地测定了苜蓿中的粗蛋白含量,R2值为0.99[6]。
然而,FTIR光谱中淀粉、纤维素等物质的吸收峰在特定波长范围内可能非常接近甚至重叠,这使得光谱数据中不同成分的信息分离变得复杂。共线性干扰阻碍了各成分含量的准确量化,影响了质量评估的精度[38]。酸性洗涤纤维主要由纤维素、半纤维素和无机物质组成,含有(-OH)等化学基团、β-1,4-糖苷键、醚键(C-O-C)和碳-碳键(C-C)[24]。中性洗涤纤维主要由纤维素、半纤维素、木质素和提取物组成,与酸性洗涤纤维相比,还包含C=O键、甲基基团(-CH?)和酯基团(-COO-) [27],[34]。淀粉由两种葡萄糖聚合物组成——直链淀粉( amylose)和支链淀粉(amylopectin),主要包含羟基(-OH)和糖苷键(C-O-C) [17],[42]。Cleland通过分析化学键的特征吸收波长来识别和量化样品中的化学成分。OH基团的最显著吸收带位于1040 cm?1,C=O伸缩振动在1730 cm?1处有特征吸收带,C-H伸缩振动在2850和2920 cm?1处有明显的吸收带。适当的数据预处理可以减轻水中的-OH键对化学成分的干扰[3]。通过将FTIR光谱与PLS回归分析结合使用来确定木材成分含量,发现在1800–850 cm?1的指纹区域内,许多峰对应于纤维素、半纤维素和木质素,碳水化合物和木质素之间有共同的峰。在1600 cm?1附近,峰与半纤维素和提取物化合物中的C=O键振动对齐[18]。Cleland利用FTIR评估饲料的营养品质,实现了半纤维素和NDF检测的高精度,但ADF检测的R2值为0.7,RPD值为1.79[3]。检测相关营养成分的准确性需要进一步提高。
最近的研究尝试解决了光谱共线性问题。Xu等人采用区间偏最小二乘法(iPLS)提取与蛋白质含量高度相关的特征波长,有效提高了玉米质量检测的预测精度[41]。Yousefi等人利用基于稀疏主成分分析(SPCA)的低秩矩阵分解生成判别特征,同时最小化光谱分析中的共线性效应[43]。然而,这些方法主要在波长变量空间操作,依赖于将光谱划分为预定的区间或施加统计稀疏性约束来缓解共线性。当面对如苜蓿这样的复杂生物材料时,这些方法仍然面临挑战,因为淀粉、ADF和NDF具有相似或相同的化学键结构,它们对应的吸收带严重重叠。为了克服这一限制,本研究引入了一种根本不同的策略:网络拓扑分析(NTA)。与传统方法不同,NTA在样本空间中操作,通过构建光谱之间的相似性网络并识别拓扑上处于中心的样本,这些样本的光谱特征最能代表数据集中的全局结构模式。这种基于拓扑的方法自然捕获了嵌入在样本关系结构中的判别信息,为解决复杂混合物中的重叠成分提供了更稳健的解决方案。因此,NTA框架代表了从变量中心到样本中心的特征选择的新型范式转变,特别适合处理牧草质量评估中固有的复杂光谱共线性问题。
本研究的目标有三个。首先,使用所提出的NTA方法从苜蓿中高度重叠的指纹区域(淀粉、ADF和NDF)识别关键的光谱特征。其次,基于这些NTA选定的特征建立并评估回归模型(PLSR、CatBoost和KNN)。第三,系统地比较NTA与传统全谱建模和传统特征选择技术(如PCA、CARS)的预测性能和稳健性。这项工作为复杂牧草材料的快速、无破坏性质量评估提供了一种实用的、基于拓扑的解决方案。
样本制备
样本制备
苜蓿草样来自内蒙古农业大学的实验田和中国科学院草原研究所的牧草试验基地。第一季和第二季的苜蓿分别在6月和9月收获。苜蓿品种包括中玉10号苜蓿和草原3号混合苜蓿等。收集的苜蓿草样放置在受控环境中(温度25摄氏度;相对湿度……
描述性统计分析和光谱吸收度的预处理
为了阐明光谱信号的化学基础,我们首先分析了指纹区域(4000–4000 cm?1)的FTIR吸收特征,以识别与淀粉、ADF和NDF直接相关的特征官能团,如图2所示。
光谱可以分为不同的功能区域。在高频区域(4000–2500 cm?1),在3300–2500 cm?1观察到宽的O-H伸缩振动,3435 cm?1处有一个明显的峰值[7],[10]。该区域与……
结论
本研究成功开发了一种快速、无破坏性的苜蓿质量检测系统(淀粉、NDF和ADF),该系统结合了FTIR光谱和新型网络拓扑分析(NTA)特征提取算法。主要创新在于使用NTA来解决指纹区域中碳水化合物成分的严重光谱共线性和吸收带重叠问题,这些问题传统光谱分析难以解决。通过将光谱样本作为节点映射到相似性网络中……
CRediT作者贡献声明
杜海军:写作 – 审稿与编辑,撰写原始稿件,可视化,软件开发,项目管理,方法论,数据管理。张雅茹:写作 – 审稿与编辑,方法论,形式分析。范春茂:形式分析,数据管理,概念化。马艳华:写作 – 审稿与编辑,资源管理,项目管理,方法论,概念化。宣创中:软件开发,资源管理,方法论。苏禾:验证,监督,研究。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的财务利益或个人关系。
致谢
本工作部分得到了内蒙古自治区科学技术规划项目(编号2023YFDZ0037)、国家自然科学基金(编号32060771)、内蒙古农业大学基本研究基金(编号BR221314、BR221032)以及内蒙古农业大学跨学科研究基金(编号BR231517)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号