《Journal of Food Composition and Analysis》:On-Site Quantification of Polysaccharides in
Dendrobium huoshanense Using a Portable NIR Spectrometer: A Machine Learning Approach with SHAP Interpretation
编辑推荐:
本研究针对霍山石斛这一珍贵药食两用植物缺乏快速可靠质量评估工具的行业痛点,开发了一种结合便携式近红外光谱与机器学习的新型定量方法。研究团队通过系统优化预处理流程(MSC-二阶导数)结合变量筛选算法(UVE),对比评估了BP-ANN、PLSR、RFR和1D-CNN四种模型,最终构建的MSC-2nd Derivative-UVE-RFR混合模型在测试集上达到R2=0.863±0.072、RMSE=1.915±0.299的优异性能。创新性引入SHAP可解释性分析,阐明多糖关联特征波段的定量贡献机制,为中药材现场质量控制提供了绿色高效的解决方案。
在中医药宝库中,霍山石斛(Dendrobium huoshanense)作为珍稀药食同源植物,其核心功效成分——霍山石斛多糖(DHP)的含量直接决定产品品质。然而当前市场存在两大困境:传统检测方法需破坏样品且流程繁琐,无法满足产地快速筛查需求;不同采收批次间多糖含量波动显著(实测范围21.93%-44.42%),部分农户为追求产量提前采收,导致产品质量参差不齐。这种现状不仅影响消费者营养摄入体验,更引发市场对霍山石斛食用品质的信任危机。
为破解这一行业难题,安徽中医药大学研究团队在《Journal of Food Composition and Analysis》发表创新性研究,首次将便携式近红外光谱仪(900-1700 nm)与可解释机器学习相结合,建立起DHP快速定量分析方法。该研究通过对比四种建模策略发现,经多元散射校正(MSC)联合二阶导数(2ndD)预处理、结合无信息变量消除(UVE)算法优化的随机森林回归(RFR)模型表现最佳,测试集预测性能达R2=0.863±0.072,RMSE=1.915±0.299,RPD=3.058±0.753。尤为重要的是,研究引入SHAP可解释性框架,首次揭示1601.87 nm、1025.79 nm和1428.43 nm等特征波段与多糖分子结构的定量关联机制。
技术方法层面,研究团队采用系统化建模流程:采集157批霍山石斛样本的近红外光谱后,先通过蒙特卡洛采样法剔除异常样本,继而比较SNV(标准正态变量变换)、MSC、SG(Savitzky-Golay)平滑、一阶/二阶导数等预处理方法效果,再应用CARS(竞争性自适应重加权采样)、UVE、RF(随机青蛙)三种算法筛选特征波长,最终构建BP-ANN(反向传播人工神经网络)、PLSR(偏最小二乘回归)、RFR和1D-CNN(一维卷积神经网络)四种定量模型。
研究结果呈现多维度突破:
- •
多糖含量测定:紫外分光光度法测定显示6个批次样本DHP含量均符合《中国药典》标准,其中第3批次平均含量最高达40.31%,证实方法适用于实际品质监控
- •
异常样本识别:通过均值-标准差散点图精准识别15、37、58等8个异常样本,为模型稳健性奠定基础
- •
预处理方法优化:发现BP-ANN模型最适合SNV预处理,PLSR模型在SNV+SG平滑组合下表现最优,而RFR和1D-CNN分别最适配MSC+2ndD和MSC预处理
- •
特征波长筛选:CARS算法为不同模型筛选出4-24个核心波长,UVE算法选出56-66个特征波长,RF算法筛选35-46个关键变量,大幅提升模型效率
- •
模型性能对比:横向比较显示RFR模型综合性能最佳,训练集R2达0.976±0.001,测试集R2为0.863±0.072,且SHAP分析揭示其关键特征波长1428.43 nm与多糖吡喃环骨架振动高度相关
讨论部分深入阐释了光谱特征与多糖结构的构效关系:1601.87 nm波段对应多糖分子羟基氢键网络振动,1025.79 nm反映C-H键与糖苷键骨架信息,1428.43 nm则关联吡喃环分支程度。这种结构-光谱对应关系为近红外定量分析提供了理论依据。相比既往研究,本方法创新性实现三个突破:采用便携设备突破实验室检测局限,引入可解释机器学习增强模型透明度,建立适用于野外检测的标准化流程。
该研究成功构建了霍山石斛多糖现场快速定量技术体系,为珍稀药材资源保护与市场质量监管提供了关键技术支撑。所提出的“光谱采集-算法优化-模型解释”一体化解决方案,对推动中药材质量控制从实验室走向产地具有示范意义,也为其他药用植物的无损检测提供了可复用的技术范式。未来通过扩大样本多样性、开展跨设备验证,该技术有望成为中药材质量标准化进程中的重要工具。