《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》:Research on data-driven rapid nondestructive quality evaluation method,
Calculus Bovis as an example
编辑推荐:
本研究针对动物源性中药牛黄(C. bovis)质量控制中存在的空间异质性和便携设备分辨率低问题,构建了融合便携近红外光谱、多位置光谱融合及机器学习的数据驱动框架。通过低级(原始光谱拼接)和中级(特征拼接)融合策略结合变量选择优化,线性分类模型实现96.70%的定性分类准确率,中阶模型在定量分析中表现优异(R2=0.9450,RPD=2.89),为复杂天然产物现场快速检测提供新范式。
田梦茵|马晓波|臧恒昌
山东中医药大学数字传统中药重点实验室,中国济南250355
摘要
为了解决传统方法在检测动物源产品时由于空间异质性和便携式仪器分辨率有限而导致的低准确性问题,本研究构建了一个数据驱动的快速无损分析框架,该框架整合了便携式近红外光谱技术、多位置光谱融合和机器学习算法。通过对牛胆结石(Calculus bovis)进行低层次(原始光谱拼接)和中层次(特征拼接)融合处理,并结合变量选择方法,优化了分析模型。定性分析表明,优化后的线性模型准确率达到96.70%。定量分析结果显示,中层次模型的性能优于其他模型,其R2值为0.9450,RPD值为2.89。该框架满足了分析化学在现场检测效果和定性/定量精度方面的需求,为复杂天然产物的分析提供了可推广的分析范式。
引言
牛胆结石(Calculus bovis,来源于Bos taurus domesticus的干燥胆结石)是一种具有生物活性的天然产物,在众多经典中药配方中发挥着重要作用。市面上的牛胆结石主要来源于三种途径:天然提取、体外培养和人工合成[1]。其化学成分和活性成分的含量直接决定了中药制剂及相关产品的安全性和生物效力,因此质量控制对于确保中药行业的临床疗效和安全性至关重要[2]、[3]、[4]。然而,由于其显著的临床疗效和高市场价值,市场上存在严重的假冒现象。因此,迫切需要可靠的分析方法来鉴定牛胆结石的质量,特别是针对来源认证和活性成分的定量分析,以保证相关产品的化学安全性和疗效。中药的质量控制面临着动物源材料固有的空间异质性、便携式分析仪器分辨率有限以及定性分析与定量分析之间的脱节等问题。近红外(NIR)光谱技术作为一种快速质量控制工具展现出巨大潜力,但现有方法在处理复杂中药样品时仍存在局限性[5]。尽管便携式NIR光谱仪具有现场应用的优势,但其光谱范围较窄、分辨率较低,导致分析效果受到影响[6]、[7]。当前国际上的数据融合研究主要集中在多传感器集成方面,而较少关注样品异质性问题;变量选择方法往往依赖单一算法,缺乏有效的噪声降低能力。
虽然以往的研究通过融合不同仪器的数据来提高样品来源的可追溯性,但本文提出的基于单一样品多位置光谱的中层次融合方法有效缓解了局部采样带来的偏差问题,这正是动物源中药分析中的一个关键需求[8]、[9]。最近的研究主要关注便携式NIR技术在食品和中药分析中的应用,但研究对象多为均匀的植物源材料,或者因仪器限制而接受了较低的准确率[9]。在数据融合领域,已有研究将FT-MIR和NIR光谱进行高级融合以实现地理溯源,但目前尚未有研究针对异质性动物源中药进行多位置融合分析[10]、[11]。例如,有研究使用中层次数据融合技术模拟人类识别模式,成功将姜黄根茎的加工阶段预测准确率提升至100%[12];还有研究结合激光诱导击穿光谱技术和NIR光谱以及先进的数据处理与融合方法,准确追踪了人参的来源[13]。此外,元素指纹技术虽然强调了成分组合的重要性,但缺乏现场应用能力,而我们的便携式平台在速度和准确性之间取得了平衡。我们之前的研究通过疗效导向的分析确定了鹅去氧胆酸作为牛胆结石质量评估的关键化学标志物,将其确立为化学质量控制的关键指标[14]。
本研究旨在通过开发一种新的数据驱动框架,整合便携式NIR光谱、多位置光谱融合和机器学习技术,填补动物源中药质量控制方法上的空白。为了解决牛胆结石的空间异质性问题,我们采用了多位置光谱融合策略,并系统地应用了变量选择算法来优化模型性能,克服了便携式仪器的光谱分辨率限制。这项工作不仅为牛胆结石的质量控制提供了实用工具,还为复杂天然产物的异质性分析提供了可推广的分析范式,推动了便携式光谱分析技术的发展。
材料
共提供了123份牛胆结石样品,包括三种类型(天然提取、体外培养和人工合成),由山东弘济堂药业有限公司(济南)提供。这些样品分布于41个不同的生产批次中,以确保批次多样性,具体采样信息见表1。天然牛胆结石呈不规则颗粒状或块状,表面颜色从金黄色到深棕色不等,常带有蜡质或结晶光泽。
光谱分析
图1A展示了123份样品在900–1700 nm波长范围内的吸收光谱。虽然各样品的光谱趋势总体相似,但仍存在许多细微差异。为了更深入地分析这些差异,我们对三种类型的牛胆结石光谱进行了平均处理。结果发现,天然提取和体外培养的牛胆结石的光谱曲线更为接近,这表明
解决动物源中药的异质性问题
本研究的创新之处在于其集成和系统的分析方法。与组织成分相对均匀的植物源中药不同,作为动物源中药的牛胆结石存在固有的空间异质性:由于胆结石形成过程的不同,活性成分(如鹅去氧胆酸)在样品中的分布不均匀[39]。这种异质性给传统的单位置光谱分析带来了独特挑战。
结论
本研究以牛胆结石为模型,构建了一个数据驱动的、快速的、无损的分析方法,整合了便携式NIR光谱、多位置光谱融合和机器学习技术。对于牛胆结石来源的定性鉴定,线性分类模型(SG-SNV-VIP)的识别准确率达到96.70%;在鹅去氧胆酸的定量分析方面,支持向量机(SVR)模型(MSC-VIP)表现良好。
作者贡献声明
田梦茵:概念构思、数据整理、正式分析、实验设计、方法验证、初稿撰写及审稿编辑。马晓波:方法设计、验证。臧恒昌:概念构思、审稿编辑。
资助
本研究得到了山东省重点技术研发项目(项目编号:2022CXGC020515)和山东省新旧动能转换重大工业研究项目的支持。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。