基于衰减全反射-傅里叶变换红外光谱(ATR-FTIR)结合栅栏模型(Hurdle Modelling)与机器学习的抗帕金森病片剂中左旋多巴(Levodopa)、卡比多巴(Carbidopa)和苄丝肼(Benserazide)的绿色同步定量分析法

《RSC Advances》:Green simultaneous quantification of levodopa, carbidopa, and benserazide in anti-Parkinson's tablets by ATR-FTIR spectroscopy combined with hurdle modelling and machine learning

【字体: 时间:2026年05月20日 来源:RSC Advances 4.6

编辑推荐:

  在这项研究中,研究人员开发了一种集成栅栏模型(Hurdle Modelling)工作流程,结合衰减全反射-傅里叶变换红外光谱(ATR-FTIR)与机器学习,用于同步定量抗帕金森病药物中的左旋多巴(LD)、卡比多巴(CD)和苄丝肼(BZ)。研究人员制备了103个

  
在这项研究中,研究人员开发了一种集成栅栏模型(Hurdle Modelling)工作流程,结合衰减全反射-傅里叶变换红外光谱(ATR-FTIR)与机器学习,用于同步定量抗帕金森病药物中的左旋多巴(LD)、卡比多巴(CD)和苄丝肼(BZ)。研究人员制备了103个合成压片组成的校正集,涵盖三种活性药物成分(APIs)的宽浓度范围(LD为0–80% w/w,BZ为0–40% w/w,CD为0–8% w/w),并使用ATR-FTIR和高效液相色谱-二极管阵列检测器(HPLC-DAD)参比方法进行分析。此外,研究人员使用来自三种市售药物的9个压片进行外部评估和校正转移。研究人员针对每种分析物采用了两阶段栅栏模型,包括用于存在/缺席的分类器,以及仅拟合阳性样本以预测浓度的回归器。建模工作流程包含四个模块,其中Savitzky–Golay一阶导数结合平均光谱上的标准正态变量(SNV)是最合适的预处理方法。研究人员选择LD和BZ的逻辑回归(Logistic Regression)、CD的支持向量分类(SVC)作为最优分类器,而随机森林(RF)回归在半光谱区域(675–1800 cm?1)是所有API的最佳总体回归器。当应用于市售样品时,模型分类器正确识别了所有API的存在/缺席,并且仅使用六个额外市售压片进行校正转移显著减少了所有三种API的偏差,同时获得了较高的AGREE绿色评分(0.75)。这些结果表明,ATR-FTIR结合精心设计的栅栏模型工作流程,可为抗帕金森病药物中的多API提供快速绿色的筛查工具。
论文解读:基于ATR-FTIR与栅栏模型及机器学习的抗帕金森病片剂多组分绿色同步定量分析
研究背景与意义:
帕金森病(Parkinson's disease)是一种常见的慢性神经退行性疾病,全球受影响人数超过600万,其中越南约有60万患者。该病的主要病理特征是中脑黑质多巴胺能神经元的进行性丢失,导致运动症状(如震颤、强直、运动迟缓)及非运动症状。左旋多巴(Levodopa, LD)是目前对症治疗的主要药物,其可在脑内转化为多巴胺以补偿缺陷。然而,大部分LD在外周组织中会被多巴脱羧酶代谢为多巴胺,不仅降低了入脑量,还易引起副作用。因此,临床常将LD与外周脱羧酶抑制剂卡比多巴(Carbidopa, CD)或苄丝肼(Benserazide, BZ)制成固定剂量复方制剂(如Madopar?和Syndopa?)以增加生物利用度并减少不良反应。由于这些药物需长期服用于脆弱患者群体,且在中低收入国家(如越南)劣质和假冒药品报告频发,严格的质量控制至关重要。传统的高效液相色谱(HPLC)虽为各国药典推荐的参比方法,具有高灵敏度和选择性,但其通常涉及多步样品前处理、消耗大量有机溶剂且分析时间较长,难以满足大批量快速筛查的需求。振动光谱(如衰减全反射-傅里叶变换红外光谱,ATR-FTIR)结合化学计量学因快速、低溶剂消耗及非破坏性特点成为绿色分析的有力候选,但此前研究多集中于二元混合物、简单基质或溶液相测量,且未深入解决从实验室合成混合物到复杂市售片剂的校正转移(Calibration Transfer)及域不匹配(Domain Mismatch)问题,同时也缺乏对多活性成分(Multi-API)同时存在结构零值(即某种API在某样品中完全不存在)时的专门建模策略。为此,Manh Huy Nguyen、Thanh Dam Nguyen、Hong Anh Duong及Hung Viet Pham等研究人员在《RSC Advances》上发表了该项研究,旨在开发一种集成ATR-FTIR与机器学习的流程,通过两阶段栅栏模型(Two-stage Hurdle Model)实现抗帕金森病片剂中LD、CD和BZ的同步鉴别与定量,并评估其绿色性及校正转移效果。
主要关键技术方法:
研究人员首先制备了103个合成压片校正集(LD 0–80%,BZ 0–40%,CD 0–8% w/w,固定辅料比例)和9个市售压片(来自越南河内药店的Madopar?、Syndopa?和Evertogen?品牌,2025年12月购入),所有压片均进行ATR-FTIR光谱采集(675–4000 cm?1,64次扫描,2 cm?1分辨率)和HPLC-DAD参比含量测定。研究采用四模块建模工作流程:1. 重复光谱的质量控制与代表性光谱聚合(基于PCA的Hotelling's T2与Q残差离群值检测,计算均值与中位数光谱);2. 预处理流程系统筛选(8种组合,如原始+SNV、SG平滑/导数+SNV/MSC);3. 栅栏模型框架下的分类器与回归器选择与优化(分类器:逻辑回归、SVC、RF;回归器:PLS、PCR、SVR、RF,涉及指纹区、半区675–1800 cm?1及全区,通过3次重复×5折嵌套分组交叉验证进行模型选择与超参数调优);4. 应用于市售样品及校正转移(直接预测与基于6个额外市售压片的重复产品平衡拆分校正转移策略)。绿色度评估采用AGREE计算器工具。
研究结果:
  1. 1.
    Introduction(引言):
    研究人员指出帕金森病治疗的临床需求及现行质量控制的局限性,阐明HPLC的缺点与ATR-FTIR的优势,明确现有研究在多API同步定量、复杂辅料背景、结构零值处理及校正转移方面的不足,从而提出本研究的目标。
  2. 2.
    Experimental(实验部分):
    研究人员详细描述了化学品来源(LD、CD、BZ标准品及微晶纤维素等辅料)、样品集构建(103个合成压片按单API、双API、三API及无API分类;45个市售片剂制成9个压片,分为外部评估集3个与校正转移集6个)、ATR-FTIR测量参数(Nicolet iN10 MX,Ge晶体,15 mbar接触压力,25°C,<40% RH,每压片8条光谱)、HPLC-DAD参比方法(C18柱,磷酸盐缓冲液pH 3.8含辛烷磺酸钠,流速1.06 mL/min,检测波长280 nm for LD/CD, 210 nm for BZ,方法经验证线性、精密度与准确度合格)以及四模块研究设计与建模策略(两阶段栅栏模型:先分类存在/缺席,再对阳性样本回归;嵌套交叉验证防信息泄漏)。
  3. 3.
    Results and discussion(结果与讨论):
    3.1. ATR-FTIR spectral characteristics of active ingredients and excipients(活性成分与辅料的ATR-FTIR光谱特征):
    研究人员通过光谱图确认LD、CD、BZ及辅料混合物在900–1800 cm?1区域有特征振动,但也存在显著重叠(如LD与CD在1100–1600 cm?1)及辅料干扰,表明需多变量方法而非单峰定量。
    3.2. Replicate quality control and outlier rejection(重复质量控制与离群值剔除):
    研究人员利用SG平滑+SNV预处理后的PCA,基于99%置信T2与95%置信Q残差剔除了6.55%的重复光谱(54/824),保留了均值与中位数代表性光谱。
    3.3. Screening of preprocessing pipelines(预处理流程筛选):
    研究人员通过简化栅栏模型(逻辑回归+PLS)结合嵌套交叉验证评估8种预处理,确定“SG一阶导数+SNV应用于均值光谱”为全局最优(最低平均秩3.80),其在LD和BZ上RMSEpos,TP分别为9.377和3.384,分类指标优良;均值光谱优于中位数光谱。
    3.4. Classifier selection(分类器选择):
    研究人员比较3个光谱区与3种分类器,确定LD在半区最优为逻辑回归(BAcc 0.955),BZ在半区最优为逻辑回归(完美性能),CD在指纹区最优为SVC(BAcc 0.908),在半区与全区最优为RF(BAcc约0.90)。CD因浓度最低且光谱与LD重叠最具分类挑战。
    3.5. Regressor selection and final model(回归器选择与最终模型):
    研究人员发现单输出模式(各API单独回归)优于多输出模式,RF单输出在半区为最佳整体配置(平均秩6.40)。LD最佳为RF单输出半区(RMSEpos,TP8.635),BZ明显为RF主导,CD最佳为PLS单输出全区(1.353),但全局RF单输出半区仍最合理。微调后最终模型参数为:BZ(逻辑回归C=6.639,RF回归max_depth=21.5等)、CD(RF分类max_depth=21.5等,RF回归max_depth=35.0等)、LD(逻辑回归C=13.163,RF回归max_depth=25.0等)。
    3.6. Performance on commercial samples(市售样品表现):
    3.6.1. Recovery in excipient matrices(辅料基质加标回收):
    研究人员在合成辅料压片中添加三水平API,平均回收率LD 94–106%,BZ 94–106%,CD除低水平外94–106%;RSD 5.9–12.7%,配对t检验显示ATR-FTIR与HPLC-DAD无显著差异(p>0.05)。
    3.6.2. Direct application(直接应用):
    直接应用优化栅栏模型至3个市售压片,分类召回与精确率为1.0;定量上LD误差-1.61%至14.74%,BZ误差10.58%,CD误差-17.69%至-17.79%。LD/BZ配方尚可,LD/CD配方偏差较大(LD高估、CD低估),归因于合成校正集与市售LD/CD产品的基质相似性较低。
    3.6.3. Calibration transfer(校正转移):
    采用6个额外市售压片(每品牌2个)进行100次重复产品平衡3/3拆分校正转移后,所有API定量表现提升:LD误差降至-9.39%至13.74%,BZ误差降至4.41%,CD误差显著降至-10.88%与-10.56%;IQR较窄,证明少量真实样品可有效锚定域并减少不匹配,尤其利于CD。
    3.7. Greenness assessment of developed ATR-FTIR/machine learning approach(所开发ATR-FTIR/机器学习方法的绿色度评估):
    研究人员使用AGREE工具,将109个校正样本(103合成+6市售)与3个真实样品一并计入,ATR-FTIR/机器学习得分为0.75,HPLC-DAD为0.57,证明前者虽需较多校正样本但仍为更环保的快速筛查法。
    3.8. Limitations and future development(局限性与未来展望):
    研究人员指出市售验证集较小(仅9个压片)、合成样本辅料剖面固定可能导致域不匹配、未测试XGBoost与1D-CNN等更高级算法(受限于样本量)等局限,建议未来扩展校正域(多样辅料剖面、更多品牌与批次)以构建更广泛适用的多API固体制剂质控框架。
结论(Conclusions):
研究人员成功建立了集成ATR-FTIR与机器学习的流程,通过两阶段栅栏模型处理多产品数据的结构零值,系统筛选出SG一阶导数+SNV均值光谱在675–1800 cm?1区结合单输出RF回归与适宜分类器为最优方案。直接应用可完美分类API存在/缺席但定量因配方而异;仅用6个额外市售压片校正转移可降低所有API中位偏差,CD改善尤为明显。该方法可作为抗帕金森病多API制剂的快速绿色筛查工具,并为其他复杂固体制剂的多API定量质控提供可扩展框架。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号