基于衰减全反射-傅里叶变换红外光谱（ATR-FTIR）结合栅栏模型（Hurdle Modelling）与机器学习的抗帕金森病片剂中左旋多巴（Levodopa）、卡比多巴（Carbidopa）和苄丝肼（Benserazide）的绿色同步定量分析法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《RSC Advances》：Green simultaneous quantification of levodopa, carbidopa, and benserazide in anti-Parkinson's tablets by ATR-FTIR spectroscopy combined with hurdle modelling and machine learning

【字体：大中小】 时间：2026年05月20日 来源：RSC Advances 4.6

编辑推荐：

　　在这项研究中，研究人员开发了一种集成栅栏模型（Hurdle Modelling）工作流程，结合衰减全反射-傅里叶变换红外光谱（ATR-FTIR）与机器学习，用于同步定量抗帕金森病药物中的左旋多巴（LD）、卡比多巴（CD）和苄丝肼（BZ）。研究人员制备了103个

在这项研究中，研究人员开发了一种集成栅栏模型（Hurdle Modelling）工作流程，结合衰减全反射-傅里叶变换红外光谱（ATR-FTIR）与机器学习，用于同步定量抗帕金森病药物中的左旋多巴（LD）、卡比多巴（CD）和苄丝肼（BZ）。研究人员制备了103个合成压片组成的校正集，涵盖三种活性药物成分（APIs）的宽浓度范围（LD为0–80% w/w，BZ为0–40% w/w，CD为0–8% w/w），并使用ATR-FTIR和高效液相色谱-二极管阵列检测器（HPLC-DAD）参比方法进行分析。此外，研究人员使用来自三种市售药物的9个压片进行外部评估和校正转移。研究人员针对每种分析物采用了两阶段栅栏模型，包括用于存在/缺席的分类器，以及仅拟合阳性样本以预测浓度的回归器。建模工作流程包含四个模块，其中Savitzky–Golay一阶导数结合平均光谱上的标准正态变量（SNV）是最合适的预处理方法。研究人员选择LD和BZ的逻辑回归（Logistic Regression）、CD的支持向量分类（SVC）作为最优分类器，而随机森林（RF）回归在半光谱区域（675–1800 cm?1）是所有API的最佳总体回归器。当应用于市售样品时，模型分类器正确识别了所有API的存在/缺席，并且仅使用六个额外市售压片进行校正转移显著减少了所有三种API的偏差，同时获得了较高的AGREE绿色评分（0.75）。这些结果表明，ATR-FTIR结合精心设计的栅栏模型工作流程，可为抗帕金森病药物中的多API提供快速绿色的筛查工具。

论文解读：基于ATR-FTIR与栅栏模型及机器学习的抗帕金森病片剂多组分绿色同步定量分析

研究背景与意义：

帕金森病（Parkinson's disease）是一种常见的慢性神经退行性疾病，全球受影响人数超过600万，其中越南约有60万患者。该病的主要病理特征是中脑黑质多巴胺能神经元的进行性丢失，导致运动症状（如震颤、强直、运动迟缓）及非运动症状。左旋多巴（Levodopa, LD）是目前对症治疗的主要药物，其可在脑内转化为多巴胺以补偿缺陷。然而，大部分LD在外周组织中会被多巴脱羧酶代谢为多巴胺，不仅降低了入脑量，还易引起副作用。因此，临床常将LD与外周脱羧酶抑制剂卡比多巴（Carbidopa, CD）或苄丝肼（Benserazide, BZ）制成固定剂量复方制剂（如Madopar?和Syndopa?）以增加生物利用度并减少不良反应。由于这些药物需长期服用于脆弱患者群体，且在中低收入国家（如越南）劣质和假冒药品报告频发，严格的质量控制至关重要。传统的高效液相色谱（HPLC）虽为各国药典推荐的参比方法，具有高灵敏度和选择性，但其通常涉及多步样品前处理、消耗大量有机溶剂且分析时间较长，难以满足大批量快速筛查的需求。振动光谱（如衰减全反射-傅里叶变换红外光谱，ATR-FTIR）结合化学计量学因快速、低溶剂消耗及非破坏性特点成为绿色分析的有力候选，但此前研究多集中于二元混合物、简单基质或溶液相测量，且未深入解决从实验室合成混合物到复杂市售片剂的校正转移（Calibration Transfer）及域不匹配（Domain Mismatch）问题，同时也缺乏对多活性成分（Multi-API）同时存在结构零值（即某种API在某样品中完全不存在）时的专门建模策略。为此，Manh Huy Nguyen、Thanh Dam Nguyen、Hong Anh Duong及Hung Viet Pham等研究人员在《RSC Advances》上发表了该项研究，旨在开发一种集成ATR-FTIR与机器学习的流程，通过两阶段栅栏模型（Two-stage Hurdle Model）实现抗帕金森病片剂中LD、CD和BZ的同步鉴别与定量，并评估其绿色性及校正转移效果。

主要关键技术方法：

研究人员首先制备了103个合成压片校正集（LD 0–80%，BZ 0–40%，CD 0–8% w/w，固定辅料比例）和9个市售压片（来自越南河内药店的Madopar?、Syndopa?和Evertogen?品牌，2025年12月购入），所有压片均进行ATR-FTIR光谱采集（675–4000 cm^?1，64次扫描，2 cm^?1分辨率）和HPLC-DAD参比含量测定。研究采用四模块建模工作流程：1. 重复光谱的质量控制与代表性光谱聚合（基于PCA的Hotelling's T²与Q残差离群值检测，计算均值与中位数光谱）；2. 预处理流程系统筛选（8种组合，如原始+SNV、SG平滑/导数+SNV/MSC）；3. 栅栏模型框架下的分类器与回归器选择与优化（分类器：逻辑回归、SVC、RF；回归器：PLS、PCR、SVR、RF，涉及指纹区、半区675–1800 cm^?1及全区，通过3次重复×5折嵌套分组交叉验证进行模型选择与超参数调优）；4. 应用于市售样品及校正转移（直接预测与基于6个额外市售压片的重复产品平衡拆分校正转移策略）。绿色度评估采用AGREE计算器工具。

研究结果：

1.
Introduction（引言）：

研究人员指出帕金森病治疗的临床需求及现行质量控制的局限性，阐明HPLC的缺点与ATR-FTIR的优势，明确现有研究在多API同步定量、复杂辅料背景、结构零值处理及校正转移方面的不足，从而提出本研究的目标。
2.
Experimental（实验部分）：

研究人员详细描述了化学品来源（LD、CD、BZ标准品及微晶纤维素等辅料）、样品集构建（103个合成压片按单API、双API、三API及无API分类；45个市售片剂制成9个压片，分为外部评估集3个与校正转移集6个）、ATR-FTIR测量参数（Nicolet iN10 MX，Ge晶体，15 mbar接触压力，25°C，<40% RH，每压片8条光谱）、HPLC-DAD参比方法（C18柱，磷酸盐缓冲液pH 3.8含辛烷磺酸钠，流速1.06 mL/min，检测波长280 nm for LD/CD, 210 nm for BZ，方法经验证线性、精密度与准确度合格）以及四模块研究设计与建模策略（两阶段栅栏模型：先分类存在/缺席，再对阳性样本回归；嵌套交叉验证防信息泄漏）。
3.
Results and discussion（结果与讨论）：

3.1. ATR-FTIR spectral characteristics of active ingredients and excipients（活性成分与辅料的ATR-FTIR光谱特征）：

研究人员通过光谱图确认LD、CD、BZ及辅料混合物在900–1800 cm^?1区域有特征振动，但也存在显著重叠（如LD与CD在1100–1600 cm^?1）及辅料干扰，表明需多变量方法而非单峰定量。

3.2. Replicate quality control and outlier rejection（重复质量控制与离群值剔除）：

研究人员利用SG平滑+SNV预处理后的PCA，基于99%置信T²与95%置信Q残差剔除了6.55%的重复光谱（54/824），保留了均值与中位数代表性光谱。

3.3. Screening of preprocessing pipelines（预处理流程筛选）：

研究人员通过简化栅栏模型（逻辑回归+PLS）结合嵌套交叉验证评估8种预处理，确定“SG一阶导数+SNV应用于均值光谱”为全局最优（最低平均秩3.80），其在LD和BZ上RMSE_pos,TP分别为9.377和3.384，分类指标优良；均值光谱优于中位数光谱。

3.4. Classifier selection（分类器选择）：

研究人员比较3个光谱区与3种分类器，确定LD在半区最优为逻辑回归（BAcc 0.955），BZ在半区最优为逻辑回归（完美性能），CD在指纹区最优为SVC（BAcc 0.908），在半区与全区最优为RF（BAcc约0.90）。CD因浓度最低且光谱与LD重叠最具分类挑战。

3.5. Regressor selection and final model（回归器选择与最终模型）：

研究人员发现单输出模式（各API单独回归）优于多输出模式，RF单输出在半区为最佳整体配置（平均秩6.40）。LD最佳为RF单输出半区（RMSE_pos,TP8.635），BZ明显为RF主导，CD最佳为PLS单输出全区（1.353），但全局RF单输出半区仍最合理。微调后最终模型参数为：BZ（逻辑回归C=6.639，RF回归max_depth=21.5等）、CD（RF分类max_depth=21.5等，RF回归max_depth=35.0等）、LD（逻辑回归C=13.163，RF回归max_depth=25.0等）。

3.6. Performance on commercial samples（市售样品表现）：

3.6.1. Recovery in excipient matrices（辅料基质加标回收）：

研究人员在合成辅料压片中添加三水平API，平均回收率LD 94–106%，BZ 94–106%，CD除低水平外94–106%；RSD 5.9–12.7%，配对t检验显示ATR-FTIR与HPLC-DAD无显著差异（p>0.05）。

3.6.2. Direct application（直接应用）：

直接应用优化栅栏模型至3个市售压片，分类召回与精确率为1.0；定量上LD误差-1.61%至14.74%，BZ误差10.58%，CD误差-17.69%至-17.79%。LD/BZ配方尚可，LD/CD配方偏差较大（LD高估、CD低估），归因于合成校正集与市售LD/CD产品的基质相似性较低。

3.6.3. Calibration transfer（校正转移）：

采用6个额外市售压片（每品牌2个）进行100次重复产品平衡3/3拆分校正转移后，所有API定量表现提升：LD误差降至-9.39%至13.74%，BZ误差降至4.41%，CD误差显著降至-10.88%与-10.56%；IQR较窄，证明少量真实样品可有效锚定域并减少不匹配，尤其利于CD。

3.7. Greenness assessment of developed ATR-FTIR/machine learning approach（所开发ATR-FTIR/机器学习方法的绿色度评估）：

研究人员使用AGREE工具，将109个校正样本（103合成+6市售）与3个真实样品一并计入，ATR-FTIR/机器学习得分为0.75，HPLC-DAD为0.57，证明前者虽需较多校正样本但仍为更环保的快速筛查法。

3.8. Limitations and future development（局限性与未来展望）：

研究人员指出市售验证集较小（仅9个压片）、合成样本辅料剖面固定可能导致域不匹配、未测试XGBoost与1D-CNN等更高级算法（受限于样本量）等局限，建议未来扩展校正域（多样辅料剖面、更多品牌与批次）以构建更广泛适用的多API固体制剂质控框架。

结论（Conclusions）：

研究人员成功建立了集成ATR-FTIR与机器学习的流程，通过两阶段栅栏模型处理多产品数据的结构零值，系统筛选出SG一阶导数+SNV均值光谱在675–1800 cm^?1区结合单输出RF回归与适宜分类器为最优方案。直接应用可完美分类API存在/缺席但定量因配方而异；仅用6个额外市售压片校正转移可降低所有API中位偏差，CD改善尤为明显。该方法可作为抗帕金森病多API制剂的快速绿色筛查工具，并为其他复杂固体制剂的多API定量质控提供可扩展框架。

联系信箱：

粤ICP备09063491号

热点排行