Results and discussion(结果与讨论):
3.1. ATR-FTIR spectral characteristics of active ingredients and excipients(活性成分与辅料的ATR-FTIR光谱特征):
研究人员通过光谱图确认LD、CD、BZ及辅料混合物在900–1800 cm?1区域有特征振动,但也存在显著重叠(如LD与CD在1100–1600 cm?1)及辅料干扰,表明需多变量方法而非单峰定量。
3.2. Replicate quality control and outlier rejection(重复质量控制与离群值剔除):
研究人员利用SG平滑+SNV预处理后的PCA,基于99%置信T2与95%置信Q残差剔除了6.55%的重复光谱(54/824),保留了均值与中位数代表性光谱。
3.3. Screening of preprocessing pipelines(预处理流程筛选):
研究人员通过简化栅栏模型(逻辑回归+PLS)结合嵌套交叉验证评估8种预处理,确定“SG一阶导数+SNV应用于均值光谱”为全局最优(最低平均秩3.80),其在LD和BZ上RMSEpos,TP分别为9.377和3.384,分类指标优良;均值光谱优于中位数光谱。
3.4. Classifier selection(分类器选择):
研究人员比较3个光谱区与3种分类器,确定LD在半区最优为逻辑回归(BAcc 0.955),BZ在半区最优为逻辑回归(完美性能),CD在指纹区最优为SVC(BAcc 0.908),在半区与全区最优为RF(BAcc约0.90)。CD因浓度最低且光谱与LD重叠最具分类挑战。
3.5. Regressor selection and final model(回归器选择与最终模型):
研究人员发现单输出模式(各API单独回归)优于多输出模式,RF单输出在半区为最佳整体配置(平均秩6.40)。LD最佳为RF单输出半区(RMSEpos,TP8.635),BZ明显为RF主导,CD最佳为PLS单输出全区(1.353),但全局RF单输出半区仍最合理。微调后最终模型参数为:BZ(逻辑回归C=6.639,RF回归max_depth=21.5等)、CD(RF分类max_depth=21.5等,RF回归max_depth=35.0等)、LD(逻辑回归C=13.163,RF回归max_depth=25.0等)。
3.6. Performance on commercial samples(市售样品表现):
3.6.1. Recovery in excipient matrices(辅料基质加标回收):
研究人员在合成辅料压片中添加三水平API,平均回收率LD 94–106%,BZ 94–106%,CD除低水平外94–106%;RSD 5.9–12.7%,配对t检验显示ATR-FTIR与HPLC-DAD无显著差异(p>0.05)。
3.6.2. Direct application(直接应用):
直接应用优化栅栏模型至3个市售压片,分类召回与精确率为1.0;定量上LD误差-1.61%至14.74%,BZ误差10.58%,CD误差-17.69%至-17.79%。LD/BZ配方尚可,LD/CD配方偏差较大(LD高估、CD低估),归因于合成校正集与市售LD/CD产品的基质相似性较低。
3.6.3. Calibration transfer(校正转移):
采用6个额外市售压片(每品牌2个)进行100次重复产品平衡3/3拆分校正转移后,所有API定量表现提升:LD误差降至-9.39%至13.74%,BZ误差降至4.41%,CD误差显著降至-10.88%与-10.56%;IQR较窄,证明少量真实样品可有效锚定域并减少不匹配,尤其利于CD。
3.7. Greenness assessment of developed ATR-FTIR/machine learning approach(所开发ATR-FTIR/机器学习方法的绿色度评估):
研究人员使用AGREE工具,将109个校正样本(103合成+6市售)与3个真实样品一并计入,ATR-FTIR/机器学习得分为0.75,HPLC-DAD为0.57,证明前者虽需较多校正样本但仍为更环保的快速筛查法。
3.8. Limitations and future development(局限性与未来展望):
研究人员指出市售验证集较小(仅9个压片)、合成样本辅料剖面固定可能导致域不匹配、未测试XGBoost与1D-CNN等更高级算法(受限于样本量)等局限,建议未来扩展校正域(多样辅料剖面、更多品牌与批次)以构建更广泛适用的多API固体制剂质控框架。