机器学习在预测关键颗粒质量属性中的应用:用于建模天然药物特性与工艺属性之间的关系

《Journal of Pharmaceutical Innovation》:Application of Machine Learning in Predicting Critical Granule Quality Attributes for Modeling of Relationship Between the Properties of Natural Medicine and Process Attributes

【字体: 时间:2026年04月01日 来源:Journal of Pharmaceutical Innovation 2.7

编辑推荐:

  天然药物颗粒质量属性预测研究通过构建包含92种材料、18项属性和13个工艺参数的数据库,对比MLP、SVR和RF三种机器学习算法。结果表明MLP在预测产率和脆度时R2值均达0.959以上,平均R2为0.852且MAE最低,验证其在干法制粒工艺中的优越性。

摘要

目的

天然药物颗粒的质量受到材料特性和制造工艺特点的共同影响。对于质地脆弱的草药,准确预测其关键颗粒质量属性(CGQAs,如产量率和脆性)仍然是一个重大挑战。本研究旨在利用机器学习建立一个稳健的决策框架,以实现高质量天然药物颗粒的生产。本研究的目标是开发一个预测模型,并使用多层感知器(MLP)、支持向量机(SVM)和随机森林(RF)技术,识别在评估药物颗粒产量率和脆性时相对重要的因素。

方法

构建了一个数据库,涵盖了92种材料、18个属性和13个工艺参数。利用KNIME 4.7.0作为软件工具,开发并比较了三种机器学习算法:支持向量回归(SVR LibSVM)、随机森林(RF)和多层感知器(MLP)。同时通过参数优化节点对MLP和Nu-SVR、RF进行了模型优化。超参数调整采用贝叶斯优化方法进行,模型性能通过R2(决定系数)和MAE(平均绝对误差)进行评估。比较了三个特征数据集:(I) 降维数据集(Spearman相关系数大于0.2的关键颗粒质量属性特征被单独处理为独立数据集);(II) 原始的22维数据集;(III) 排除了带状密度特征的数据集。

结果

在所有数据集中,MLP的表现均优于SVR(LibSVM)和RF。在数据集II中,MLP获得了最高的R2值0.983和最低的MAE值0.007,显示出出色的预测能力。MLP还获得了最高的平均R2值0.852和最低的平均MAE值0.067。研究表明,MLP模型是预测天然药物配方干法制粒过程中药物颗粒产量率和脆性的最佳模型。

结论

结合多源材料-工艺数据与优化的机器学习算法(尤其是MLP),可以实现天然药物关键颗粒质量属性的准确预测。与单组分或双组分预测模型相比,该模型在预测成分更复杂的药物时更为准确,并具有更广泛的应用范围。本研究的结果有助于更好地理解天然药物的干法制粒过程。

总结

本研究通过构建一个包含92种材料和18个属性的数据库,并应用三种机器学习算法(支持向量回归(SVR LibSVM)、随机森林(RF)和多层感知器(MLP)以及在13个工艺参数下的模型,解决了天然药物关键颗粒质量属性(CGQAs)的预测问题。MLP模型在数据集II(预测产量率,R2 = 0.959)和数据集III(预测脆性,R2 = 0.959)中均取得了最佳性能。在三个数据集中,数据集II在所有模型中的拟合度最高,预测准确性和稳定性也优于其他数据集。该方法支持天然药物颗粒关键质量属性的预测和智能控制。

图形摘要

目的

天然药物颗粒的质量受到材料特性和制造工艺特点的共同影响。对于质地脆弱的草药,准确预测其关键颗粒质量属性(CGQAs,如产量率和脆性)仍然是一个重大挑战。本研究旨在利用机器学习建立一个稳健的决策框架,以实现高质量天然药物颗粒的生产。本研究的目标是开发一个预测模型,并使用多层感知器(MLP)、支持向量机(SVM)和随机森林(RF)技术,识别在评估药物颗粒产量率和脆性时相对重要的因素。

方法

构建了一个数据库,涵盖了92种材料、18个属性和13个工艺参数。利用KNIME 4.7.0作为软件工具,开发并比较了三种机器学习算法:支持向量回归(SVR LibSVM)、随机森林(RF)和多层感知器(MLP)。同时通过参数优化节点对MLP和Nu-SVR、RF进行了模型优化。超参数调整采用贝叶斯优化方法进行,模型性能通过R2(决定系数)和MAE(平均绝对误差)进行评估。比较了三个特征数据集:(I) 降维数据集(Spearman相关系数大于0.2的关键颗粒质量属性特征被单独处理为独立数据集);(II) 原始的22维数据集;(III) 排除了带状密度特征的数据集。

结果

在所有数据集中,MLP的表现均优于SVR(LibSVM)和RF。在数据集II中,MLP获得了最高的R2值0.983和最低的MAE值0.007,显示出出色的预测能力。MLP还获得了最高的平均R2值0.852和最低的平均MAE值0.067。研究表明,MLP模型是预测天然药物配方干法制粒过程中药物颗粒产量率和脆性的最佳模型。

结论

结合多源材料-工艺数据与优化的机器学习算法(尤其是MLP),可以实现天然药物关键颗粒质量属性的准确预测。与单组分或双组分预测模型相比,该模型在预测成分更复杂的药物时更为准确,并具有更广泛的应用范围。本研究的结果有助于更好地理解天然药物的干法制粒过程。

总结

本研究通过构建一个包含92种材料和18个属性的数据库,并应用三种机器学习算法(支持向量回归(SVR LibSVM)、随机森林(RF)和多层感知器(MLP)以及在13个工艺参数下的模型,解决了天然药物关键颗粒质量属性(CGQAs)的预测问题。MLP模型在数据集II(预测产量率,R2 = 0.959)和数据集III(预测脆性,R2 = 0.959)中均取得了最佳性能。在三个数据集中,数据集II在所有模型中的拟合度最高,预测准确性和稳定性也优于其他数据集。该方法支持天然药物颗粒关键质量属性的预测和智能控制。

图形摘要

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号