
-
生物通官微
陪你抓住生命科技
跳动的脉搏
预测模型的基准测试:实证方法与机器学习在评估橄榄衍生酚类化合物在超临界介质中溶解性方面的应用
《Food Analytical Methods》:Benchmarking Predictive Models: Empirical vs. ML for Solubility of Olive-Derived Phenolic Compounds in Supercritical Media
【字体: 大 中 小 】 时间:2026年02月12日 来源:Food Analytical Methods 3.0
编辑推荐:
橄榄油酚类化合物在超临界CO2中的溶解度预测研究综合评估了三种半经验模型(Chrastil、Bartle、Kumar–Johnston)与机器学习算法(随机森林、XGBoost)的性能,发现机器学习模型(R2>0.999)显著优于传统模型(最佳R2≈0.99),乙醇作为共溶剂可大幅提升目标酚类溶解度,其中羟基酪醇溶解性最佳,芦丁最差。该研究验证了机理模型与数据驱动模型的互补性,为超临界萃取工艺优化提供理论支撑与实践指导。
橄榄树(Olea europaea L.)是富含酚类化合物的植物,这些化合物具有公认的生物活性,在营养保健品、制药和食品工业中有着广泛的应用。要高效利用这些化合物,就需要准确预测它们在超临界二氧化碳(scCO2)体系中的溶解度,无论是纯溶剂还是含有极性共溶剂的情况下。本研究评估了三种半经验关联模型(Chrastil、Bartle和Kumar–Johnston)以及先进的机器学习(ML)算法——随机森林(Random Forest)和XGBoost——在预测关键橄榄衍生酚类化合物(包括橄榄苦苷、羟基酪醇、Verbascoside、芸香苷、槲皮素和油苷)溶解度方面的性能。实验数据涵盖了广泛的温度、压力和溶剂组成范围(纯CO2以及最多含30%的CO2–乙醇混合物)。结果表明,羟基酪醇的溶解度最高,而芸香苷的溶解度最低。乙醇被证明是最有效的共溶剂,显著提高了目标化合物的溶解度。在半经验模型中,Bartle方程的总体准确性最高(R2 ≈ 0.99),而Chrastil模型在单一温度预测和交叉预测方面表现良好。机器学习模型的表现优于经验方法,其中XGBoost和随机森林的R2超过0.999,平均绝对误差(MAE)约为0.02 × 10–4 mg/g,有效捕捉了操作条件与溶解度之间的非线性关系。研究结果表明,机理建模和数据驱动建模具有互补性:经验模型提供了可解释性和物理洞察力,而机器学习算法(包括随机森林和XGBoost)则实现了高预测精度,并揭示了各变量对溶解度的影响。这种集成方法为优化超临界提取过程和推进橄榄衍生酚类化合物的可持续利用提供了一个可靠的框架。
橄榄树(Olea europaea L.)是富含酚类化合物的植物,这些化合物具有公认的生物活性,在营养保健品、制药和食品工业中有着广泛的应用。要高效利用这些化合物,就需要准确预测它们在超临界二氧化碳(scCO2)体系中的溶解度,无论是纯溶剂还是含有极性共溶剂的情况下。本研究评估了三种半经验关联模型(Chrastil、Bartle和Kumar–Johnston)以及先进的机器学习(ML)算法——随机森林(Random Forest)和XGBoost——在预测关键橄榄衍生酚类化合物(包括橄榄苦苷、羟基酪醇、Verbascoside、芸香苷、槲皮素和油苷)溶解度方面的性能。实验数据涵盖了广泛的温度、压力和溶剂组成范围(纯CO2以及最多含30%的CO2–乙醇混合物)。结果表明,羟基酪醇的溶解度最高,而芸香苷的溶解度最低。乙醇被证明是最有效的共溶剂,显著提高了目标化合物的溶解度。在半经验模型中,Bartle方程的总体准确性最高(R2 ≈ 0.99),而Chrastil模型在单一温度预测和交叉预测方面表现良好。机器学习模型的表现优于经验方法,其中XGBoost和随机森林的R2超过0.999,平均绝对误差(MAE)约为0.02 × 10–4 mg/g,有效捕捉了操作条件与溶解度之间的非线性关系。研究结果表明,机理建模和数据驱动建模具有互补性:经验模型提供了可解释性和物理洞察力,而机器学习算法(包括随机森林和XGBoost)则实现了高预测精度,并揭示了各变量对溶解度的影响。这种集成方法为优化超临界提取过程和推进橄榄衍生酚类化合物的可持续利用提供了一个可靠的框架。