《Computational Biology and Chemistry》:Predicting Curcumin Release Kinetics from Nanocarriers Using a Physics-Informed Machine Learning Framework
编辑推荐:
姜黄素纳米载体释放动力学预测模型研究:建立物理信息神经网络框架,整合13项物化参数,准确预测不同纳米载体的姜黄素释放动力学,解决传统模型无法普适多材料类的问题,外部验证R2达0.885,揭示多速释放设计规律。
Sonia Fathi-Karkan | Abbas Rahdar
天然产物与药用植物研究中心,北霍拉桑医科大学,伊朗博杰努尔德
摘要
背景
姜黄素纳米制剂表现出高度异质的释放行为,但目前该领域缺乏一个能够预测不同材料类别释放动力学的综合框架。然而,由于实验条件不一致和数据集有限,这些系统的扩散参数尚未得到解决。
目标
本文建立了一个基于物理知识的机器学习框架,能够以前所未有的物理一致性预测不同纳米载体中的姜黄素释放动力学。
方法
我们使用13个物理化学描述符对75种制剂的数据集进行了编码,并采用双组分扩散模型对释放动力学进行了参数化。训练了一个包含显式单调性和非负性约束的物理信息神经网络(PINN),并将其与随机森林(Random Forest)、XGBoost和多层神经网络进行了性能对比。外部验证使用了31种独立的制剂。
结果
该模型的R2值为0.92,均方误差(MSE)为2.15,物理一致性达到98%,比基线方法高出1.6倍以上。外部验证的R2值为0.885,释放时间分布的平均绝对误差小于0.08。设计空间映射揭示了与快速、平衡和持续释放特性相关的先前无法访问的参数区域。针对特定应用的性能分析显示,R2值为0.87–0.91,平均绝对误差为2.10–4.30 h,物理一致性为94–98%。
结论
该框架能够高精度地确定不同纳米载体中的关键动力学参数,为数据驱动的制剂工程提供了新的基础。该方法实现了姜黄素递送系统的预测优化,并为控释纳米药物的自动化设计打开了大门。
引言
姜黄素是一种从姜黄(Curcuma longa)中提取的疏水性多酚(Sla?ek等人,2023年)。它因其抗癌、抗炎、抗氧化和抗菌活性而被广泛研究(Kaur等人,2024年)。尽管具有这些有前景的生物活性,但其临床应用仍然受到限制。主要限制包括极低的水溶性、快速代谢降解和极低的系统生物利用度(El-Saadony等人,2025年)。这些挑战促使人们开发了先进的递送载体,以提高姜黄素的稳定性、血液循环时间和治疗效果。
基于纳米载体的递送系统设计是一种有前景的策略,可以克服姜黄素的药代动力学限制。迄今为止,文献中报道了多种纳米载体,包括聚合物纳米颗粒、脂质基载体、水凝胶、金属氧化物、碳纳米结构和金属有机框架(Sahu等人,2025年;Antonelli和Palma,2025年;Pourmadadi等人,2025年;Nikooharf等人,2020年)。本研究中汇编的数据集包含75种载有姜黄素的纳米制剂,这些制剂在粒径、表面电荷、包封效率和材料组成方面存在很大差异(表S1)。例如,粒径范围从小于10纳米到超过500纳米,而ζ电位在-66.8 mV到+65 mV之间变化。这些物理化学性质显著影响药物的装载、稳定性、细胞亲和性以及姜黄素从纳米载体基质中的释放模式。
尽管实验研究进展迅速,但准确预测纳米载体的药物释放动力学仍然是最重要的科学挑战之一。经典的机制模型(如Fickian扩散模型、Higuchi模型和Korsmeyer–Peppas模型)通常基于过于简化的假设,无法捕捉到异质纳米结构的复杂性(Khalbas等人,2024年;Zeng等人,2022年;Pourmadabi等人,2025年)。经典机器学习算法可以通过识别数据中的非线性模式来克服某些限制(Hoseini等人,2025年;Mahdi等人,2025年)。然而,这些模型往往产生物理上不一致的结果,包括负的释放值或非单调的释放曲线(Pei和Qiu,2024年;Mohsin等人,2025年;Rahdar等人,2025a;Fathi-Karkan等人,2025年)。这一挑战至关重要,因为物理上不可能的预测会损害可靠的制剂设计,并可能误导后续的实验研究。
物理信息神经网络(PINN)是一种有趣的混合方法。它们结合了基于力学的方法和深度学习的灵活性,通过直接在神经网络训练过程中纳入物理约束来发挥作用(Khalid等人,2024年;Fathi-Karkan和Rahdar,2025年)。这些约束将模型行为限制在符合公认物理定律的范围内(Zhu等人,2023年)。PINN特别适合模拟药物释放动力学,因为这种动力学虽然受质量传递和扩散原理的支配,但也依赖于研究间差异较大的制剂特定变量(Chen等人,2022年;Ngo和Lim,2021年;Rahdar等人,2025b)。
本研究提出了一个基于物理信息神经网络的框架,用于预测不同纳米载体中的姜黄素释放动力学。该模型使用了13个必要的物理化学描述符,包括粒径、ζ电位、包封效率和材料类型及表面修饰。虽然75种制剂的数据集经过精心挑选以代表关键的纳米载体类别,但我们认识到纳米技术研究中数据稀疏性的挑战。为了解决这个问题,我们采用了一种基于物理信息的方法,整合了领域知识以减少过拟合并提高泛化能力,尽管样本量有限。这些描述符为基于扩散的释放模型提供了信息,而PINN架构通过惩罚项确保了物理上的合理性,从而阻止了负的释放值和非单调的释放趋势。这些考虑使得模型能够在数据有限的情况下做出生物学上相关的预测。
本研究的目标是:开发一个全面的物理信息神经网络,用于预测不同纳米制剂中的姜黄素释放动力学;利用相关性和特征重要性方法研究物理化学性质对释放行为的影响;比较PINN与传统机器学习模型(如随机森林、XGBoost和标准人工神经网络)的性能;并建立制剂设计原则,以促进快速和持续释放特性的优化。本文是首批完全基于物理和数据驱动的姜黄素药物释放预测框架之一,它将扩散的基本物理原理与深度学习相结合。该方法将大大减少实验工作量,加速纳米载体的开发,并提供明确的设计指南,以提高姜黄素纳米制剂的治疗效果。
数据集编制和文献整理
通过系统搜索同行评审的文献,收集了75种载有姜黄素的纳米载体数据集。搜索在PubMed、Scopus和Web of Science数据库中进行,使用了以下关键词:("curcumin" OR "Curcuma longa") AND ("nanocarrier" OR "nanoparticle" OR "nanocomposite" OR "nanoformulation") AND ("drug release" OR "release kinetics" OR "controlled release")。纳入标准包括2025年1月至2026年10月期间发表的研究,以确保数据的时效性。
数据集特征和特征分析
数据集包含了75种来自同行评审出版物的载有姜黄素的纳米制剂。其中,聚合物纳米颗粒占24种(32%),脂质系统占21种(28%),金属氧化物占14种(18%),碳基纳米材料占9种(12%),水凝胶占7种(10%)。粒径范围从小于10纳米到超过500纳米,平均值为48.3 ± 112.5纳米。ζ电位范围从-66.8 mV到+65 mV。
结论、局限性和未来展望
本研究建立的物理信息神经网络能够准确预测不同纳米载体系统中的姜黄素释放动力学,并一致生成物理上连贯、单调的释放曲线,同时在预测准确性和物理一致性方面优于所有比较的机器学习模型。这填补了之前在实现一个能够跨不同材料类别进行泛化的、基于物理的统一框架方面的空白。
伦理批准
不适用。本研究基于对科学文献中现有公共数据的计算建模和分析。
利益冲突
作者声明没有财务或个人利益冲突。
出版同意
所有作者均同意文章内容,并同意提交手稿。
声明
在准备本工作时,作者使用了AI工具(ChatGPT OpenAI 5.1)进行语法改进、文本润色和图形摘要设计。作者根据需要审查和编辑了所有内容,并对发表文章的科学完整性、解释和结论负全责。
资助
无。
CRediT作者贡献声明
Abbas Rahdar:验证、监督、软件、方法论、正式分析、数据整理。
Sonia Fathi-Karkan:撰写 – 审稿与编辑、撰写 – 原始草稿、监督、研究、概念化。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。