
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在基础模型时代,重新审视ADMET预测模型在现实世界挑战下的可靠性
《Journal of Cheminformatics》:Revisiting ADMET prediction reliability under real-world challenges in the foundation model era
【字体: 大 中 小 】 时间:2026年05月20日 来源:Journal of Cheminformatics 5.7
编辑推荐:
摘要随着人工智能驱动的药物发现全面进入基础模型时代,药物可开发性预测正经历从经验驱动向“数据驱动”的深刻转变。尽管已经出现了许多具有多样化表示能力的分子基础模型,但在面对现实世界的药物发现挑战时,关于这些模型的边界和内在局限性的系统实证研究仍然不足。为此,本研究建立了一个测试基准
随着人工智能驱动的药物发现全面进入基础模型时代,药物可开发性预测正经历从经验驱动向“数据驱动”的深刻转变。尽管已经出现了许多具有多样化表示能力的分子基础模型,但在面对现实世界的药物发现挑战时,关于这些模型的边界和内在局限性的系统实证研究仍然不足。为此,本研究建立了一个测试基准,涵盖了四个主要挑战:数据稀缺和分布外(OOD)泛化、类别不平衡、“超越规则5”(bRo5)化学空间泛化以及活性悬崖现象,以便对诸如分子基础模型(KPGT、Uni-Mol)和表格基础模型(TabPFNv2)等前沿架构进行大规模基准测试。我们的分析揭示了分子AI领域的当前边界和局限性:在少样本和OOD场景中,表格基础模型TabPFNv2表现出更强的泛化能力,通常优于所评估的定制分子基础模型;为了解决极端类别不平衡问题,基于欠采样的集成策略提供了一种在召回率和精确度之间具有合理权衡的稳健缓解方法;在复杂的bRo5化学空间中,预训练的图神经网络(GNN)KPGT在提供足够样本的情况下,其在预测环肽渗透性方面的预测准确性高于其他测试架构。然而,所有模型类别在有效识别活性悬崖方面都存在困难,这突显了本研究中评估的人工智能架构在捕捉微小结构变化导致性质剧烈变化现象方面的持续挑战。为应对这些复杂的现实世界挑战,本研究证实了集成不同类型的高性能模型是提高预测稳健性的有效策略。此外,为了促进低成本筛选和构建此类集成所需的高质量基础模型,我们验证了分子性质景观粗糙度指数可以作为一种轻量级的诊断工具。综上所述,这些见解为当代药物可开发性预测模型的评估和选择提供了实用指导。
科学贡献
本研究建立了一个系统的药物可开发性预测基准框架,模拟了四个关键的现实世界药物发现场景——包括在bRo5化学空间中尚未充分探索的泛化挑战——并全面评估了分子基础模型、表格基础模型TabPFNv2、图神经网络(GNNs)、自动化机器学习(AutoML)框架和经典机器学习方法,从而克服了以往基准在任务多样性和模型覆盖范围方面的局限性。通过大规模的训练-评估循环,该研究揭示了不同模型的特定场景优势及其共同的弱点。除了基准测试之外,它还表明集成不同类型的模型可以提高预测性能,并且分子性质景观粗糙度指数作为一种低成本工具,可用于选择高质量模型,提供了比以往比较研究更多的可操作性见解。
随着人工智能驱动的药物发现全面进入基础模型时代,药物可开发性预测正经历从经验驱动向“数据驱动”的深刻转变。尽管已经出现了许多具有多样化表示能力的分子基础模型,但在面对现实世界的药物发现挑战时,关于这些模型的边界和内在局限性的系统实证研究仍然不足。为此,本研究建立了一个测试基准,涵盖了四个主要挑战:数据稀缺和分布外(OOD)泛化、类别不平衡、“超越规则5”(bRo5)化学空间泛化以及活性悬崖现象,以便对诸如分子基础模型(KPGT、Uni-Mol)和表格基础模型(TabPFNv2)等前沿架构进行大规模基准测试。我们的分析揭示了分子AI领域的当前边界和局限性:在少样本和OOD场景中,表格基础模型TabPFNv2表现出更强的泛化能力,通常优于所评估的定制分子基础模型;为了解决极端类别不平衡问题,基于欠采样的集成策略提供了一种在召回率和精确度之间具有合理权衡的稳健缓解方法;在复杂的bRo5化学空间中,预训练的图神经网络(GNN)KPGT在提供足够样本的情况下,其在预测环肽渗透性方面的预测准确性高于其他测试架构。然而,所有模型类别在有效识别活性悬崖方面都存在困难,这突显了本研究中评估的人工智能架构在捕捉微小结构变化导致性质剧烈变化现象方面的持续挑战。为应对这些复杂的现实世界挑战,本研究证实了集成不同类型的高性能模型是提高预测稳健性的有效策略。此外,为了促进低成本筛选和构建此类集成所需的高质量基础模型,我们验证了分子性质景观粗糙度指数可以作为一种轻量级的诊断工具。综上所述,这些见解为当代药物可开发性预测模型的评估和选择提供了实用指导。
科学贡献
本研究建立了一个系统的药物可开发性预测基准框架,模拟了四个关键的现实世界药物发现场景——包括在bRo5化学空间中尚未充分探索的泛化挑战——并全面评估了分子基础模型、表格基础模型TabPFNv2、图神经网络(GNNs)、自动化机器学习(AutoML)框架和经典机器学习方法,从而克服了以往基准在任务多样性和模型覆盖范围方面的局限性。通过大规模的训练-评估循环,该研究揭示了不同模型的特定场景优势及其共同的弱点。除了基准测试之外,它还表明集成不同类型的模型可以提高预测性能,并且分子性质景观粗糙度指数作为一种低成本工具,可用于选择高质量模型,提供了比以往比较研究更多的可操作性见解。