一种新颖的框架,将耦合混合规则与深度学习相结合,用于抗生素混合物的毒性预测和环境风险评估

《Environmental Research》:A novel framework integrating a coupled mixing rule with deep learning for toxicity prediction and environmental risk assessment of antibiotic mixtures

【字体: 时间:2026年02月23日 来源:Environmental Research 7.7

编辑推荐:

  抗生素混合毒性预测模型研究通过耦合混合规则与Transformer-DNN架构,显著提升多毒性终点预测精度至平均R2=0.936,并发现单一抗生素低风险组合中72.2%呈中高风险,为环境风险评估提供新方法。

  
谢水霞|包毅|饶月|吴丹青|余青苗|任宏强|耿金菊
教育部三峡水库区域生态环境重点实验室,重庆大学环境与生态学院,重庆400044,中国

摘要

环境中多种抗生素的共存现象十分普遍,准确预测抗生素混合物的毒性对于生态风险评估至关重要。然而,现有模型往往缺乏对混合规则的自适应选择,无法充分捕捉有关毒性化合物的关键结构信息。本研究开发了一种新的耦合混合规则来优化混合物描述符的构建,并进一步建立了Transformer-深度神经网络(Transformer-DNN)以进行抗生素混合物毒性的多任务预测。结果表明,与传统规则相比,使用耦合混合规则时模型的预测准确性提高了12.8%。Transformer-DNN在同时预测七个毒性指标方面表现出高预测性能(平均R2 = 0.936)。与在整个建模过程中使用统一传统混合规则的经典模型相比,Transformer-DNN的预测准确性提高了26.0%,预测误差降低了53.9%。初步风险评估显示,单独来看无风险的抗生素在混合物中中有72.2%被评估为中等风险,16.7%被评估为高风险。总体而言,本研究通过改进混合规则和模型架构,提升了抗生素混合物毒性的预测能力,强调了将混合物效应纳入未来环境风险评估框架的重要性。

引言

抗生素在人类医疗、兽医和水产养殖中广泛用作治疗剂(Cheng等人,2025年)。由于其生物活性,水生环境中的生物体不可避免地会受到影响。实际上,生物体暴露的不是单一抗生素,而是水环境中多种抗生素的混合物。当生物体暴露于多种抗生素的混合物中时,毒性效应可能会增强(Kolesnikov等人,2025年;Silva等人,2002年;Trinh等人,2022年)。明确混合物的毒性对于抗生素的风险评估和监管至关重要。
越来越多的研究人员倾向于使用计算方法根据现有实验数据来推断和预测混合物的毒性,因为混合物的毒理学评估面临许多挑战,包括复杂的实验设计和高昂的成本(Gustavsson等人,2024年;Jeong等人,2025年;Kim等人,2017年)。定量结构-活性关系建模是一种广泛使用的计算毒理学方法,旨在模拟化学结构的变化如何影响化合物的生物活性或物理化学性质(Cronin等人,2025年)。1981年,K?nemann发表了最早基于QSAR的混合物毒性研究之一,利用辛醇-水分配系数和毒性数据来评估对Poecilia reticulata的影响(K?nemann,1981年);这引发了将分配行为与毒性联系起来的经验性QSAR研究热潮,尤其是在2010年之前(Kim等人,2013年;Lin等人,2005年;Xu和Nirmalakhandan,1998年)。然而,自2011年以来,研究人员将重点转向基于分子描述符和结构信息的非经验性QSAR(Chatterjee等人,2023年;Feng等人,2024年;Kim和Kim,2015年)。其中,化学结构被转化为机器可读的分子描述符,作为分子结构和目标终点之间的桥梁(Feng等人,2024年)。与单个化合物的描述符不同,混合物描述符结合了单一物质描述符的剂量,通常表示为浓度或质量比。混合物描述符是使用文献中的各种混合规则计算得出的(Chatterjee等人,2023年;Qin等人,2018年,2024a年;Zhang等人,2023年),其中最常用的是分子贡献的线性组合,其次是摩尔贡献的平方和摩尔贡献的范数(Chatterjee和Roy,2021年;Huang等人,2025年;Kar等人,2018年;Rahimi-Soujeh等人,2024年;Zhang等人,2023年)。然而,在实际应用中,一旦选择了特定的混合规则,通常会统一应用于所有描述符的计算中,而不考虑特征分布、信息内容和各个描述符的毒性相关性之间的差异。这种“一刀切”的策略必然会损害模型的整体性能。预计通过为每种描述符类型自适应选择最佳混合策略,以更好地利用它们的各自优势,可以提高模型的预测能力。迄今为止,尚未构建出自适应混合规则。
传统的混合物毒性预测模型通常根据物质类型、毒性指标或其他相关标准对数据集进行分类,并为每个子组开发独立的模型(Li等人,2023年;Wang等人,2018年)。尽管这种分层建模方法可以提高每个子集内的预测准确性,但它劳动强度大,且生成的模型适用性和泛化能力有限。近年来,深度神经网络(DNN)能够将大规模、异构的数据集整合到一个统一且可泛化的预测框架中,并已在各个领域得到广泛应用。例如,已经开发了使用分子图作为输入的DNN模型用于危险物质筛查(Fan等人,2023年),并且提出了FT-GNN框架将高分辨率质谱特征与生物活性联系起来(Fan等人,2025年)。此外,DNN在模拟化学结构与生物活性之间的复杂关系方面取得了显著进展(Jeong和Choi,2022年),包括应用于雄激素受体活性(Idakwo等人,2019年)、肝毒性(Wang等人,2019年)和水生毒性(Zhang等人,2025年)。然而,目前许多使用DNN开发预测模型的应用未能充分强调关键化学亚结构对毒性的贡献,描述符的重要性通常通过事后分析来评估(Sinsulpsiri等人,2025年;Zubrod等人,2024年),这种做法忽略了关键毒性结构在建模过程中的作用。Transformer最初是为自然语言处理开发的神经网络架构,完全依赖于注意力机制,不使用循环或卷积操作(Vaswani等人,2017年)。它可以通过为与毒性预测相关的分子描述符分配更高的自注意力权重,将输入数据编码成信息丰富的特征表示(Han等人,2021年)。最近的研究进一步表明,Transformer能够高效捕获生物和化学结构信息(Gustavsson等人,2024年)。将Transformer整合到DNN架构中,并对关键毒基因组特征进行预先加权作为输入,有望提高模型对混合毒性的预测准确性。然而,尚未开发出能够准确预测抗生素混合物毒性的Transformer-DNN模型。
本研究结合了最小冗余最大相关性(mRMR)标准和遗传算法(GA)来构建用于优化模型输入的耦合描述符。引入了Transformer来构建Transformer-DNN模型,以提高抗生素混合物毒性的预测准确性。使用Shapley Additive exPlanations(SHAP)和Accumulated Local Effects(ALE)来分析这些重要描述符的可解释性。使用欧几里得距离和残差定义了模型的适用领域(AD),以评估外部数据的适用性。最后,根据预测的混合物毒性评估了与抗生素混合物相关的风险。据我们所知,这是首次将耦合混合规则和Transformer-DNN框架纳入混合物毒性预测模型的构建中,为优化混合物毒性建模提供了新的视角,并为混合物的风险评估提供了重要的方法学支持。

数据收集和预处理

本研究的工作流程如图1所示。为了全面覆盖抗生素混合物毒性的实验数据,系统地从ACS、ScienceDirect和Web of Science数据库中检索了2000年至2025年间发表的报告,搜索关键词为“mixture toxicity”,同时至少包含“antibiotics”、“sulfonamides”或“antibacterial”中的一个。数据收集过程中没有对测试物种或混合物类型施加任何特定限制。

耦合混合规则的开发

自适应耦合描述符构建的工作流程如图2a所示。最初,使用mRMR算法从三种传统混合规则下的分子描述符中选择特征,得到了排名前20的描述符。其中,有15个描述符在各种混合规则中都得到应用(表S2),表明这些描述符对混合物毒性预测有显著且一致的贡献。

结论

本研究提出了一种基于耦合混合规则的创新Transformer-DNN模型用于混合物毒性预测,并研究了抗生素混合物所带来的风险。这一新框架通过利用扩展的1,002个样本数据集,实现了高准确性的多任务抗生素混合物毒性预测。结果表明,与传统混合策略相比,耦合混合规则使预测准确性提高了12.8%。在此基础上,构建了Transformer-DNN。

CRediT作者贡献声明

饶月:可视化、概念化。包毅:方法论、数据管理。谢水霞:写作——审稿与编辑、初稿撰写、软件、方法论、数据管理、概念化。耿金菊:写作——审稿与编辑、监督、资源获取、项目管理、方法论。任宏强:资源获取。余青苗:写作——审稿与编辑、初稿撰写、资源获取、项目管理、方法论、资金获取。吴丹青:

未引用参考文献

Cheng等人,2025年;Nys等人,2017年;Zhou等人,2024年。

利益冲突声明

?作者声明他们没有已知的可能影响本文工作的竞争性财务利益或个人关系。

致谢

本工作得到了中国自然科学基金(编号52370200、52300149)、江苏省自然科学基金(编号BK20220785)和中国博士后科学基金(编号2023M730400)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号