《Journal of Hazardous Materials》:Predictive q-RASAR modeling of intrinsic toxicity of pharmaceuticals and bioactive compounds in cats
舒芭·达斯(Shubha Das)| 普罗比尔·库马尔·奥贾(Probir Kumar Ojha)
药物发现与开发实验室(DDD Lab),贾达普尔大学(Jadavpur University)制药技术系,印度加尔各答700032
摘要
当药物和生物活性化合物的暴露量超过安全阈值时,它们可能会产生毒性。家猫(Felis catus)与人类共享食物、水源和室内环境,并具有独特的代谢敏感性,这使它们成为识别人类-动物共同微环境中有害化学结构的重要监测物种。尽管如此,用于预测猫类毒性的系统计算框架仍然有限。在这项研究中,开发了新的定量结构-活性关系(QSAR)和定量跨结构-活性关系(q-RASAR)模型,利用精心整理的猫类数据集来预测多种生物活性化合物的最低致死剂量(LDLo)。这些模型识别出影响化学毒性的关键分子片段(毒性因子和非毒性因子),为更安全的药物设计和环境风险评估提供了有意义的见解。为了探索非线性的结构-毒性关系,应用了多种建模方法,包括随机森林(RF)、支持向量机(SVM)、神经网络(NN)、梯度提升(GB)和随机梯度下降(SGD)。比较结果显示,基于PLS的q-RASAR模型具有最佳的预测性能(R2 = 0.764, Q2 = 0.727, Q2F1 = 0.760, Q2F2 = 0.760),并且预测误差最低,证实了其稳健性和准确性。进一步筛选农药属性数据库(PPDB)和DrugBank数据库有效区分了高毒性和低毒性化合物。这一综合框架能够在代谢敏感的监测物种中早期指示有害化学结构,为更广泛的化学安全评估提供有用的背景信息。
引言
猫(Felis catus)在毒理学中占据着独特的地位。尽管猫经常与人类生活在相同的家庭环境中,并且由于它们的葡萄糖醛酸化能力较弱,对许多药物和生物活性化合物表现出异常敏感性([1]; Beusekom等人,2014; [2], [3]),但我们对猫体内化学物质的内在系统毒性仍知之甚少。药物和其他生物活性化学物质虽然是为治疗或工业目的而开发的,但在暴露量超过安全限度时也可能产生显著的毒性作用。这些化合物可能通过故意给药、意外摄入、职业暴露或环境污染进入生物系统[4], [5]。长期或高剂量暴露可能对人类和其他生物的生长发育、新陈代谢和器官功能产生不利影响。最近的研究使用伴侣动物作为监测物种来检测家庭和环境污染物,包括多种化学物质和持久性有机污染物[5]。鉴于此,开发针对猫的特异性毒性预测模型对于早期识别危害至关重要。在毒理学和风险评估中,采用各种毒性终点来估计化学物质对生物系统的有害影响,例如LD50(50%测试群体的致死剂量)、LC50(50%的致死浓度)、LOEL(最低观察效应水平)、NOEL(无观察效应水平)等。最低致死剂量(LDLo)终点提供了关于某种化学物质在给定生物体内引起致死效应的最小量的关键信息[6]。与LD50不同,LDLo能够捕捉到导致给定物种死亡的最小记录剂量,使其成为识别危害的敏感指标。虽然环境暴露通常通过口服或皮肤途径发生,但内在毒性代表了化学物质的基本危害,与暴露途径无关。因此,了解这种监测物种的内在毒性模式可以早期指示有害化学结构。静脉注射LDLo值尤其具有参考价值,因为它们绕过了吸收和代谢的变异性,提供了更直接的内在系统毒性测量。基于LDLo的预测模型可以支持快速的危害评估,指导监管决策,并增强化学安全管理的风险评估策略。
然而,传统的体外/体内毒性评估方法耗时、伦理上具有挑战性且资源密集[7]。随着对快速有效填补数据缺口的需求增加,遵循新方法学(NAMs)在监管风险评估中变得越来越重要。计算毒理学正得到全球监管机构的认可。基于QSAR、跨结构(RA)和q-RASAR的方法符合监管指南,提供了比传统毒性测试方法更快、更具成本效益和伦理可行性的替代方案[8]。QSAR方法建立了分子性质与毒理学终点之间的数学关系,提供了比实验测试更快、更具成本效益和伦理可行的替代方案。RA是一种基于相似性的方法,通过实验表征的结构类似物推断未测试化合物的毒性或生物活性。RA不依赖于数学建模,而是从结构相似的化学物质中转移信息,假设结构相似的分子表现出相似的生物效应。虽然QSAR模型提供了预测性见解,但它们的准确性可能对于多样化的化学数据集有限。因此,q-RASAR这种先进的跨结构建模方法通过结合机制解释来提高预测可靠性[9], [10]。机器学习(ML)是一种不断发展的计算方法,利用数据驱动的算法构建预测模型并揭示数据集中的复杂模式[11]。它在包括计算毒理学在内的多个科学领域发挥着重要作用,通过提高毒性预测的准确性和可靠性[12], [13]。尽管计算毒理学取得了进展,但对于某些具有独特代谢限制的小型食肉动物来说,物种特异性毒性预测仍存在关键差距。与现有的针对一般哺乳动物毒性的QSAR模型或专注于大鼠和鱼类等物种的模型[14], [15], [16]不同,本研究提供了针对猫的特异性毒性预测,从而提高了它们在毒理学和风险评估中的相关性和适用性。猫的生理和行为特征不仅突显了开发猫特异性毒性模型的必要性,还将猫定位为潜在的监测物种,它们对有毒物质的高度敏感性可以作为对其他哺乳动物风险的早期预警。
本研究首次提出了专门设计用于估计猫体内多种生物活性化合物危害性的QSAR和q-RASAR模型,采用pLDLo作为毒性终点。此外,还应用了SVM、RF、NN、GB和SGD等机器学习方法来检验模型的性能。本研究的关键创新在于识别出导致毒性的特定分子亚结构,为设计更安全、危害较小的化学物质提供了关键见解。这些模型遵循OECD原则进行了严格验证,确保了它们的稳健性、可靠性和适用于实际毒性评估。值得注意的是,对PPDB和DrugBank数据库中的药物进行了筛选,以优先考虑高毒性和低毒性化合物,从而深入评估了模型的准确性。分析显示,模型的预测与实验观察到的毒性之间存在强相关性,进一步证明了其作为强大计算工具的可信度。通过预测导致猫体内化学毒性的生物标志物,这些模型改进了危害识别,并有助于更广泛的化学安全管理。这项工作的意义不仅限于猫毒理学领域。猫对某些有毒物质的高度敏感性使它们成为环境危害的宝贵早期预警指标,这些危害也可能影响人类健康。在这种背景下,所开发的框架提供了一种成本效益高、符合伦理且计算效率高的方法,用于估计人类-动物-环境综合风险评估。这项研究的新颖之处在于开发了首个针对猫的物种特异性计算毒性模型,整合了结构描述符和基于机制相似性的见解,以评估药物和生物活性化合物。这为更安全的生物活性化合物设计和基于证据的监管决策奠定了坚实的基础。
数据获取和处理
本研究的数据集来自TOXRIC数据库(
https://toxric.bioinforai.tech/)。TOXRIC数据库[17]包含了多种物种、终点和暴露途径的毒性信息。根据OECD原则1(QSAR模型开发需要明确定义且无歧义的终点),本研究仅关注猫的IV LDLo数据,以确保终点的一致性、可靠性和监管相关性[18]。然而,数据集包含145条记录...
结果与讨论
在本研究中,使用PLS回归技术开发了针对pLDLo终点的QSAR和q-RASAR模型,严格遵循OECD原则。这些模型旨在推进与公共卫生相关的风险评估策略,以及化学品在哺乳动物系统中的安全使用。为了进一步评估模型性能,还采用了两种机器学习算法RF和SVM。
研究的创新性和意义
结合使用猫特异性数据、作为罕见终点的pLDLo以及静脉注射方式,构成了一个科学上新颖且有意义的毒理学框架。在猫身上的实验毒理学研究受到伦理限制,可用数据有限且分散,很少通过计算方法进行分析。在这种情况下,选择LDLo作为模型开发终点,因为它反映了报告的最低致死剂量,并提供了更保守的内在毒性测量...
局限性与未来展望
尽管当前模型使用了最完整的猫类实验报告的IV LDLo数据集,但数据集仍然受到物种特异性毒性研究有限性的影响。该化学领域主要涵盖了药物和生物活性有机化合物,因此对结构上差异较大的化学物质的预测应在定义的适用范围内进行解释。特定途径和物种依赖性的差异可能会...
结论
在本研究中,开发了基于PLS的QSAR和q-RASAR模型,用于预测各种药物和其他生物活性化合物对猫的毒性,重点识别导致毒性的结构特征。这些模型使用了多样化的数据集和2D分子描述符构建,并遵循OECD指南以确保可靠性。此外,还探索了SVM、RF、NN、GB和SGD等机器学习方法来补充传统建模...
环境影响
药物和生物活性化学物质日益污染自然环境,它们的持久性和生物效力引发了新的生态和人类健康问题。家猫由于解毒能力有限且与人类环境密切互动,成为此类暴露的敏感监测物种。开发的QSAR和q-RASAR模型提供了首个用于预测猫特异性化学致死性的计算框架,实现了快速且符合伦理的...
未引用的参考文献
[41], [42], [43], [44]
CRediT作者贡献声明
普罗比尔·库马尔·奥贾(Probir Kumar Ojha):撰写——审稿与编辑、可视化、监督、方法论、调查、概念化。舒芭·达斯(Shubha Das):撰写——原始草稿、可视化、验证、方法论、正式分析、数据整理、概念化。
利益冲突声明
作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
致谢
SD和PKO感谢DTC实验室和Kunal Roy教授提供的技术支持和指导。
支持信息
支持信息1
(SI-1)
数据集中每种化合物的SMILES及其对猫的毒性值;基于PLS的QSAR和q-RASAR模型的训练集和测试集;从PRI工具获得的PPDB筛选输出文件(针对pLDLo两个终点)。
支持信息2
(SI-2)
不同PLS图;针对pLDLo终点的开发的基于PLS的q-RASAR模型。
利益冲突声明
作者