开发一种多任务定量结构-活性关系(QSAR)模型,用于预测电子烟产品中所使用化学物质的毒性潜力

《Journal of Hazardous Materials》:Developing a multi-task quantitative structure-activity relationship (QSAR) model for predicting the toxicity potential of chemicals used in e-cigarette products

【字体: 时间:2026年01月17日 来源:Journal of Hazardous Materials 11.3

编辑推荐:

  电子烟排放物含有复杂混合物,现有毒性数据不足,本研究开发多任务AI-QSAR模型预测眼/皮肤刺激、致癌和基因毒性,单任务模型为基准,多任务模型在眼刺激预测上AUC提升13%,但致癌性AUC下降13%,揭示了氮杂环对眼/皮肤毒性影响显著,而电化学性质主导致癌性,为化学危害评估提供新工具。

  
Alexa Canchola|Kunpeng Chen|Md Ziaur Rahman|Lillian Tran|Wonsik Woo|Linhui Tian|Ying-Hsuan Lin|Wei-Chun Chou
加利福尼亚大学河滨分校环境科学系,美国加利福尼亚州92521

摘要

电子香烟的排放物包含多种活性成分、溶剂、香料、热降解产物和污染物。尽管近期有所研究,但大多数这些化合物的全面毒性数据仍然缺乏,这给危害识别和化学物质优先级排序带来了重大挑战。为了解决这一难题,我们开发了基于可解释机器学习(ML)的定量结构-活性关系(QSAR)模型,以预测电子香烟的五种毒性终点:眼睛刺激、皮肤刺激、皮肤致敏、致癌性和遗传毒性。我们采用了单任务和多任务学习策略,并以单任务QSAR模型作为基准,系统地评估了多任务架构在联合预测相关毒性终点方面的附加价值。所开发的多任务QSAR模型在眼睛和皮肤毒性(AUC ≥ 0.69,准确率 ≥ 61%)以及致癌性和遗传毒性(AUC ≥ 0.66,准确率 ≥ 61%)方面表现中等至优秀。某些终点(如眼睛刺激)的性能相比最佳单任务模型有显著提升(AUC +13%,准确率 +20%),而其他终点(如致癌性)的性能则有所下降(AUC -13%,准确率 -5%)。特征重要性分析表明,含氮基团(如胺类和酰胺类)是眼睛和皮肤毒性的重要预测因子,而与癌症相关的终点则高度依赖于化合物的静电和电负性特性。总体而言,本研究展示了如何利用多任务QSAR建模不仅能够预测研究不足的电子香烟成分的毒性,还能阐明毒性终点之间的关系,从而支持基于模型的电子香烟产品化学危害评估。

引言

电子香烟产品被广泛宣传为比传统香烟更安全的替代品;然而,越来越多的实验和流行病学证据表明,接触电子香烟排放物与一系列不良生物效应有关。研究报道了肺细胞死亡[1]、[2]、[3]、气道炎症[4]以及暴露后上皮组织损伤[5]、[6],同时暴露人群和动物模型的口腔和肺组织中DNA加合物水平升高,包括潜在的遗传毒性[7]、[8]。除了呼吸系统外,主动或被动接触电子香烟气溶胶还与眼睛刺激和视觉相关效应以及皮肤刺激和致敏有关,尤其是在使用或处理过程中经常接触的区域,如手、脸和颈部[9]、[10]、[11]、[12]。尽管对这些危害的认识日益增加,但大多数与电子香烟相关的化学物质的毒理学特性仍然知之甚少,特别是对眼睛和皮肤等非靶标系统而言。这一差距部分是由于电子香烟产品的化学复杂性极高且不断变化所致,这些产品包含溶剂、保湿剂、调味剂、活性成分、防腐剂以及热蒸发过程中形成的降解产物[13]、[14]、[15]、[16]、[17]、[18]、[19]、[20]、[21]、[22]、[23]、[24]、[25]。其中许多转化产物的内在毒性尚未得到充分研究,导致从危害识别的角度来看,电子香烟化学成分的大部分仍未能得到充分评估[1]、[20]、[25]、[26]、[27]。
最近的研究尝试利用定量结构-活性关系(QSAR)模型来预测电子香烟化学物质的毒性终点,如细胞毒性、致突变性和致癌性,即使没有现有的毒性数据[28]、[29]、[30]、[31]。这些研究提供了重要的概念验证,但主要依赖于单终点建模策略、相对较小或定义狭窄的化学数据集,并且主要关注母液调味化合物。此外,对于用户和旁观者暴露都相关的非癌症终点(如眼睛和皮肤毒性)的关注相对有限。虽然现有的QSAR建模研究为电子香烟毒性提供了有价值的见解,但大多数研究仅关注单个终点,并未探讨共同的分子特征是否会导致多种毒性结果。机器学习(ML)和人工智能(AI)的进步,特别是深度神经网络(DNN),为克服这些限制提供了机会,使QSAR框架更加灵活,能够捕捉化学复杂性并提高预测性能。特别是多任务学习允许模型同时针对多个相关的毒性终点进行训练,利用共享的分子表示来增强泛化能力和鲁棒性,尤其是在数据有限或不平衡的终点情况下[32]、[33]、[34]。尽管多任务QSAR已在各种化学物质上成功应用,但其系统应用于电子香烟相关毒性终点的情况仍然有限。
为了解决这些不足,本研究使用单任务和多任务学习开发了二元分类AI-QSAR模型,以预测电子香烟产品中使用的化学物质的五种毒性潜力:眼睛刺激、皮肤刺激、皮肤致敏、致癌性和遗传毒性。虽然吸入相关的呼吸系统毒性是直接使用电子香烟的主要关注点,但对于快速发展的电子香烟化学领域来说,全面的、统一的呼吸系统终点数据集仍然有限。因此,我们纳入了眼睛和皮肤终点作为与被动暴露(例如,吸入气溶胶或沉积残留物的二手和三手暴露)以及直接接触电子液体和设备相关的代表性非靶标/接触毒性指标,同时将致癌性和遗传毒性作为广泛研究的、基于机制的终点,以提供评估模型性能和泛化能力的有用基准。我们进一步假设多任务学习将提高预测准确性和鲁棒性,特别是对于研究不足的化学物质和终点。为了支持模型的负责任应用,我们还进行了适用性领域(AD)分析,以确定预测最可靠的化学空间区域。最后,进行了特征重要性分析,以识别与每个毒性终点相关的结构驱动因素,提供有助于危害评估的机制见解,并指导未来的实验验证。总体而言,本研究建立了一个可访问的AI-QSAR框架,利用多任务学习联合建模多个毒性终点,包括眼睛刺激、皮肤刺激、皮肤致敏、致癌性和遗传毒性,涵盖了大量化学多样化的电子香烟相关化合物。所得预测旨在反映内在的、由结构驱动的危害潜力,并作为筛查工具,用于解决电子香烟化学危害识别和优先级排序中的关键数据缺口。

部分摘录

电子香烟相关化学物质和毒理学数据的整理

为了构建模型,我们手动进行了文献搜索,以识别之前通过同行评审期刊文章确定的存在于含尼古丁、THC和/或CBD的电子液体和电子香烟排放物中的有机电子香烟化学物质。该搜索包括溶剂、保湿剂、调味剂、活性成分、防腐剂和污染物(包括制造副产品、环境污染物和设备渗出物)等可检测到的物质

数据集概述

在筛选出相关的电子香烟化合物、提取毒性数据并生成SMILES字符串后,最终数据集共包含966种化学物质。该数据集涵盖了多样化的化学空间,识别出了70种独特的化学类别。这些化合物主要是脂质和类脂质分子(例如,戊二醇脂质、脂肪酸)、苯类(例如,苯及其衍生物、酚类)、有机氧化合物、有机杂环化合物等

讨论

电子香烟气溶胶由多种活性成分、溶剂、调味剂、热降解产物和污染物组成,这些成分的毒理学数据仍然有限。这种数据不足给及时和系统的危害识别带来了重大挑战,尤其是在新配方和添加剂进入市场的速度超过传统毒理学测试适应速度的情况下。在这项研究中,我们解决了这一问题

结论

本研究提供了基于AI的QSAR框架,用于同时预测电子香烟化学物质的五种毒性终点:眼睛刺激、皮肤刺激、皮肤致敏、致癌性和遗传毒性。表现最佳的多任务模型显示出中等至高的预测准确性(所有AUC ≥ 0.63;所有准确率 ≥ 61%),并且错误分类率普遍较低,展示了将多任务架构纳入QSAR如何提高模型性能

环境影响

本研究提出了一个可解释的AI-QSAR框架,旨在支持电子香烟相关化合物的筛查级化学危害识别,其中许多化合物的毒理学特性仍然知之甚少。通过在相关毒性终点之间应用多任务学习,模型利用共享的结构信息提高了选定终点的预测鲁棒性,同时也指出了任务兼容性和数据限制对性能的限制

作者贡献声明

Kunpeng Chen:撰写——审阅与编辑、初稿撰写、方法论。Alexa Canchola:撰写——初稿撰写、软件开发、方法论、调查、数据整理、概念化。Linhui Tian:撰写——审阅与编辑、数据整理。Wonsik Woo:撰写——审阅与编辑、数据整理。Lillian Tran:撰写——审阅与编辑、数据整理。Md Ziaur Rahman:撰写——审阅与编辑、数据整理。Wei-Chun Chou:撰写——审阅与编辑、初稿撰写

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作

致谢

作者衷心感谢UCR新教师启动基金和UCOP烟草相关疾病研究计划(T32IP5141)对这项研究的支持。计算工作使用了UCR高性能计算中心(HPCC)的计算机集群和数据存储资源,这些资源由NSF(MRI-2215705, MRI-1429826)和NIH(1S10OD016290-01A1)的资助提供。Alexa Canchola和Wonsik Woo部分得到了NRSA T32培训基金(T32ES018827)的支持。

利益冲突声明

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号