针对选定的A系列(诺维乔克)神经毒剂的跨平台计算机模拟评估:物理化学特性、毒理学效应及作用机理研究
《Toxicology Letters》:Multi-Platform In Silico Assessment of Selected A-Series (Novichok) Nerve Agents: Physicochemical, Toxicological, and Mechanistic Insights
【字体:
大
中
小
】
时间:2026年05月11日
来源:Toxicology Letters 2.9
编辑推荐:
伊奥安娜·卡纳武(Ioanna Kanavou)|索蒂里亚·阿纳斯塔西奥(Sotiria Anastasiou)|米哈伊尔·查拉里斯(Michail Chalaris)
希腊色雷斯德谟克利特大学(Democritus University of Thrace)科学学院化学系,
伊奥安娜·卡纳武(Ioanna Kanavou)|索蒂里亚·阿纳斯塔西奥(Sotiria Anastasiou)|米哈伊尔·查拉里斯(Michail Chalaris)
希腊色雷斯德谟克利特大学(Democritus University of Thrace)科学学院化学系,阿格·卢卡斯(Ag. Loukas),65404 卡瓦拉(Kavala)
**摘要**
开发了一个多平台计算机模拟框架,用于表征五种选定的A系列(诺维乔克,Novichok)神经毒剂——A-230、A-232和A-234(每种毒剂均使用Ellison型和Mirzayanov型结构表示方法进行了评估)[1,2],以及A-242和A-262——通过综合物理化学、毒理学和生物活性预测。该框架结合了四个互补的计算平台(ACD/Labs Percepta、OECD QSAR Toolbox、EPA T.E.S.T.和PASS Online),在可重复的工作流程中支持对八种模型化合物(n = 8)的结构-性质-毒性关系(SPTR)进行解释。预测的分配行为表明这些毒剂具有中等亲脂性(logP (GALAS) ≈ 0.5–1.7)以及非常低的蒸气压(25°C时为0–0.05 mmHg),这与它们的凝聚相持久性和接触驱动暴露方式一致,而非持续的蒸汽扩散。从QSAR模型得出的LD??值和皮肤渗透系数在不同结构变体之间存在差异,表明预测的急性毒性并非由单一指标决定。PASS Online得出的概率显示神经毒性可能性较高,而胆碱能活性概率与极性相关指标(TPSA)的关联比与亲脂性的关联更强。主成分分析(PC1 ≈ 81%,PC2 ≈ 13%)显示,描述符的变异主要由极性-渗透性平衡驱动,而不仅仅是毒性强度。通过整合逆LD??、渗透性和神经毒性概率的复合危险等级评估,发现具有较高预测渗透性和较高活性概率的结构变体在模型集合中相对更为危险。所有发现仅限于所研究的化合物,代表的是计算预测结果而非实验测量数据,为在《化学武器公约》(Chemical Weapons Convention)约束下进行比较性非实验性危险评估提供了一个透明且符合监管要求的方法框架。
**1. 引言**
化学战剂(CWAs)由于其极强的毒性、快速的生理效应以及在许多情况下长期的环境持久性,对人类健康和环境安全持续构成威胁。这些物质被归类为大规模杀伤性武器(WMDs),可以以气体、液体或气溶胶的形式扩散,即使在微克级别的暴露也会造成大规模伤亡(Fran?a等人,2019年;K?oske和Witkiewicz,2019年;Opravil等人,2023年)。它们通常难以察觉的存在方式及其快速的系统作用突显了进行准确物理化学和毒理学表征的必要性——特别是对于那些根据国际法律禁止直接实验研究的毒剂。在这些限制条件下,计算方法为无需实际操作高毒性物质即可研究其物理化学和毒理学行为提供了实用途径。
在化学战剂中,有机磷神经毒剂(NAs)因作为乙酰胆碱酯酶(AChE)抑制剂的作用机制而特别值得关注。通过抑制AChE,它们会导致乙酰胆碱在突触接头处积累,从而刺激胆碱能通路并最终导致呼吸麻痹(Nepovimova和Ku?a,2018年;Aroniadou-Anderjaska等人,2023年)。除了这一主要机制外,氧化应激、神经炎症和兴奋性毒性等过程也与长期神经损伤有关(Aroniadou-Anderjaska等人,2023年)。这种多因素的毒理动力学行为强调了整合生化、物理化学和计算分析的必要性,尤其是在实验研究受限的情况下。
神经毒剂经历了几代的发展:G系列、V系列,以及最近的A系列(诺维乔克)化合物,常被称为第四代毒剂(Ellison,2007年;Mirzayanov,2008年;Hoenig,2007年;Carlsen,2019年;Bolt,2022年)。早期的G系列毒剂——塔崩(Tabun,GA)、沙林(Sarin,GB)、索曼(Soman,GD)和环沙林(Cyclosarin,GF)——具有相对较高的挥发性且环境持久性较低(Fran?a等人,2019年)。相比之下,V系列毒剂如VX和VE则具有较低的挥发性且环境稳定性较高,因此在释放后能长时间持续存在(K?oske和Witkiewicz,2019年;Otsuka等人,2022年)。
计算研究表明,A系列(诺维乔克)化合物介于这两类毒剂之间,既具有较低的挥发性,又具备支持环境持久性和高效生物吸收的物理化学特性,这主要归因于磷酰胺酸酯或磷酸化肟的结构特征(Ellison,2007年;Hoenig,2007年;Otsuka等人,2022年)。然而,其精确的分子结构仍部分保密,现有信息主要来自理论重建或有限的分析观察,而非全面的实验表征(Mirzayanov,2008年;Opravil等人,2023年;Carlsen,2019年)。尽管G系列和V系列毒剂已有大量的实验数据,但A系列化合物的表征仍然较为不足。关于沸点、蒸气压和水解稳定性的报道值在不同来源之间差异较大(Fran?a等人,2019年;Nepovimova和Ku?a,2018年;Bhakhoa等人,2019年;Otsuka等人,2022年)。尽管在生物样本中检测到了降解产物和生物标志物(Otsuka等人,2022年;Jeong等人,2021年),但直接的物理化学测量数据仍然稀缺。因此,计算机模拟方法已成为研究这些受限化合物的结构、物理化学和毒理学特性的不可或缺工具,允许在没有实验室实验的情况下进行比较分析(Carlsen,2019年;Charejoo等人,2023年;Jia等人,2023年)。以往基于QSAR的研究主要采用纯计算毒理学方法,在《化学武器公约》的约束下评估诺维乔克神经毒剂的生物活性谱、毒性估计和皮肤渗透模型(Roupas等人,2023年)。
在过去十年中,计算毒理学和化学信息学已经发展成为可靠的补充手段,在某些情况下甚至可以替代实验测试。经过验证的算法现在能够预测不同化学类别的分子描述符和生物终点(Melagraki,2022年;Das和Ojha,2025年)。广泛采用的工具包括ACD/Labs Percepta、OECD QSAR Toolbox、EPA毒性估计软件工具(T.E.S.T.)和PASS Online,可以利用基于片段的方法、统计方法和机器学习方法来估计分配系数(logP和logD)、拓扑极性表面积(TPSA)、密度、挥发性指标、皮肤渗透性和急性毒性(LD??)(Harvey等人,2020年;Noga等人,2024年;Bueso-Bordils等人,2024年)。然而,许多先前的研究是独立应用这些预测系统的,这限制了跨平台验证并降低了预测结果的可解释性。缺乏集成的工作流程使得跨模型直接比较变得复杂,尤其是在结构复杂的有机磷化合物(如A系列毒剂)的情况下。最近的发展表明,结合密度泛函理论(DFT)、分子动力学(MD)和定量结构-活性关系(QSAR)方法可以提高对化学稳定性、环境持久性和毒理学行为的预测准确性(Jeong等人,2021年;Noga等人,2024年;Chalaris等人,2025年)。尽管如此,很少有研究系统地将多个预测平台的输出整合到一个统一的计算框架中,以进行物理化学、毒理学和生物活性的跨验证。
为了解决这一空白,本研究建立了一个结合了四个互补平台的计算机模拟框架——ACD/Labs Percepta、OECD QSAR Toolbox、EPA T.E.S.T.和PASS Online。这一多维工作流程将内在分子描述符(如极性、亲脂性和密度)与预测的毒理学、渗透性和生物活性终点联系起来。随后通过多变量统计分析(包括相关性和主成分分析)评估跨平台的一致性,从而在建模背景下解释极性、渗透性和预测毒理学响应之间的关系。通过整合不同算法架构的结果,该框架提高了稳健性、可解释性和可重复性,同时保持了透明性和符合OECD模型验证原则。
本研究有三个具体目标:首先,使用ACD/Labs Percepta在标准化计算条件下预测A-230、A-232、A-234、A-242和A-262的关键描述符及相关物理化学参数。分析了A-230、A-232和A-234的Ellison(2007年)和Mirzayanov(2008年)两种结构变体,以捕捉结构差异(Ellison,2007年;Mirzayanov,2008年)。其次,通过集成OECD QSAR Toolbox和EPA T.E.S.T.工作流程预测急性口服毒性(LD??)和皮肤渗透系数(K?),确保预测结果的适用性和不确定性控制。第三,使用PASS Online进行生物活性分析,评估预测的药理和毒理动力学活性,从而识别不同预测系统之间的一致终点,并验证其与已知的乙酰胆碱酯酶抑制途径的机制一致性。整合的结果在国际监管框架下进行解释,特别是《化学武器公约》(CWC)和禁止化学武器组织(OPCW)的分析验证程序的背景下。总体而言,该框架为非实验性危险评估提供了可重复的、透明且符合监管要求的基础,有助于更深入地理解A系列神经毒剂的机制,并促进未来检测和应对策略的发展。
**2. 材料与方法**
本研究采用完全基于计算(计算机模拟)的方法,使用经过验证且国际认可的工具,在安全和符合伦理的框架内研究这些化合物的分子特性。通过结合基于片段的性质估计、定量结构-活性关系(QSAR/QSPR)和概率性生物活性建模,开发了每种化合物在分子、环境和毒理动力学层面的多维计算表征。这样可以规避直接实验的实际和伦理障碍,同时基于计算预测为理解A系列神经毒剂的潜在危害建立了一个可重复、透明且科学严谨的基础。
**2.1. 研究设计与总体原理**
所提出的框架结合了经过验证的、符合监管要求的计算工具和定量预测建模,以确保在计算机模拟环境中的可重复性、透明性和科学可信度(Carlsen,2019年;Melagraki,2022年;Harvey等人,2020年;Bueso-Bordils等人,2024年;?o?a等人,2025年)。选择四种互补的软件环境,基于它们不同的算法基础:
• ACD/Labs Percepta v2023.1,用于基本物理化学描述符的定量结构-活性关系(QSPR)分析;
• OECD QSAR Toolbox v4.6,用于跨样本建模、机制分析和毒性估计;
• EPA毒性估计软件工具(T.E.S.T.)v5.2.1,用于统计和机器学习驱动的QSAR预测;
• PASS Online(2024版),用于生物和毒理活性谱的概率估计。
每个平台代表一种不同的计算方法——基于片段的估计、跨样本分析、集成回归和概率推断——提供了互补的视角,增强了跨模型的一致性和机制可解释性(Das和Ojha,2025年;Noga等人,2024年)。这些工具共同构成了一个混合预测框架,结合了确定性预测和概率性机制指标,使得对高度受限化合物的表征更加一致(Chandrasekar等人,2025年)。
分析工作流程分为两个层次:
- 第一层:预测内在物理化学描述符;
- 第二层:估计外在毒理学和暴露相关终点。这种双层结构确保了分子级别的物理化学参数和系统级别的毒理动力学行为得到一致表示,为后续的相关性分析和多变量评估奠定了稳健的计算基础。
选择计算平台并非基于易用性,而是基于方法论的互补性和监管相关性。所选工具代表了不同的建模范式(基于片段的、跨样本的、统计/机器学习的和概率方法),从而实现了跨验证并减少了模型特异性偏差。此外,这些工具在监管毒理学领域的广泛应用确保了透明度、可重复性和符合OECD的QSAR模型开发和验证原则。在这种背景下,方法论的透明度和可重复性优先于方法论的新颖性,特别是考虑到所研究化合物的监管限制。
**2.2. 化学结构与来源**
数据集包括五种A系列(诺维乔克)神经毒剂的八种分子表征:A-230、A-232、A-234、A-242和A-262(Ellison,2007年;Mirzayanov,2008年)。对于A-230、A-232和A-234,分别根据Ellison和Mirzayanov的报告模型了不同的结构,以反映分子构型和取代基排列的不确定性(Ellison,2007年;Mirzayanov,2008年)。A-242和A-262仅根据Mirzayanov的描述进行建模,其特征是富含氮原子的结构特征,这些特征与较低的挥发性和较高的稳定性相关(Mirzayanov,2008年;K?oske & Witkiewicz,2019年)。需要明确指出的是,根据当前的开放文献和最近的实验、分析和计算研究,Mirzayanov提出的结构表征在当代科学讨论中最为广泛接受和引用。在本研究中保留了Ellison型结构表示,仅出于完整性及历史一致性考虑,因为直到最近A系列化合物的主导分子结构尚未明确确定。因此,包含这两种表征方式可以系统地评估结构不确定性,而不暗示它们具有相同的现代有效性(Opravil等人,2023年)。
所有化合物在计算上都被视为有机磷磷酰胺氟化物,其特征是一个中心磷原子与含氧、氟和氮的取代基相连,这与已发表的结构描述一致(Ellison,2007年;Mirzayanov,2008年;OPCW,2017年)。图1展示了建模的分子结构及其对应的定性极性映射的分子表面表示。在这些表示中,绿色区域代表预测的亲脂性区域,红色区域表示亲水性区域,黄色-橙色区域表示中等极性,有助于在计算框架内定性地解释结构驱动的分配行为。
**2.3. 分子结构生成与优化**
使用ACD/Labs ChemSketch v2023.1生成了二维分子 diagrams。通过确认原子价态、键序和形式电荷平衡来验证结构的有效性。然后将分子导出为规范的SMILES和MDL molfile格式,以确保在研究中使用的所有计算环境之间能够进行互操作(Fran?a等人,2019年;K?oske和Witkiewicz,2019年;Carlsen,2019年;Harvey等人,2020年)。随后使用MMFF94力场对三维几何结构进行了优化,该方法在有机磷系统的计算研究中被广泛应用。总能量的收敛阈值设为10?? kcal·mol?1,原子位移的收敛阈值设为10?? ?,以获得适合描述符计算的稳定平衡构象。优化后,通过视觉和计算方法检查每个结构的平面性、偶极取向和空间应变,以确认建模框架内的构象稳定性。为了进一步支持理论一致性,将原子电荷分布和扭转剖面与之前发表的类似有机磷试剂的分子动力学和DFT研究结果进行了比较(Jeong等人,2021年;Noga等人,2024年;Chalaris等人,2025年;Jeong等人,2022a)。所有输入文件、能量最小化日志和优化后的几何结构都被归档,以保持后续描述符计算的可追溯性和可重复性。
2.4. 物理化学性质预测(ACD/Percepta)
使用ACD/Labs Percepta PhysChem Suite(v2023.1)分析了优化后的三维结构,该软件结合了基于片段的估计、原子类型参数化和全局可调局部自适应统计(GALAS)建模。除非另有说明,否则计算在标准热力学条件(25°C,1 atm)下进行。
对于每种化合物,生成了一个数据集,包括分子量、logP、logD(pH 1–9)、pK?、拓扑极性表面积(TPSA)、密度、蒸气压、沸点和水溶性等参数,这些参数控制着挥发性、分配行为和在预测框架内的持久性。Percepta中实现的共识模型整合了多个局部相似性子模型,提供了一个中心预测值和一个内部置信区间,从而提供了模型不确定性的定量度量(Harvey等人,2020年;Noga等人,2024年)。
为了近似环境变异性,进行了两项扩展的计算分析:(i)在pH 1–9范围内进行pH依赖的logD分析,以捕捉预测的离子化动态;(ii)在–20°C至+65°C之间进行温度依赖的蒸气压估计,以评估在环境和生理条件下的预测挥发性和热稳定性(Fran?a等人,2019年;K?oske和Witkiewicz,2019年;Nepovimova和Ku?a,2018年)。
将预测值与G系列(例如Sarin、Soman)和V系列(例如VX)试剂的文献数据进行比较,以验证预测趋势的一致性,考虑到A系列试剂的直接实验确认通常不可用。实际上,使用了代表性的G系列试剂如Sarin和Soman(具有相对较高的挥发性和有限的环境持久性),以及V系列试剂如VX(具有极低的挥发性和长期的表面持久性)作为定性参考点。通过将预测的蒸气压、沸点和分配行为与这些已建立的趋势进行比较,来检查计算输出的可信度,确保所应用的预测工具在解释A系列结果之前能够再现已知的物理化学排序。这个过程是一个一致性验证步骤,而不是正式的模型校准,特别是在A系列试剂的实验基准仍然存在的情况下尤为重要。此外,与混合DFT/QSAR计算研究(Jeong等人,2022a;Jeong等人,2022b;Rashid等人,2022年;Keshavarz等人,2025年)的进一步比较进一步支持了不同理论框架之间的方法一致性。
2.5. 基于QSAR的毒性和环境命运建模
通过结合OECD QSAR Toolbox和EPA Toxicity Estimation Software Tool(T.E.S.T.)平台的基于QSAR的工作流程来估计毒理学和选定的环境终点,以提高预测的稳健性,并同时最小化潜在的算法偏见。
OECD QSAR Toolbox v4.6 - 由OECD环境、健康和安全部门开发,该平台使用化学相似性映射、机制剖析和基于超过60,000条记录的精心策划的实验数据库的数据填充(Carlsen,2019年;Bhakhoa等人,2019年;OECD,2019年)。每种A系列化合物被分类为亲电性和有机磷反应性领域,从而可以从结构相关的化合物中进行跨领域预测。预测的终点包括急性口服毒性(LD??,大鼠)和在适用范围内可用的水解稳定性指标。预测结果还与REACH和ECOTOX数据库中包含的结构相关的有机磷试剂进行了交叉验证,以支持建模背景下的机制合理性。
EPA T.E.S.T. v5.2.1 - EPA Toxicity Estimation Software Tool整合了多种统计和机器学习算法,包括层次聚类、最近邻、FDA类似回归和支持向量机等方法,以形成共识QSAR预测(Martin,2016年;Mansouri等人,2018年;美国环境保护署,2024年)。在本研究中,预测集中在急性毒性(LD??)和皮肤渗透系数(K?)上,这两者都与暴露评估场景直接相关。所有调查的化合物都位于模型的适用范围内,支持内部预测的一致性。
预测结果的整合 - 保留下来用于下游分析的输出包括预测的LD??值和可用的皮肤渗透系数。在适用范围外未预测的终点或特定化合物中缺失的终点被保留为缺失值,并在随后的统计处理中处理,以避免由于数据覆盖不完全而产生的偏见。这些定量预测随后与物理化学描述符结合,以建立结构-性质-毒性关系(SPTR),并在统计分析阶段进行评估。
2.6. 生物活性预测(PASS Online)
为了补充定量的物理化学和毒理学预测,使用了PASS Online(2024版本)进行了概率生物活性分析。PASS Online基于结构相似性,使用贝叶斯统计方法对原子中心片段描述符进行生物活性预测(Melagraki,2022年;Harvey等人,2020年;Lagunin等人,2000年;Filimonov等人,2014年)。
PASS的输出包括两个互补的概率:
• Pa:化合物表现出特定活性的概率;
• Pi:化合物不表现出该活性的概率。
由于Pa值代表的是概率可能性而非定量效力指标,因此它们被定性解释,并仅用于化合物之间的比较分析。PASS Online之前已被应用于Novichok和VX试剂,以估计胆碱能、神经毒性、毒性和呼吸衰竭活性概率,证明了其在神经试剂的非实验比较评估中的适用性(Roupas等人,2023年)。
计算程序:优化的分子结构从ACD/Labs ChemSketch导出为规范的SMILES,并使用默认的预测设置提交给PASS Online。平台生成的概率谱随后被导出并与QSAR衍生的输出整合。
选择的终点:仅保留与神经试剂毒理学直接相关且在所有化合物中一致可用的活性预测:
• 胆碱能活性;
• 神经毒性;
• 呼吸毒性;
• 多器官衰竭概率。
未直接与急性毒理学行为相关或在化合物间预测不一致的终点被排除,以保持计算分析中的解释一致性。
与定量描述符的整合:PASS衍生的概率与预测的毒性和渗透性输出一起评估,以探索分子极性、暴露潜能和预测生物效应之间的关系。这种整合使得能够在研究中开发的更广泛的物理化学-毒理学建模框架内解释活性可能性模式。
2.7. 数据处理、统计分析和模型验证
所有保留用于分析的数值输出都以CSV格式导出,并使用Microsoft Excel 365、OriginPro 2024和Python(pandas)进行处理。仅保留了在模型结构中一致可用的描述符和终点用于统计评估。对于个别化合物中特定终点不可用的情况,值被保留为缺失条目,并在统计处理中适当处理,以确保数据集之间的比较一致性和无偏见。在数据集中识别出缺失的终点值(“n.f.”),主要影响Ellison结构变体。这些条目从需要完整数据矩阵的分析中排除(例如PCA),而所有可用数据则保留用于描述性解释。
在多变量分析之前,使用z分数标准化对连续变量进行了标准化,以防止像物理化学性质、渗透系数和生物活性概率这样的不同描述符之间的尺度依赖偏差。
使用皮尔逊相关系数(r)量化了选定的物理化学描述符(例如logD、TPSA、密度)、预测的毒性(LD??)、渗透性指标(有效K?)和生物活性概率之间的成对关系。计算相关矩阵以识别描述符聚类模式和物理化学、暴露相关和生物参数之间的总体关系。由于数据集规模有限(n = 8),相关性被严格解释为描述性趋势,而非统计关系。
对标准化变量(包括logD(pH 7)、TPSA、密度、预测的LD??、有效K?和选定的生物活性概率)进行了主成分分析(PCA)。PCA实现了维度缩减,并在多维描述符空间中可视化了化合物的聚类模式。由于数据完整性要求,PCA是在具有完整数据的变量和结构子集上进行的,这导致某些Ellison变体在特定终点处被部分排除。排除的条目数量有限,并未改变定性聚类模式。
计算了特征值和解释的方差贡献,并使用前两个主成分的得分图来检查结构变体之间的相似性和差异。前两个成分解释了数据集的大部分变异性,表明主要化合物间的差异在简化的描述符空间中得到了有效表示。
为了提供模型数据集中化合物之间的比较性风险视角,构建了一个综合风险指数,使用了三个预测因子:
1. 预测的急性毒性(逆LD??);
2. 皮肤渗透性(有效K?);
3. 预测的神经毒性概率。
每个参数在组合之前都进行了标准化,并采用了相同的权重,作为一个简化的、不依赖于具体场景的假设,因为在缺乏A系列试剂的实验验证重量方案或敏感性分析的情况下。故意选择相同的权重,以避免引入暴露途径特定、政策驱动或基于场景的假设。由于缺乏适合校准的实验参考数据,没有探索其他权重策略。使用得出的指数在化合物之间生成了相对风险排名。该排名代表基于模型的相对风险潜力,而不是绝对的毒理学风险。
所有预测都是在各自计算工具的适用范围内生成的。确定性模型行为确保了在相同输入下的可重复输出。只有位于模型有效范围内的预测被保留用于定量整合,而模型覆盖范围之外的终点被排除在比较统计解释之外。
鉴于数据集规模有限(n = 8个结构表示),本研究中的所有统计分析——包括相关性分析、主成分分析和综合指数构建——都被解释为探索性和描述性的,而不是推断性的。这些分析的目的是在模型数据集内识别内部一致的结构-性质-毒性模式,而不是建立统计上普遍适用的关系或因果依赖性。因此,没有进行显著性测试或假设驱动的推断。同样,也没有应用统计显著性测试(例如p值),因为这样的措施对于小样本量来说并不稳健,可能会导致误导性的解释。
尽管为了多变量分析(例如PCA)排除了不完整的条目,但总体描述符范围和相对的结构-性质-毒性模式在定性层面仍然是一致的。
3. 结果
多平台同步分析提供了对A系列(Novichok)神经剂的物理化学行为、预测毒性和生物活性的综合定量视角。ACD/Labs Percepta、OECD QSAR Toolbox、EPA T.E.S.T.和PASS Online的结合使用,生成了一个将分子结构与预测的暴露相关性质和计算生物危害指标联系起来的连贯数据集。这种基于片段、相似性驱动和概率模型的整合确保了方法上的互补性和计算框架内的解释稳健性(Carlsen,2019年;Melagraki,2022年;Noga和Jurowski,2025b)。
计算工作流程产生了一套统一的物理化学描述符和预测终点,涵盖了内在分子性质和预测的生物效应。物理化学参数——包括分配描述符(logP、logD)、拓扑极性表面积(TPSA)、密度、蒸气压和沸点——使用ACD/Labs Percepta PhysChem Suite进行预测(Carlsen,2019年;Gadaleta等人,2019年;Lange等人,2024年)。这些参数影响分子与生物膜和环境矩阵的预测相互作用,影响在模型暴露场景中的挥发性、生物利用度和分配行为(Fran?a等人,2019年;K?oske和Witkiewicz,2019年;Chung等人,2023年)。
在数据集层面,校正后的预测表明中等分配潜力(logP(GALAS)约为0.5–1.7),以及非常低的蒸气压(25°C时为0–0.05 mmHg),支持预测的暴露概况主要由表面/接触持久性和凝聚相行为主导,而非持续的蒸气相传输。与此概况一致的是,极性指标(TPSA)与预测的生物活性概率显示出描述性关联,而仅凭亲脂性无法解释不同结构变体之间的毒性变化。
基于QSAR的毒性和渗透性:用于比较评估的毒理学终点包括预测的急性毒性(LD??)和皮肤渗透系数,这些结果是通过结合OECD QSAR Toolbox和EPA T.E.S.T.的工作流程生成的。这些工具应用了互补的建模策略:Toolbox在定义的适用性范围内(AD)采用结构穿越和机制分析方法,而EPA T.E.S.T.则使用集成回归和机器学习共识模型(Kutsarova等人,2021年;Otsuka和Miyaguchi,2021年;Aljallal等人,2024年)。在下游分析中,只有在整个模型化合物中一致可获得的终点被保留用于统计评估。对于无法获得的数值(“n.f.”),它们没有被估算,并且被排除在定量解释之外。
PASS衍生的生物活性谱:PASS Online通过仅基于分子结构来估计毒理学相关活性类别的概率,进一步扩展了生物解释。保留的终点——胆碱能活性、神经毒性、呼吸衰竭和多器官衰竭——在几种变体中显示出一致的高预测神经毒性概率,而胆碱能概率则与极性相关描述符有系统性的变化。将这些概率结果与物理化学描述符结合,支持了在建模框架内理解极性和膜相互作用潜力如何影响预测活性模式的方法。
跨模型统计整合:统计分析仅限于模型中的A系列制剂及其结构变体,而不是直接与其他神经制剂家族进行定量对比。评估包括相关性分析、主成分分析(PCA)以及从预测的毒性、渗透性和神经毒性概率趋势中得出的综合危险排名(Chivukula等人,2025年)。这些分析共同定义了模型化合物中的一致的结构-性质-毒性关系(SPTR)模式。结果表明,与极性相关的描述符和渗透性指标对于解释此数据集中的预测生物活性模式特别具有信息性。通过在一致的统计框架内整合确定性和概率预测,该分析提供了所选A系列制剂在环境和生物条件下的预测行为的综合计算表征(Carlsen,2019年;Noga和Jurowski,2025a年;Noga和Jurowski,2025b年)。
3.1. 物理化学性质
使用ACD/Labs Percepta PhysChem Suite(v2023.1)预测了A系列神经制剂——A-230、A-232、A-234、A-242和A-262的物理化学性质,以支持在计算框架内解释潜在的暴露途径和浓缩相持久性。对于A-230、A-232和A-234,分别使用Ellison和Mirzayanov(Ellison,2007年;Mirzayanov,2008年)的结构公式进行了计算,以捕捉结构表示的不确定性,并评估结构变化如何影响预测描述符。关键报告的描述符包括分子量(MW)、logP(GALAS)、logD(pH 7)、TPSA、密度、沸点和蒸气压——这些参数决定了在环境和生理条件下的预测分配行为和挥发性(Carlsen,2019年;Harvey等人,2020年)。
表1. 选定的A系列(诺维乔克)制剂的预测物理化学和环境描述符
| 制剂 | 结构来源 | MW (g·mol?1) | logP (classic) | logP (GALAS) | logD (pH 7) | 密度 (g·cm?3) | pKa (base) | TPSA (?2) | 沸点 (°C) | 蒸气压 (25 °C, mmHg) |
|------|---------|-----------|-----------|-----------|-----------|-----------|-----------|-------------|-------------|
| A-230 | Ellison | 241.9 | 2.45 | 1.39 | 1.95 | n.a. | 57.70 | 241.78 | n.f. |
| A-230 | Mirzayanov | 194.1 | 0.49 | 0.52 | 0.38 | 1.09 | 8.59 | 42.48 | 235.47 | 0.01 |
| A-232 | Ellison | 255.9 | 2.79 | 1.56 | 2.14 | n.a. | 57.70 | 252.24 | n.f. |
| A-232 | Mirzayanov | 210.1 | 0.04 | 0.56 | 0.51 | 1.14 | 8.59 | 51.71 | 239.17 | 0.01 |
| A-234 | Ellison | 269.9 | 3.14 | 1.69 | 2.37 | n.a. | 57.70 | 263.44 | n.f. |
| A-234 | Mirzayanov | 224.2 | 1.02 | 0.74 | 0.85 | 1.12 | 8.59 | 51.71 | 258.15 | n.f. |
| A-242 | Mirzayanov | 251.2 | 0.88 | 0.93 | 0.91 | 1.06 | 3.69 | 45.72 | 300.07 | 0.01 |
| A-262 | Mirzayanov | 267.2 | 1.34 | 0.94 | 1.14 | 3.69 | 54.95 | 303.54 | n.f. |
注:数值对应于最终数据集中整合的ACD/Labs Percepta输出。“n.f.”表示在研究中保留的预测输出中不可用/不适用。蒸气压数值报告为25°C时的值。
3.1.1. 分子大小和极性
在修正后的数据集中,复合物的分子量范围为194.19–269.99 g·mol?1。TPSA数值范围为42.48–57.70 ?2,表明其极性处于中等水平,与有限的水相互作用相兼容,同时仍允许预测的膜分配(Fran?a等人,2019年)。结构变体在极性上显示出明显的变化:例如,Mirzayanov表示的A-230通常具有较低的TPSA,而A-232和A-234的Mirzayanov形式在数据集中保持相对较高的TPSA值。
3.1.2. 分配行为和亲脂性
修正后的分配描述符表明预测的亲脂性适中,而非极端疏水性。logP(GALAS)范围为0.52–1.69,而logD(pH 7)范围为0.38–2.37,支持膜分配是可能的但不过度的解释。这个描述符空间与混合暴露相关性一致——接触驱动的持久性结合了生物学上相关的吸收潜力——无需假设非常高的疏水性(Nepovimova和Ku?a,2018年)。在数据集中,A-230、A-232和A-234的Ellison结构形式始终显示出比其Mirzayanov对应形式更高的预测logD值,反映了由结构表示引起的预测分配行为的系统差异。
3.1.3. 溶解度、蒸气压和密度
在有蒸气压预测的情况下,数值普遍非常低(在25°C时约为10?2 mmHg),与经典的高挥发性制剂相比,这支持了释放后表面持久性的预测(Carlsen,2019年)。沸点范围大约在235°C至304°C之间,而预测的密度范围为1.06–1.72 g·cm?3,表明这些模型制剂将主要保持在浓缩相中并沉积在表面上,而不是进行持续的大气传输。各个数值之间的差异很小,且落在预测模型的预期不确定性范围内,因此不被解释为明显的趋势。
3.1.4. 物理化学意义的总结
总体而言,修正后的物理化学特征表明,这是一组具有低预测挥发性和中等极性的制剂,支持持久性和接触驱动的暴露潜力,同时保持与生物学上相关的吸收途径兼容的描述符值。这些结果为解释以下小节中的预测毒性、皮肤渗透性和PASS衍生的生物活性概率提供了物理化学基础。
3.2. 毒理学预测(QSAR Toolbox & EPA T.E.S.T.)
从QSAR输出中编译了A-230、A-232、A-234、A-242和A-262的预测急性毒性和皮肤渗透性参数,以供下游分析使用。对于A-230、A-232和A-234,评估了Ellison(2007年)和Mirzayanov(2008年)(Ellison,2007年;Mirzayanov,2008年)的结构表示,以考虑结构表达的不确定性。报告的数值包括预测的LD??(口服大鼠)、模型预测的LD??值和皮肤渗透系数(有效Kp和/或Kp)。没有在所有模型中一致可获得的终点被排除在比较统计解释之外,以保持一致性。
表2. 选定的A系列(诺维乔克)制剂的预测毒性和皮肤渗透性参数
| 制剂 | 结构来源 | 预测LD??(口服大鼠,mg·kg?1)| 分解速率(25 °C,pH 7.2;μM·min?1)| 有效Kp(cm·h?1)| Kp(cm·h?1)|
|------|------------------|------------------|-----------------|-----------------|
| A-230 | Ellison | n.f. | 5.76 | 1 × 10?? | n.f. |
| A-230 | Mirzayanov | 280 | 0.17 | 3.34 | 5 × 10?? |
| A-232 | Ellison | 14 | n.f. | 1.00 | 9 × 10?3 |
| A-232 | Mirzayanov | 10.06 | 12.44 | 9 × 10?? | 1.86 |
| A-234 | Ellison | 10 | n.f. | 1.80 | 9 × 10?3 |
| A-234 | Mirzayanov | 10 | 0.00 | 324.86 | 0 × 10?? |
| A-242 | Mirzayanov | 13 | n.f. | n.f. | 3.39 | 7 × 10?? |
| A-262 | Mirzayanov | 1 | n.f. | n.f. | n.f. |
注:LD??数值对应于最终数据集中整合的OECD QSAR Toolbox和EPA T.E.S.T.输出;未包含实验测量的LD??数值。分解速率在模型输出可用时报告。有效Kp和Kp代表由QSAR工具预测的皮肤渗透系数。“n.f.”表示在保留的模型输出中不可用的数值。
修正后数据集的一个关键结果是预测的LD??值在不同结构变体之间存在广泛差异,表明预测的急性毒性并不单调地随着单一描述符的变化而变化。相关性分析显示,亲脂性(logP)与预测的LD??之间没有明显的线性关系,而渗透性指标和与极性相关的描述符在数据集中提供了更可解释的结构-终点模式。
3.3. 跨模型整合和机制解释
将物理化学描述符与QSAR衍生的毒性和渗透性预测以及PASS衍生的活性概率相结合,支持了一致的计算解释:(i)由于蒸气压低,预测的浓缩相持久性在整个数据集中是一致的;(ii)预测的分配和极性随着结构表示而有系统性的变化;(iii)预测的活性概率与与极性相关的描述符相比,与亲脂性的相关性更强。总体而言,这些趋势支持了一种以膜相互作用潜力和极性介导的传输为中心的内部一致的结构-性质-毒性关系(SPTR)解释,而不是基于高挥发性的假设。
3.4. 生物活性谱(PASS Online)
使用PASS Online估计了生物活性概率。保留的输出包括胆碱能活性、神经毒性、呼吸衰竭和PASS特定的“毒性活性”类别的概率,后者代表一种概率性的活性类别分配,而不是定量的毒性或效力指标(Fran?a等人,2019年;Nepovimova和Ku?a,2018年)。在整个数据集中,预测的神经毒性概率相对较高(例如,几种Ellison表示的形式超过0.89),而胆碱能概率较低,并且与极性相关描述符的变化更为明显。这种模式支持将PASS输出解释为活性类别可能性的指标,而不是直接的效力度量。PASS衍生的Pa值代表活性类别成员资格的概率可能性,而不是定量的效力度量,不预期与LD??或渗透性估计呈现线性或单调对应关系。这里观察到的预测活性概率的相对大小和顺序与早期基于QSAR的诺维乔克制剂评估一致,这些评估同样报告了升高的神经毒性和呼吸衰竭概率以及变化较大的胆碱能活性可能性(Roupas等人,2023年)。这些值是在数据集内相对比较的,而不是针对外部基线。
表3. 从PASS Online得出的选定的A系列(诺维乔克)制剂的预测生物活性概率(Pa,活性可能性)
| 制剂 | 结构来源 | Pa(胆碱能活性) | Pa(神经毒性活性) | Pa(毒性活性) | Pa(呼吸衰竭) | Pa(多器官衰竭) |
|------|-----------|-----------|-----------|-----------|-----------|
| A-230 | Ellison | 0.11 | 0.84 | 0.87 | 0.82 | 0.43 |
| A-230 | Mirzayanov | 0.20 | 0.50 | 0.66 | 0.66 | 0.74 |
| A-232 | Ellison | 0.14 | 0.89 | 0.89 | 0.92 | 0.39 |
| A-232 | Mirzayanov | 0.19 | 0.64 | 0.55 | 0.64 | 0.68 |
| A-234 | Ellison | 0.12 | 0.93 | 0.89 | 0.76 | 0.39 |
| A-234 | Mirzayanov | 0.20 | 0.69 | 0.61 | 0.70 | 0.64 |
| A-242 | Mirzayanov | 0.17 | 0.74 | 0.61 | 0.77 | 0.74 |
| A-262 | Mirzayanov | 0.17 | 0.72 | 0.60 | 0.60 | 0.72 |
注:Pa值代表PASS Online的活性类别成员资格概率(0–1范围)。较高的Pa值表示化合物属于相应生物或毒理学活性类别的预测可能性更大。这些概率不代表定量的毒性效力或效应大小,应进行定性解释。仅报告在所有化合物中一致保留的活性类别。
3.4.1. 预测的神经毒性和系统效应
预测的神经毒性和呼吸衰竭概率在PASS输出中形成了一个连贯的活性子集,其中呼吸衰竭概率在几个结构变体中保持较高(K?oske和Witkiewicz,2019年;Harvey等人,2020年)。多器官衰竭概率在不同变体中显示出更大的变异性,支持结构表示影响预测的下游系统活性模式的解释,即使神经毒性概率保持较高。
3.4.2. 致突变性和遗传毒性潜力
致突变性和遗传毒性概率未被作为核心定量终点保留在最终数据集中,因此未包括在本文报告的统计分析中(Noga等人,2024年)。因此,结果部分仅关注与急性有机磷毒理学和系统效应直接相关的PASS终点。
3.4.3. 与QSAR预测的比较解释
在八个模型的数据集中,相关性分析表明,极性(TPSA)比亲脂性更能解释预测的胆碱能活性概率的差异。这一观察结果与修正后数据集中观察到的TPSA和Pa(胆碱能)之间的负相关一致,而预测的LD??值和Pa(胆碱能)之间的关系较弱。这些模式支持将PASS输出解释为补充的定性危险指标,而不是LD??大小的直接预测器(Bhakhoa等人,2019年;Aljallal等人,2024年)。
3.4.4. 生物相关性和局限性
PASS衍生的概率提供了机制上的活性可能性信息,但仍然是基于模型的估计,不能替代实验确定的效力度量。尽管如此,预测的神经毒性概率与低挥发性物理化学特征的结合支持了一种一致的计算解释,即危险潜力主要由接触持久性和预测复合危险指数被解释为一个简化的、启发式的度量标准,而不是一个决定性的或定量校准的危险等级。由此产生的启发式排名将那些结合了相对较高的预测渗透性、较高的预测神经毒性概率以及较低的预测LD??值的结构变体识别为在基于模型的危险指数中具有较高的相对风险。相反,那些具有较低预测渗透性和/或降低的预测生物活性概率的变体则位于较低的相对危险位置。这种排名是探索性的,仅用于在模型数据集内的比较解释。表4基于综合毒性、渗透性和神经毒性指标对A系列化合物的复合危险排名。
排名 代理(结构来源) 相对危险水平
1 A-234(Ellison) 非常高
2 A-232(Ellison) 非常高
3 A-230(Ellison) 高
4 A-234(Mirzayanov) 中等至高
5 A-242(Mirzayanov) 中等
6 A-262(Mirzayanov) 中等
7 A-230(Mirzayanov) 低至中等
8 A-232(Mirzayanov) 低
这种排序反映了预测的急性毒性、皮肤吸收潜力以及预测的生物活性概率的综合影响,表明结合了较高预测渗透性和较强预测神经毒性信号的变体在修正后的数据集的复合危险指标中占据较高位置。
3.7. 物理化学参数与毒理学参数之间的相关性
为了阐明预测的物理化学描述符与预测的毒理学终点和PASS衍生的活性概率之间的关系,对修正后的八模型数据集进行了相关性分析。分析支持三个实际观察结果:(i)极性(TPSA)与预测的胆碱能活性概率有显著关联;(ii)仅凭亲脂性无法解释不同结构变体之间预测LD??值的变异性;(iii)与渗透性相关的描述符与几种预测的活性概率共同变化,这支持了一种基于膜相互作用潜力的暴露-活性解释(Carlsen, 2019, Harvey et al., 2020, Noga et al., 2024)。
范围和样本量:相关性计算基于合并的结构数据集(n = 8:A-230、A-232和A-234各有两个结构,A-242和A-262各有一个结构)。当特定终点不可用时(“n.f.”),这些成对比较被排除在机制解释之外,以避免偏差。
解释:得出的相关结构支持了一种一致的SPTR叙述,其中极性和渗透性相关的指标提供了与预测的生物活性概率最可解释的联系,而在这个有限的数据集中,预测的急性毒性幅度(LD??)不能仅通过单一描述符充分描述。这些关系为讨论中发展的机制综合提供了统计基础。
4. 讨论
这里呈现的所有统计解释都是描述性和探索性的,反映了模型数据集的有限大小(n = 8)。数据集大小的有限性反映了A系列化合物的可用性和结构的不确定性,这与本分析的探索性范围一致。因此,观察到的相关性、聚类模式和相对排名被解释为应用计算框架内部一致性和机制合理性的指标,而不是具有统计普遍性的发现。在之前的基于QSAR的研究中也报告了预测的活性、毒性和渗透性终点对替代结构表示的敏感性,其中A系列化合物的美国和俄罗斯结构变体产生了系统不同的活性概率和皮肤渗透系数(Roupas et al., 2023)。
综合的计算机模拟结果为A系列化合物定义了一个连贯的物理化学和机制特征,位于经典的G系列和V系列化合物之间。在合并的数据集(Ellison和Mirzayanov的结构;n = 8)中,预测的分配描述符表明中等亲脂性(logP (GALAS) ≈ 0.5–1.7),以及非常低的蒸气压(≈ 0–0.05 mmHg at 25 °C),这导致预测的暴露模式以凝聚相持续性和接触驱动的暴露为主,同时仍允许通过膜相互作用过程进行生物学相关的吸收(Fran?a et al., 2019, Carlsen, 2019, Harvey et al., 2020)。
尽管在几何或电子层面上存在细微差异,Ellison和Mirzayanov的结构变体在模型数据集中表现出相似的描述符排序和定性趋势一致性。虽然目前Mirzayanov型结构被视为A系列化合物的主要代表,但与Ellison型结构的比较对于评估预测的结构-性质-毒性关系在历史结构不确定性下的稳健性仍然有价值(Opravil et al., 2023)。由于样本量有限,任何探索性的统计比较都是描述性的而不是推断性的。相关性分析进一步表明,与极性相关的描述符和与渗透性相关的参数与预测的生物活性概率提供了更可解释的描述性关系,这支持了观察到的结构-活性模式反映了内在的分子特性而不是算法伪影的解释(Bhakhoa et al., 2019)。
A-230、A-232和A-234的预测挥发性处于相同的低挥发性范围内(≈10?2 mmHg),并且显著低于高挥发性G系列化合物(如沙林,GB ≈ 2–3 mmHg at 25 °C),同时高于极耐久的V系列化合物(≈10?? mmHg),保持了经典的G?V挥发性区间(Fran?a et al., 2019, Carlsen, 2019)。由于模型不确定性,个别值之间的细微差异没有进行定量解释。
这些预测值支持在凝聚相中的持久性,而不是在气相中的持续分散。使用有限剂量皮肤渗透模型的独立QSAR基础研究同样确定皮肤接触是A系列化合物的主要暴露途径,直接将渗透系数与亲脂性和低蒸气压特征联系起来(Roupas et al., 2023)。将A系列化合物定位在经典的G系列挥发性和V系列持久性之间也作为此处使用的计算工作流程的外部合理性检查。独立计算研究应用相关的基于QSAR的毒性和渗透性工具对VX和Novichok型化合物进行了研究,报告了相似的物理化学和暴露相关趋势,特别是关于亲脂性、低挥发性和增强的皮肤吸收潜力的耦合。当前预测与这些先前报告的计算模式的一致性支持了所采用建模方法的一致性,同时承认这些化合物缺乏系统的实验数据集。
最近关于A-234的定量数据为这些计算结果提供了重要的外部基准。Hrabinová等人(2024)报告了A-234在大鼠体内的肌肉LD??为13.5 μg·kg?1,以及一个双分子抑制常数(k?)为4.3 × 10? M?1·min?1,证实了其异常的效力。暴露途径之间的差异使得直接比较变得复杂,但实验观察的幅度与将这些化合物归类为高效力有机磷神经毒素的计算预测大体一致。
在同一研究中,Hrabinová等人(2024)观察到在pH 7和25 °C条件下,大约86.2%的A-234在72小时后仍然保持完整,表明水解动力学较慢。虽然将这一观察直接转换为单一半衰期值取决于动力学假设,但实验报告的持久性与计算预测一致,表明在接近中性条件下水解相对较慢。Noga等人(2023)的计算机模拟命运预测进一步表明,Novichok的水解速率可能因结构和环境条件而大相径庭——从非常快(<1天)到非常慢(>1年)。Opravil等人(2023)引用Mirzayanov(2008)的报告,估计A-234在接近中性pH条件下的水解半衰期为几天到几周。Hrabinová等人的实验观察也同样表明降解缓慢,支持了A系列化合物在某些环境条件下相对持久的解释。
Kovarik等人的实验研究(Kovarik et al., 2025)提供了小鼠体内的皮下LD??值,这些值与当前计算数据集中的相对毒性排名一致,其中A-230、A-232和A-234构成了最危险的亚组,而A-242和A-262表现出相对较低的急性毒性。尽管暴露途径和实验条件存在差异,但A系列化合物的整体危险模式与我们的计算机模拟预测一致,加强了从建模结果得出的比较毒理学解释。
与近期文献的比较进一步将这些研究中的物理化学预测置于上下文中。Wiaderek等人(2025)报告的A-230、A-232、A-234和A-242的分子量与此处使用的结果一致,确认了结构的一致性,尽管沸点有所差异,但差异大约为6–30 °C,这可能是由于估计或编译方法的不同。在蒸气压和亲脂性估计上出现了更大的差异,文献中的蒸气压(≈0.6–2 mmHg at 25 °C)和logP值超过了此处使用的Percepta预测,反映了模型依赖的变异性。尽管如此,两种分析都一致地将A系列化合物描述为低挥发性、持久的液体,具有有利于皮肤吸收的物理化学性质,从而得出的定性危险解释一致。?ekovi?等人(2025)的报告得出了类似的结论,其编译的分子量与此处采用的相同,沸点也在相似的范围内,但他们的蒸气压和logP估计值高于本工作中的预测。研究间绝对蒸气压值的差异主要反映了模型依赖的估计方法和训练集组成,因此不影响定性挥发性分类或比较暴露解释。
与Tafaki和Chalaris(2024)的比较特别强调了与本数据集中使用的参数的高度一致性。A-230、A-232和A-242在25 °C时的蒸气压与我们数据集中的保持一致,预测的皮肤渗透系数也在相同的范围内,支持关于皮肤渗透潜力的一致结论。分子量也相匹配,预测的急性毒性值再现了此处观察到的相同的定性毒性排名,尽管绝对LD??值存在模型依赖的差异。总体而言,这种比较证明了强烈的数值一致性——特别是在挥发性和皮肤渗透性方面——并且独立支持A系列化合物是低挥发性化合物,具有强皮肤吸收潜力的结论。
与Tafaki和Chalaris(2024)的直接比较显示,特别是在25 °C时的蒸气压与我们的数据集保持一致,预测的皮肤渗透系数也在相同的范围内,支持关于皮肤渗透潜力的一致结论。分子量也相匹配,预测的急性毒性值再现了此处观察到的相同的定性毒性排名,尽管绝对LD??值存在模型依赖的差异。总体而言,这种比较证明了强烈的数值一致性——特别是对于挥发性和皮肤渗透性——并且独立支持了A系列化合物是低挥发性化合物,具有强皮肤吸收潜力的结论。
与早期缺乏可重复数值数据的定性描述相比,当前结果在定量上与可用的实验和计算基准相符,支持了集成计算机模拟框架的外部合理性,同时保持了预测值和实验测量值之间的区别。
相关性分析加强了一致的SPTR解释,其中极性和渗透性相关的指标提供了与预测的生物活性模式最相关的信息。具体来说,与渗透性相关的描述符与几种预测的活性概率共同变化,支持了基于膜相互作用潜力的暴露-活性解释。此外,如TPSA所反映的表面极性与预测的胆碱能活性概率有描述性的关联,表明极性调节了预测的生物可及性。相比之下,预测的急性毒性(LD??)的变异性无法仅通过数据集中的任何单一描述符充分描述,突出了预测毒性结果的多因素性质。
PASS衍生的活性概率与QSAR衍生的毒性和渗透性指标之间的一致性支持了这样的解释:概率生物输出和定量QSAR预测捕捉了预测危险的互补方面。由于PASS模型是基于有机磷化合物进行训练的,绝对概率值应谨慎解释,主要是在数据集内的相对背景下,而不是作为毒性的绝对指标或效力指标。
包括A-230和A-234在内的A系列化合物在某些条件下被预测为会经历相对缓慢的水解,这与Novichok化合物的理论水解研究一致(Otsuka和Miyaguchi, 2021)。因此,去污策略集中在通过催化和工程途径加速水解上,突出了快速中和此类化合物的实际挑战(Zammataro et al., 2020)。同时,标准肟类试剂的效力在不同有机磷化合物之间可能有所不同,这强调了针对特定试剂的重新激活考虑的重要性以及磷酸化AChE加合物的持久性(Worek et al., 2020)。
最近的评论强调,标准肟类疗法(例如,pralidoxime/2-PAM, HI-6, obidoxime)在有机磷神经剂方面的效果存在重要限制,特别是对于A系列(“Novichok”化合物),关于肟类重新激活效果的实验证据相对稀缺,许多机制问题主要通过理论和计算机模拟方法来探讨(Vorós et al., 2024)。同时,已经提出了替代的解毒和对策概念,包括超分子和催化清除策略,以补充或绕过传统的基于肟的重新激活方法,强调了有效中和高毒性有机磷化合物的持续挑战(Kubik, 2024)。鉴于预测的毒代动力学和毒效终点依赖于模型适用性域、描述符选择和训练数据组成,来自多平台计算机模拟评估的结果应被视为概率估计,而不是绝对常数(Bansod et al., 2025)。这对于A系列化合物尤为重要,因为高质量的实验参考数据仍然有限,限制了模型的校准和验证(Carlsen, 2019, Bhakhoa et al., 2019, Noga and Jurowski, 2025a, Noga and Jurowski, 2025b)。
在操作上,包括吸入和皮肤接触在内的多种暴露途径对有机磷神经剂仍然相关,现有的评论强调了跨不同类别剂的有效医疗对策的持续挑战(Fran?a et al., 2019, Zammataro et al., 2020)。在环境方面,建模研究表明,一些A系列化合物表现出缓慢的水解速率,尤其是A-242和A-262,其蒸气压较低——这些特征与它们在某些条件下的持久性一致(Opravil等人,2023年;Jeong等人,2022b年;Otsuka和Miyaguchi,2021年)。针对A-230、A-232和A-234的水解速率进行的实验研究也表明,与许多G系列化合物相比,它们的降解速度更慢,这进一步证实了它们的环境稳定性(Harvey等人,2020年)。因此,去污通常依赖于通过催化途径加速水解的策略(Zammataro等人,2020年)。通过整合标准参考文献中报道的结构表征(Ellison,2007年;Mirzayanov,2008年),本研究评估了关键预测的物理化学和毒理学趋势在不同A系列化合物表征中的稳定性。表5展示了所选A系列化合物的预测值与现有实验数据或文献数据之间的结构化比较,涵盖了急性毒性(LD??)、水解行为、蒸气压和相对毒性排名等代表性指标。由于暴露途径(如口服与肌肉注射)、实验条件以及模型假设的差异,直接进行定量比较是不可行的。因此,结果是以定性方式或数量级水平进行解释的,用于支持外部合理性,而不是严格的定量验证。
表5. 所选A系列(诺维乔克)化合物的预测值(本研究)与现有实验数据或文献数据之间的结构化比较
| 化合物 | 指标 | 预测值(本研究) | 实验/文献值 | 备注 |
|--------|-----------|-----------|---------|----------------------|
| A-234 | LD??(大鼠) | 100 mg/kg(口服,QSAR) | 13.5 μg/kg(肌肉注射,大鼠)(Hrabinová等人,2024年) | 暴露途径不同;比较仅具有指示性 |
| A-234 | 水解/持久性 | 0.0032 μM·min?1(QSAR预测) | 约86.2%在72小时后保持完整(pH 7,25°C)(Hrabinová等人,2024年) | 不同的指标;定性一致(降解缓慢) |
| A-242 | 蒸气压(25°C) | 0.01275 mmHg | 文献报告的值在同一数量级(Tafaki和Chalaris,2024年) | 数量级一致;没有独立的数值比较标准 |
| A系列(组比较) | 急性毒性排名 | A-230、A-232、A-234:预测毒性较高;A-242、A-262:较低 | 同实验研究中报告的相对排名(Kovarik等人,2025年) | 定性一致;没有直接数值比较 |
注:比较受到暴露途径、实验方案和QSAR模型适用性领域的限制。报告的值不可直接比较,应视为一般性一致性,而非定量验证。
尽管可以计算选定指标的倍数差异,但由于暴露途径、实验方案和模型假设的差异,这些比较并不十分可靠。因此,定量差异应谨慎 interpret,不能作为严格的验证指标。此外,预测值与实验值之间的比较受到适用性领域的限制,因为QSAR模型是基于结构相关但不完全相同的化合物进行训练的,而实验数据反映了特定的生物系统和暴露条件。这限制了直接的定量可比性,但不妨碍定性一致性。在这些限制下,观察到的相对趋势和数量级行为的一致性支持了集成计算框架的外部合理性。
5. 结论
本研究对五种选定的A系列(诺维乔克)化合物进行了严格的多平台计算机模拟表征——A-230、A-232和A-234(每种化合物均使用了Ellison和Mirzayanov风格的结构模型),以及A-242和A-262(仅使用Mirzayanov模型)。分析有意限于这一特定化合物集合,建立了一个可重复的计算工作流程,将分子结构与预测的物理化学行为、预测的毒理学性质和生物活性概率联系起来。通过整合ACD/Labs Percepta(物理化学描述符)、OECD QSAR Toolbox和EPA T.E.S.T.(毒理学和环境终点)以及PASS Online(概率生物活性谱),获得了八个建模结构的内部一致预测(n = 8)。在所研究的化合物中,预测的分配行为显示中等的亲脂性(logP (GALAS) ≈ 0.5–1.7),而预测的蒸气压值较低(25°C时为0–0.05 mmHg),水溶性有限。这些描述符共同表明,暴露情景主要由凝聚相持久性和接触驱动的暴露主导,同时保持了与生物吸收相符的膜相互作用潜力。在水解指标可用的情况下,预测表明在中性条件下降解速度相对较慢,这与文献证据一致,表明几种A系列化合物,特别是较重的类似物如A-242和A-262具有持久性。对于A-230、A-232和A-234,Ellison和Mirzayanov风格的结构变体通常保持了描述符排序和危险趋势,尽管各变体之间的数值差异有时较大,这证实了结构表征会影响预测值,但不改变总体危险性解释。
与最近的实验和计算文献的比较进一步支持了预测趋势的合理性。Kovarik等人(Kovarik等人,2025年)报告的实验毒性结果再现了此处观察到的相同相对毒性排名,其中A-230、A-232和A-234形成了最具危险性的亚组,而A-242和A-262表现出较低的急性毒性。与其他研究人员(Wiaderek等人,2025年;?ekovi?等人,2025年;Tafaki和Chalaris,2024年)编制的物理化学数据集的比较显示,在分子量、沸点、皮肤渗透范围和定性挥发性分类方面有广泛的一致性,即使存在因模型依赖的估计方法而产生的数值差异。总体而言,这些比较支持计算框架产生的结果与当前可用的外部基准一致,同时保持了预测值和实验测量值之间的区别。
相关性分析(n = 8)支持对研究化合物的SPTR(结构-属性-毒性关系)的连贯解释:与亲脂性相比,与极性和渗透性相关的描述符能够提供更清晰的描述性关系,而单独的亲脂性描述符不足以充分描述预测的急性毒性(LD??)。较高的预测渗透性通常与较高的活性概率相关,而极性可能调节预测的膜相互作用潜力。像A-230和A-234这样的化合物位于与较高预测吸收和活性概率相关的描述符区域,而A-242和A-262则表现出增强的持久性和非常低的预测挥发性。PASS Online的预测一致表明,所有建模结构的神经毒性概率均较高,而胆碱能和系统活性概率随极性相关的描述符变化。结合QSAR衍生的结果,这些结果支持预测的危险谱主要由胆碱酯酶相关的神经毒性主导,同时物理化学特性有利于在凝聚相中的持久性和接触暴露。
所有发现仅适用于此处考虑的建模化合物及其结构变体,不对整个A系列化合物进行任何声明。适用性领域的限制和训练数据的约束进一步限制了外推。这些限制通过跨平台一致性检查和排除超出验证范围的预测来加以解决。尽管如此,结果代表的是计算估计,而非实验测量结果,因此应作为概率指标进行解释,需要通过符合法律要求的实验进行验证。
在定义的范围内——A-230、A-232、A-234(Ellison和Mirzayanov变体),以及A-242和A-262(仅Mirzayanov)——集成多平台框架产生了将分子特征与预测的毒理学和环境行为联系起来的收敛预测,这一框架得到了透明的统计处理和适用性领域控制的支撑。这种以化合物为中心的分析完善了这些化合物的SPTR解释,并为相关有机磷化合物的比较性、非实验性危险评估提供了一个可重复的框架,而不将结论扩展到特定分子之外。所得预测是概率性的,旨在支持假设生成和相对危险性解释,而不是用于独立决策或绝对风险评估。
6. 未来工作
基于对A-230、A-232、A-234、A-242和A-262的结果,未来的工作应将该计算机模拟框架扩展到更广泛的A系列化合物集合,包括开放文献中提到的较少研究的酰胺、肟和胍类类似物、解密的技术摘要以及最近的计算研究。扩展分子数据集将有助于推导出更强的结构-属性-毒性(SPTR)关系,并支持更广泛的A系列化合物家族的精细危险性评估。第二个研究重点是通过多尺度模拟工作流程(结合分子动力学(MD)与量子力学/分子力学(QM/MM)方法)来提高机制分辨率。这样的模拟可以帮助解决酶-抑制剂相互作用、溶剂化动态、水解和老化机制,以及生理和环境条件下的肟介导的复活(Jeong等人,2022a年;Noga和Jurowski,2025a年;Zammataro等人,2020年)。通过提供关于结合稳定性、过渡态能量和反应模式的原子级洞察,这些混合模型可以补充统计驱动的QSAR预测,并提高对研究类似物的机制可解释性。
进一步的精细化可以通过AI辅助的QSAR和机器学习架构来实现,包括图神经网络、基于变换器的表示方法和集成学习策略(Bhakhoa等人,2019年;Das和Ojha,2025年;Vorós等人,2024年)。将这些方法与现有的OECD QSAR Toolbox和EPA T.E.S.T.环境相结合,可以支持自动描述符选择,捕捉非线性的结构-毒性关系,并扩展涉及高反应性有机磷分子的预测的适用性领域。本研究开发的描述符集和相关矩阵——将亲脂性、极性、水解稳定性和毒性终点联系起来——可以进一步支持环境命运和暴露建模。将这些计算结果与CBRN早期预警或分散系统相结合,可以为军事和民用风险管理提供关于持久性、挥发性和表面分配模型的定量输入(Fran?a等人,2019年;Harvey等人,2020年;Zammataro等人,2020年)。最后,继续与OPCW和化学武器公约(CWC)的指令保持一致,应优先进行降解途径、诊断生物标志物和光谱特征的计算机模拟研究,以协助法医验证和环境归因(Zammataro等人,2020年;Worek等人,2020年)。通过对反应中间体和降解产物的进一步建模,可以支持检测库、分析标准和暴露后监测协议的开发。
通过追求这些方向,现有框架可以发展成为一个全面的预测平台,用于系统性地、非实验性地评估A系列及相关有机磷化合物,支持早期预警能力、修复策略设计以及CWC验证框架内的国际政策制定。
在手稿准备过程中,作者使用了ChatGPT来提高手稿的可读性。使用该工具/服务后,作者根据需要对内容进行了审查和编辑,并对出版物的内容负全责。
未引用的参考文献:Madaj等人,(2024)
CRedi的作者贡献声明:
Ioanna Kanavou:撰写——原始草稿、软件、方法论、调查、正式分析、数据管理;
Michail Chalaris:撰写——审阅与编辑、监督、项目管理、方法论、概念化;
Sotiria Anastasiou:撰写——原始草稿、可视化、验证、软件、正式分析、数据管理。