光谱偏心率拓扑指数用于药物活性预测

《Computational Biology and Chemistry》:Spectral-eccentricity topological index for drug activity prediction

【字体: 时间:2026年05月10日 来源:Computational Biology and Chemistry 3.1

编辑推荐:

  分子拓扑与生物活性之间的关系是计算机辅助药物设计的基础。现有的拓扑指数倾向于捕获局部连接性(基于度的指数)或全局几何结构(基于偏心率的指数),然而很少有描述符试图以统一的、基于顶点(per-vertex)的方式融合这两个方面。在此,研究人员提出了光谱偏心率指数

  
分子拓扑与生物活性之间的关系是计算机辅助药物设计的基础。现有的拓扑指数倾向于捕获局部连接性(基于度的指数)或全局几何结构(基于偏心率的指数),然而很少有描述符试图以统一的、基于顶点(per-vertex)的方式融合这两个方面。在此,研究人员提出了光谱偏心率指数(Spectral Eccentricity Index, SEI),其定义为所有顶点的顶点偏心率与相应拉普拉斯特征值乘积的总和,其中两个序列均按非递减顺序排列并按秩配对。这种基于重排不等式(rearrangement inequality)的秩匹配配对,放大了那些同时处于外围暴露位置且在光谱上显著的顶点的贡献。研究人员推导了路径图(Pn)、环图(Cn)和完全图(Kn)的严格闭式表达式。作为一项探索性的概念验证,研究人员计算了从ChEMBL数据库中选取的十种药物分子的光谱偏心率指数(SEI)值——咖啡因、苯、萘、腺嘌呤、阿司匹林、葡萄糖、布洛芬、扑热息痛、多巴胺和血清素——这些分子针对人环氧合酶-2(COX-2, ChEMBL target CHEMBL230)具有生物活性(IC50)值。在这个有限的十个化合物的数据集上,SEI与测量的生物活性的决定系数 R2=0.923,相比之下,Randi?指数的 R2=0.781,增强的Zagreb指数的 R2=0.717。这些数值必须被视为探索性的,因为仅有十个数据点,单个结构上非典型的化合物可使 R2发生0.05–0.10的偏移,在没有对实质上更大、结构多样的基准集进行验证的情况下,不能认为SEI相对于竞争指数的优势已经确立。补充材料中提供了所有计算出的SEI值、拉普拉斯特征值、偏心率序列以及用于复现它们的Python脚本,以便进行独立验证。对阿司匹林的逐顶点分析表明,SEI将最大的权重置于末端悬挂原子(pendant terminal atoms)(最高偏心率,等于图直径),这对应于已知的药效团基团。计算复杂度为 O(n3)——对于最多约100个重原子的分子是可处理的——SEI可能在QSAR工作流程中作为一种有用的光谱几何描述符,但有待更广泛的验证。
论文解读:光谱偏心率拓扑指数在药物活性预测中的应用
研究背景与动机
在过去的五十年里,数学化学,特别是图论在分子结构中的应用取得了显著进展。通过将非氢原子视为顶点,共价键视为边,分子可以被抽象为分子图 G=(V,E)。拓扑指数作为从此类图中导出的标量数量,旨在建立分子结构与理化或生物性质之间的定量联系,从而支持定量构效关系(Quantitative Structure-Activity Relationship, QSAR)/定量构效关系(Quantitative Structure-Property Relationship, QSPR)建模。尽管已有Wiener指数、Randi?连接性指数、Zagreb指数等众多描述符,但该领域一直存在一个反复出现的问题:基于度的指数(如Randi?、Zagreb)编码的是局部连接信息,而基于偏心率的指数(如总偏心率)虽然提供了几何信息,却未能捕捉全局光谱结构;反之,光谱指数(如图能量、Estrada指数)利用了特征值,却丢弃了逐顶点的几何信息。为了填补这一空白,本研究旨在构建一种能够融合局部与全局信息的新型混合描述符。
研究方法与技术路线
研究人员引入了光谱偏心率指数(Spectral Eccentricity Index, SEI),其核心定义是将排序后的顶点偏心率序列与排序后的拉普拉斯特征值序列进行秩匹配配对后求积和。该方法基于重排不等式原理,旨在最大化外围暴露且具有显著光谱特征顶点的贡献。研究采用了理论推导与实证分析相结合的方法:首先推导了路径图(Pn)、环图(Cn)和完全图(Kn)的闭式表达式及界限;随后选取了来自ChEMBL数据库(版本33)的十种药物分子(包括咖啡因、阿司匹林等),针对人环氧合酶-2(COX-2, ChEMBL230)的IC50数据进行QSAR建模;通过计算SEI并与Randi?指数、增强Zagreb指数进行对比,评估其预测性能。此外,研究人员还对阿司匹林进行了详细的逐顶点分析,并利用Python脚本进行了数据复现验证。
研究结果
定义与理论基础
研究人员正式定义了光谱偏心率指数(SEI)。对于一个连通图,设其拉普拉斯特征值为 0=μ1μ2?μn,顶点偏心率按非递减顺序排列为 ?1?2??n。SEI被定义为 SEI(G)=i=1n?i?μi。该定义的动机源于重排不等式,即当两个序列同序排列时,其乘积之和最大,从而放大了高偏心率(外围)与高特征值(全局连通性)顶点的联合效应。
数据集与生物活性
生物活性数据来源于ChEMBL数据库(发布版33)。十种化合物均针对人环氧合酶-2靶标(CHEMBL230)进行查询。研究人员检索了单剂量结合实验的IC50值(置信度得分 8),在存在多个测量值时取几何平均值,并将其转换为pIC50=?log10[IC50]),最后归一化至0–100标度。
案例研究:阿司匹林(C9H8O4
阿司匹林作为一种非选择性COX抑制剂,其分子图包含13个重原子和13条键。分析显示,SEI在阿司匹林上的计算结果表明,最大的权重被赋予了末端的悬挂原子(pendant terminal atoms),这些原子的偏心率最高,等于图的直径,且恰好对应于已知的COX-2药效团模型中的关键功能基团。
结果讨论与结论
在十种化合物的探索性数据集上,SEI与COX-2 pIC50的相关性(R2=0.923)强于Randi?指数(R2=0.781)和增强Zagreb指数(R2=0.717)。这种秩匹配的光谱-偏心率配对策略使得SEI能够将最大的权重置于具有强全局连接性的外周悬挂原子上。尽管这一结构原理在内部是一致的,但由于样本量极小,单个异常化合物可能导致 R2产生0.05–0.10的波动,因此SEI相对于现有指数的优势尚未得到确立,需在未来更大规模、结构更多样的基准集上进行验证。
本研究提出了光谱偏心率指数(SEI),这是一种通过基于重排不等式的秩匹配配对,融合顶点偏心率与拉普拉斯谱的拓扑描述符。研究人员建立了路径图、环图和完全图的闭式表达式,并证明了将SEI与图半径和直径联系起来的紧密界限。作为一项探索性概念验证,研究人员计算了十种具有COX-2活性的药物化合物的SEI,结果显示其与生物活性的相关性优于传统的Randi?指数和增强Zagreb指数。尽管受限于小样本量,但SEI的计算复杂度 O(n3)对于约100个重原子的分子是可处理的,这表明SEI有潜力作为QSAR工作流程中的一种有用的光谱几何描述符,但仍需进一步的广泛验证。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号