《Computational Biology and Chemistry》:Elucidating the Mechanisms of Aristolochic Acid-Induced Upper Tract Urothelial Carcinoma: A Multi-Omics Approach Combining Bioinformatics and Computational Modeling
编辑推荐:
为系统阐明马兜铃酸(AA)诱导上尿路尿路上皮癌(UTUC)的致癌机制,研究人员整合网络毒理学、机器学习、分子对接与分子动力学模拟等计算生物学方法,深入探索了AA致UTUC的潜在分子作用靶点与通路网络。研究发现AA可能通过直接结合EGFR、PTGS2等核心靶点,协同经典DNA加合物介导的基因毒性通路,共同驱动UTUC的发生发展。该研究为理解AA相关的致癌机制提供了新视角,并为防治策略的开发奠定了理论基础。
在全球健康意识提升的浪潮下,天然药物的使用日益广泛,但其中的“隐形杀手”不容忽视。马兜铃酸,这种存在于某些传统草药中的天然化合物,已被世界卫生组织国际癌症研究机构明确列为I类人类致癌物,与一种恶性程度较高的癌症——上尿路尿路上皮癌密切相关。长久以来,科学家们普遍认为,马兜铃酸的“罪证”在于它能与细胞的“生命蓝图”DNA结合,形成难以清除的“烙印”(DNA加合物),从而引发基因突变,最终导致细胞癌变。然而,随着研究的深入,一个谜团逐渐浮现:除了这套广为人知的、直接攻击DNA的“基因毒性”剧本,马兜铃酸是否还扮演着其他不为人知的角色?它能否像一把“万能钥匙”,直接“插”入细胞信号通路中的关键蛋白质“锁孔”,开启或关闭致癌开关,与基因毒性机制“里应外合”,共同导演癌症这出悲剧?这个超越单一机制的、多靶点的致癌网络,正是当前研究的空白与挑战。
为了回答这个复杂的问题,Tongpeng Liu、Yu Yao、Yuan Xu、Haojun Zhang、Lijiang Sun、Guiming Zhang这组研究人员展开了一场深入的“虚拟侦查”。他们绕开了传统耗时费力的实验摸索,而是巧妙地运用了一系列强大的计算生物学工具,对马兜铃酸的致癌“暗网”进行了系统性排查与模拟推演。他们的研究成果最终发表在《Computational Biology and Chemistry》期刊上,为我们理解马兜铃酸的“多重身份”提供了全新的线索。
为开展研究,作者团队主要运用了以下几项关键技术:首先,通过整合网络毒理学方法,从ChEMBL、STITCH、SwissTargetPrediction、OMIM、GeneCards等公共数据库中筛选并交叉比对,获得与马兜铃酸及上尿路尿路上皮癌共同相关的潜在靶点。其次,利用Cytoscape软件构建和分析蛋白质-蛋白质相互作用网络,并结合多种拓扑学算法(如MCC、MNC、Degree、Closeness)鉴定核心靶点。接着,采用机器学习模型(基于LASSO回归和随机森林的嵌套交叉验证策略)对核心靶点的预测效能进行验证和解释,所使用的训练与验证数据来源于公共基因表达数据集GEO GSE166716。然后,运用分子对接技术(AutoDock Vina)模拟马兜铃酸与核心靶点蛋白的结合模式与亲和力。最后,通过分子动力学模拟(GROMACS软件,100纳秒)和分子力学/泊松-玻尔兹曼表面积结合自由能计算,深入评估和验证关键复合物的动态稳定性和热力学结合强度。
研究结果:
1. 与AA诱导UTUC相关靶点的筛选
通过数据库交叉比对,研究人员从570个马兜铃酸相关靶点和1410个UTUC相关靶点中,精确定位了97个两者共享的潜在关键靶点,提示这些靶点可能参与了AA诱导UTUC的病理过程。
2. GO和KEGG富集分析
对97个潜在靶点的功能富集分析揭示,它们显著富集于脂质代谢、外源性物质解毒、氧化还原酶活性等生物学过程,以及癌症相关通路(如PI3K-Akt信号通路)、细胞色素P450介导的药物代谢和细胞凋亡等关键通路。这提示AA可能通过扰乱细胞代谢、压力应答和生存死亡平衡来驱动肿瘤发生。
3. PPI网络构建与核心靶点鉴定
基于97个靶点构建的蛋白质相互作用网络具有高连接密度。通过多种拓扑学算法和交叉验证,最终鉴定出六个共识核心基因:CASP3、EGFR、PARP1、CYCS、PTGS2和HSP90AA1。它们在网络中处于枢纽地位,可能是AA发挥作用的关键节点。
4. 基于机器学习的核心基因筛选与模型可解释性
利用公开数据集GSE166716,研究人员通过嵌套交叉验证的随机森林模型对六个候选基因进行验证。模型显示出卓越的区分性能。稳定性分析进一步将核心基因锁定为五个:CASP3、EGFR、PARP1、PTGS2和HSP90AA1。SHAP分析表明,CASP3的高表达与“正常”类别相关,而PARP1和HSP90AA1的高表达则倾向于推动模型预测为“癌症”类别,这为这些基因在UTUC中的可能作用提供了计算层面的支持。
5. AA与核心靶点蛋白的分子对接
分子对接预测显示,马兜铃酸与五个核心靶点蛋白(CASP3、EGFR、PARP1、PTGS2、HSP90AA1)均具有较高的结合亲和力,其中与PTGS2(结合能为-9.3 kcal/mol)和EGFR(结合能为-8.2 kcal/mol)的结合最为稳定。详细的相互作用模式图展示了氢键、疏水相互作用等多种分子间作用力,从原子层面揭示了可能的结合机制。
6. AA与核心靶点蛋白的分子动力学模拟
以结合亲和力预测较高的AA-EGFR复合物为代表,进行了长达100纳秒的分子动力学模拟。结果显示,复合物的结构整体稳定,构象紧凑,溶剂可及表面积呈下降趋势,回转半径保持稳定,均方根偏差在平衡后波动较小。这些动力学指标共同证实了AA与EGFR在模拟时间尺度内能够形成稳定的复合物。自由能景观图揭示了复合物存在多个稳定的低能量构象状态。
7. AA-EGFR复合物的结合自由能计算
基于分子动力学模拟轨迹,采用MM/PBSA方法对AA-EGFR复合物的结合自由能进行了定量计算。结果显示,其结合自由能ΔGbind为-55.68 ± 1.00 kcal/mol,表明两者结合是一个高度自发的热力学过程。能量分解显示,强大的静电相互作用是结合的主要驱动力,尽管被极性溶剂化能抵消了大部分,但范德华力和非极性溶剂化贡献提供了重要的稳定作用。这从热力学角度为两者的强结合提供了定量证据。
研究结论与重要意义:
本研究通过整合网络毒理学、机器学习、分子对接与分子动力学模拟等多层次计算策略,首次系统描绘了马兜铃酸诱导上尿路尿路上皮癌的潜在多靶点致癌网络。研究不仅重申了马兜铃酸通过形成DNA加合物(基因毒性)这一经典致癌途径的核心地位,更重要的是,提出并提供了计算证据支持一个全新的协同机制假说:马兜铃酸或其代谢物可能像一把“特洛伊木马”,直接、高亲和力地结合并潜在调控EGFR、PTGS2、PARP1等关键信号蛋白,从而干扰细胞增殖、凋亡、DNA修复和炎症反应等核心通路。
这种直接的“非基因毒性”作用,可能与它造成的DNA损伤和突变(基因毒性)产生“协同放大”效应。例如,DNA损伤激活的生存信号可能因马兜铃酸对EGFR的直接作用而被进一步加强;凋亡执行蛋白CASP3被结合可能让受损细胞“逃过一死”,积累更多突变;与促炎酶PTGS2结合可能持续“煽风点火”,营造利于肿瘤生长的慢性炎症微环境。这种基因毒性与非基因毒性双管齐下的模式,可能更全面地解释了为何马兜铃酸相关的UTUC往往表现出更高的侵袭性。
该研究的结论具有重要的理论意义和潜在的转化价值。在理论上,它突破了将马兜铃酸致癌性仅归于DNA加合物的单一视角,为理解复杂致癌物的多模式作用机制提供了新的分析框架和假设。在应用上,所鉴定的核心靶点(如EGFR、PARP1、PTGS2)本身已是重要的抗癌药物靶点,这为开发针对马兜铃酸暴露人群的化学预防策略或联合治疗方案提供了新的线索和思路。当然,这些基于计算的发现仍需后续湿实验的严格验证,以最终确定马兜铃酸与这些蛋白的直接相互作用及其在致癌过程中的确切功能角色。这项研究犹如一幅精心绘制的“嫌犯关系网络图”,为后续的实验侦探们指明了深入调查的关键方向。