《Journal of Advanced Research》:Machine learning, bioinformatics analysis and chemical screening streamline target validation by identifying RNA helicase as a druggable essential protein in tobacco mosaic virus
编辑推荐:
摘要:植物病毒每年造成超过300亿美元的经济损失,对全球粮食安全构成重大威胁,而快速发现可靠抗病毒靶标仍具挑战性。本研究采用整合机器学习驱动(MLD)方法、生物信息学及计算机(in silico)化学筛选的加速框架,快速预测植物病毒必需基因并验证新型抗病毒靶标
摘要:植物病毒每年造成超过300亿美元的经济损失,对全球粮食安全构成重大威胁,而快速发现可靠抗病毒靶标仍具挑战性。本研究采用整合机器学习驱动(MLD)方法、生物信息学及计算机(in silico)化学筛选的加速框架,快速预测植物病毒必需基因并验证新型抗病毒靶标。研究人员开发了MLD网络预测工具Vgep用于预测病毒必需基因;随后通过系统发生、结构及靶标相似性(target-likeness)分析评估其编码必需蛋白的可靶性;最终采用计算机虚拟筛选、生物活性评价、病毒形态观察、基因表达分析及分子模拟鉴定化学探针以评估该必需蛋白的可药性(druggability)。利用所建Vgep工具预测病毒必需基因,鉴定出烟草花叶病毒属(Tobamovirus)中病毒解旋酶(viral helicase)为关键靶标,该解旋酶显示高度保守性且与已确立抗病毒靶标相似。经虚拟筛选获得的化学探针Amidoca与烟草花叶病毒(Tobacco mosaic virus,TMV)解旋酶结合亲和力强(Kd=4.59 μM)。抗病毒生物测定中Amidoca优于利巴韦林(Ribavirin),失活、治疗和保护作用的EC50分别为155.85 mg/L、244.32 mg/L和344.59 mg/L,证实了烟草花叶病毒属解旋酶的可药性。机制研究表明Amidoca可能竞争性结合解旋酶NTP结合位点,干扰双链RNA(dsRNA)解旋所需能量释放,使解旋酶积累量降低近95%。本研究建立了植物病毒疗法下一代靶标快速发现与验证的系统框架,突出RNA解旋酶作为有前景的抗病毒候选靶标,推进抗病毒制剂开发。
论文解读:机器学习、生物信息学分析与化学筛选通过鉴定烟草花叶病毒RNA解旋酶为可成药必需蛋白加速靶标验证
该研究由Yawen Dong、Danxia Wu、Ji-Yun Zhang、Guangyi Huang、Juan Huang、Vinit Kumar、Wenbo Guo、Dongyu Chen、Abdallah S. Ali、Rasha H. Ahmed、Rosa Lozano-Durán、Daohong Gong、Biaobiao Jiang、Xiangyang Li、Feng-Biao Guo及Ge-Fei Hao共同完成,发表于《Journal of Advanced Research》。
研究背景与目的
植物病毒判决性侵染所致病害占新发病原体的30%~50%,年经济损失逾300亿美元,严重影响水稻、小麦、玉米及蔬菜等作物产量。传统防控手段(无毒种苗、轮作、卫生管理及媒介防治)对已进入植株体内的病毒效果有限,直接化学抗病毒剂稀缺。理想抗病毒靶标应为病毒生命周期中高度保守且功能必需的蛋白(如外壳蛋白CP、运动蛋白MP、RNA依赖RNA聚合酶RdRp催化域及蛋白酶等),但目前可靠且可成药的植物病毒靶标十分匮乏,高通量系统性鉴定病毒必需基因(Essential Gene,EG)仍是瓶颈——传统反向遗传学与转座子诱变费时费力且难应用于专性植物病毒。虽有Deleat、DeepPEP等机器学习工具可预测微生物必需基因,但跨物种预测效能欠佳。因此,本研究旨在建立融合机器学习驱动(Machine Learning-Driven,MLD)预测、生物信息学分析和计算机(in silico)化学筛选的集成框架,快速识别植物病毒必需基因并验证其作为抗病毒靶标的可药性,并以烟草花叶病毒属(Tobamovirus genus,含 Tobacco mosaic virus,TMV)为概念验证对象。
主要关键技术方法
研究人员从DEG数据库获取37种原核生物必需/非必需基因构建训练集,开发集成规则模型(Rule-Based model,RB model,基于互逆最佳匹配Reciprocal Best Hits及组成向量Composition Vector法计算进化距离加权正交映射)与支持向量机(Support Vector Machine,SVM)含径向基核函数(Radial Basis Function kernel,RBF-kernel)的机器学习模型的Vgep网络工具,并用OGEE数据库6种原核生物独立数据集以AUROC和AUPRC评估性能并与Deleat、DeepPEP比较。收集NCBI中36种烟草花叶病毒属病毒180条基因序列(编码甲基转移酶MT、解旋酶Hel、RdRp催化域、MP及CP)输入Vgep获必需性评分,用R/Python做统计检验。对预测高分必需蛋白——病毒解旋酶,做Pfam HMM和NCBI CDD结构域验证、MEGA多重序列比对、MEME基序分析、IQ-TREE最大似然(Maximum Likelihood,ML)系统树及MEGA计算dN/dS(非同义/同义替换比);用AlphaFold预测三维结构、MOE叠合、ConSurf做残基保守性分析;用Therapeutic Target Database(TTD)已知靶标蛋白通过RePast(结构坐标三边测量相似性)和Retest(一级结构特征)描述符及UMAP降维评估靶标相似性(target-likeness)。以ToMV-Hel(PDB ID: 3VKW)为受体用AutoDock Vina初筛ZINC数据库农药类似物过滤后,取前20%进行7款对接软件共识对接(Consensus Docking)及聚类获苗头化合物。原核表达纯化TMV-Hel用微尺度热泳(MicroScale Thermophoresis,MST)测结合常数Kd ;用本氏烟草(Nicotiana benthamiana)半叶枯斑法测Amidoca及Ribavirin对TMV的失活(inactivation)、治疗(curative)和保护(protective)EC50 ;透射电镜(Transmission Electron Microscopy,TEM)观察病毒形态;qPCR检测TMV-Hel转录水平;PyMol分析对接结合模式。
研究结果
Development of the Vgep tool to predict virus gene essentiality(病毒基因必需性预测工具Vgep的开发)
Vgep整合RB模型(进化距离加权正交映射打分)与SVM-RBF模型(基因序列寡核苷酸频率特征),两模型等权综合输出0~1必需性评分(≥0.2提示预测为必需基因)。在6种原核生物独立测试集上AUROC达0.910、AUPRC为0.715;相比Deleat(AUPRC 0.642)与DeepPEP(AUPRC 0.648),Vgep在不平衡数据集上AUPRC显著更高(0.729),表明跨物种必需基因预测尤其是少数类(必需基因)识别能力更优。Vgep已部署为Web服务器(https://gepa.org.cn/Vgep/index.php ),接受FASTA格式输入并输出评分及可下载结果。
Characterization of the tobamoviral helicase essentiality and targetability(烟草花叶病毒属解旋酶必需性与可靶性表征)
将36种Tobamovirus的180条基因输入Vgep,解旋酶编码基因在所有物种中均被预测为必需;统计学检验显示解旋酶必需性评分中位数(M=0.679)高于运动蛋白(M=0.551)且RdRp催化域评分显著更低(p<0.001)。系统发生树所有种聚为支持度高(bootstrap>80%)的单系群;dN/dS<1指示受负选择(高度保守)。AlphaFold预测36种解旋酶三维结构RMSD<2 ?,NTP结合口袋体积658.24 ?3 、柔性28.46、密度6.05、极性表面积27.78 ?2 ,与TTD已知药物靶标结合口袋特征分布重合;ConSurf显示NTP结合腔核心残基(如Thr1046、Arg868)完全保守。综上病毒解旋酶具高度序列/结构保守性及与已知药物靶相似的靶标相似性,是可成药的抗病毒候选靶。
Evaluation of viral helicase druggability using the chemical probe Amidoca(用化学探针Amidoca评估病毒解旋酶可药性)
以ToMV-Hel为模板共识对接筛选ZINC数据库获10个苗头化合物,微尺度热泳测得Amidoca与TMV-Hel结合Kd =4.59 μM为最强。半叶法测定Amidoca对TMV的失活EC50 =155.85 mg/L、治疗EC50 =244.32 mg/L、保护EC50 =344.59 mg/L,均优于阳性对照Ribavirin(分别约218、389、488 mg/L)。TMV-GFP侵染本氏烟草后Amidoca处理组荧光信号(病毒复制扩散)明显弱于Ribavirin及缓冲液对照组;熊蜂(Bombus terrestris)经口LD50 >11 μg/bee,斑马鱼(Danio rerio)10 mg/L暴露96 h死亡率6.7%,均低于Ribavirin,显示较低非靶标毒性。证明Amidoca可作化学探针确认烟草花叶病毒属解旋酶具可药性。
Amidoca targets viral helicase to combat plant viruses(Amidoca靶向病毒解旋酶抗植物病毒的作用机制)
TEM显示Amidoca处理后TMV颗粒数量锐减且多见~100 nm片段化(Ribavirin组多为完整~200 nm颗粒)。qPCR示Amidoca处理感染植株TMV-Hel相对表达量降至对照的约5%(Ribavirin组约60%)。对接预测Amidoca占据ToMV-Hel的NTP结合位点:咪唑部分与Mg2+ 形成阳离子-π相互作用并与Val834、Lys839形成氢键,咪唑羰基氧与Lys841、Thr840形成氢键,脲氮与Arg968形成氢键,苯环与Thr1046形成H-π相互作用,从而竞争性阻断ATP水解及dsRNA解旋所需能量供给,抑制病毒复制致解旋酶蛋白积累大幅下降。序列与结构比对显示本氏烟草宿主解旋酶与ToMV-Hel相似度仅14.3%、NTP区RMSD达24.309 ?,Amidoca不形成稳定结合且无植物生长抑制,提示选择性好、脱靶风险低。
讨论与结论翻译
结论:本研究结合MLD方法、生物信息学分析和化学筛选鉴定植物病毒必需基因并验证解旋酶为具前景的抗病毒靶标。研究人员开发了病毒必需基因预测MLD网络工具Vgep(
https://gepa.org.cn/Vgep/index.php ),该工具突出TMV中解旋基因为关键基因;后续分析证实其高度序列和结构保守性及与已确立可成药蛋白特征相符。虚拟筛选发现强效小分子探针Amidoca与TMV-Hel强结合(K
d =4.59 μM)且抗病毒活性优于基准化合物Ribavirin;Amidoca处理感染TMV的本氏烟草降低病毒积累并引起明显病毒片段化。预测结合模式表明Amidoca竞争性作用于解旋酶NTP结合口袋(阳离子-π、氢键及H-π相互作用),最终干扰dsRNA解旋所需能量从而阻碍病毒复制。这些发现不仅确证解旋酶为可成药病毒蛋白,也确立Amidoca为控制植物病毒病害的有前景候选分子。本工作提供了更广泛、快速、系统的植物病毒靶标发现与验证途径,对可持续农业具重要意义。该框架可拓展用于其他植物病原及与CRISPR-Cas等技术整合以创制持久抗病品种,助力全球粮食安全。