《New Biotechnology》:Zero-shot Deep Learning with Multi-Objective Optimization Improves Thermostability of Zearalenone Hydrolase and Xylanase
编辑推荐:
本研究针对工业酶热稳定性改造中活性与稳定性难以兼顾的挑战,创新性地整合了基于结构的ABACUS-R模型与基于序列的MSA Transformer,通过马尔可夫链蒙特卡洛多目标优化策略,成功实现了玉米赤霉烯酮水解酶(RmZHD)和木聚糖酶的热稳定性零样本设计。实验验证显示,设计出的六点突变体在保持>95%野生型活性的同时,熔解温度提升约8°C,半衰期延长9-15倍,为工业酶理性设计提供了新范式。
在生物制造领域,工业酶犹如高效运转的分子机器,但其在实际应用中常面临高温环境的严峻考验。就像精密仪器在极端条件下容易失灵,许多天然酶在高温下会迅速失活,导致生产效率大打折扣。提高酶的热稳定性因此成为生物催化领域的"圣杯",然而传统方法往往陷入"按下葫芦浮起瓢"的困境——增强稳定性的同时常以牺牲酶活性为代价。这种权衡困境在需要引入多位点突变时尤为突出,因为实验筛选工作量会随突变数量指数级增长。
目前主流计算策略分为两大阵营:基于结构的模型(如ABACUS-R)擅长优化蛋白质折叠自由能,能显著提升热稳定性,但常导致活性急剧下降;而基于序列的模型(如ProGen2、MSA Transformer)虽能较好保持活性,却在热稳定性优化上表现乏力。这种"单腿走路"的局限性使得零样本(即不依赖特定实验数据)设计兼具高稳定性和高活性的多位点突变体仍是巨大挑战。
这项发表于《New Biotechnology》的研究另辟蹊径,以降解霉菌毒素的玉米赤霉烯酮水解酶(RmZHD)和降解植物细胞壁的木聚糖酶为模型,构建了融合结构与进化信息的双引擎优化策略。研究团队创新性地将结构基础的ABACUS-R与序列基础的MSA Transformer通过马尔可夫链蒙特卡洛(MCMC)采样进行多目标优化,在虚拟序列空间中智能搜寻能同时满足稳定性与活性要求的突变组合。
关键技术方法包括:利用ABACUS-R进行结构基础的序列设计与评分,采用MSA Transformer评估进化合理性,通过MCMC实现多目标优化采样,并通过圆二色谱(CD)、差示扫描量热法(DSC)等实验验证热稳定性提升效果。
3.1. 单一模型优化的局限性
研究首先验证了单一模型的缺陷:纯ABACUS-R设计的RmZHD突变体(16-29个突变)全部失活,木聚糖酶突变体仅存15-17%活性。虽然单点突变分析显示59%突变体活性保留90%以上,但多位点组合产生协同负面效应。而经酶家族特异性微调的ProGen2模型虽与单点突变活性呈正相关(r=0.54),但其评分系统过度保守,几乎将所有突变评为劣于野生型,无法指导序列优化。
3.2. 多目标优化的突破性成果
研究团队转而采用MSA Transformer替代ProGen2,因其能识别大量优于野生型的单点突变。通过MCMC多目标优化,他们发现六点突变是实现活性与稳定性平衡的最佳阈值。设计的五个RmZHD六点突变体(RmZHD_6_1~6_5)活性保持85-100%,60°C处理5分钟后残存活性达51.8-90.2%(野生型完全失活)。其中RmZHD_6_4的熔解温度(Tm)提升8.1°C,60°C半衰期延长9倍。木聚糖酶六点突变体同样表现优异,Xylanase_6_1在40°C半衰期延长15倍,Tm提升8.8°C,且活性保持>95%。
突变收敛性与机理分析
值得关注的是,独立MCMC运行产生的突变体在关键位点呈现显著重叠,表明优化过程收敛于有限的优势突变组合。结构分析揭示了稳定性提升的分子基础:如RmZHD的L139K突变与D136形成新盐桥,N156L突变使疏水环境更匹配;木聚糖酶的R108P优化环区构象,A131D与K184形成氢键网络。这些协同作用共同强化了蛋白质结构。
该研究成功演示了融合结构与进化信息的深度学习策略在酶工程中的强大潜力。通过精准平衡多位点突变对稳定性与活性的影响,实现了近乎零实验成本的理性设计。特别值得注意的是,该方法对同源序列数量有限的酶(如RmZHD仅149条同源序列)仍具适用性,突破了传统MSA方法对大数据量的依赖。这项技术为工业酶的高效设计提供了新范式,有望显著加速生物制造过程的优化升级。未来,整合功能相关结构信息(如底物结合构象)的模型将进一步拓展零样本设计的应用边界。