用于从头蛋白质设计的重折叠流程的局限性

《Protein Science》:Limitations of the refolding pipeline for de novo protein design

【字体: 时间:2026年05月07日 来源:Protein Science 5.2

编辑推荐:

   摘要 随着基于深度学习的强大工具的出现,计算蛋白质设计已成为一项广泛可用的技术。如今,可以在几分钟内完成序列设计和结构设计,这使得这项技术对更广泛的科学界具有吸引力。在蛋白质设计研究中,最常用的模拟策略之

  

摘要

随着基于深度学习的强大工具的出现,计算蛋白质设计已成为一项广泛可用的技术。如今,可以在几分钟内完成序列设计和结构设计,这使得这项技术对更广泛的科学界具有吸引力。在蛋白质设计研究中,最常用的模拟策略之一是所谓的自我一致性(或重折叠)流程,用于评估序列编码目标结构的效果。在这种方法中,使用结构预测模型来重折叠设计好的序列,以探究其是否与预期结构兼容,并通过两个与实验成功度相关的指标进行评估:预测结构的置信度得分(预测的局部距离差异测试)以及自我一致性均方根偏差,该偏差衡量重折叠结构与目标结构的匹配程度。在这项工作中,我们系统地评估了不同模型和结构预测设置对这些指标的影响,以及它们在多大程度上可以可靠地筛选出合适的序列设计候选者。我们发现,进化信息会掩盖折叠模型评估序列-结构兼容性的能力,从而降低重折叠指标对实验成功度的预测性能,尤其是对于与天然序列具有同源性的设计。此外,我们还指出了重折叠指标的局限性,包括它们对结构特征(如灵活性)的敏感性。我们的研究结果提醒人们注意基于重折叠的评估方法中可能存在的陷阱,并支持在蛋白质设计研究中更加明智地使用这些指标。

利益冲突声明

作者声明没有利益冲突。

数据可用性声明

所有插图的源代码和数据均可在以下链接获取:https://github.com/kt-korbeld/Limitations-refolding-pipeline-data。稳定版本可在此链接获取:https://doi.org/10.5281/zenodo.18838498

相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号