
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ProtSeqGen:一种用于蛋白质序列设计的新深度学习模型
《BMC Bioinformatics》:ProtSeqGen: a novel deep learning model for protein sequence design
【字体: 大 中 小 】 时间:2026年05月27日 来源:BMC Bioinformatics 3.3
编辑推荐:
摘要蛋白质反向折叠问题是指设计一种氨基酸序列,使其能够折叠成指定的骨架结构,这是从头蛋白质设计中的一个基本挑战。现有的计算方法,包括基于深度学习的方法,往往无法同时优化准确性、稳定性、效率以及在多种折叠结构下的泛化能力。在这里,我们提出了ProtSeqGen,这是一种通过多阶段图
蛋白质反向折叠问题是指设计一种氨基酸序列,使其能够折叠成指定的骨架结构,这是从头蛋白质设计中的一个基本挑战。现有的计算方法,包括基于深度学习的方法,往往无法同时优化准确性、稳定性、效率以及在多种折叠结构下的泛化能力。在这里,我们提出了ProtSeqGen,这是一种通过多阶段图基框架克服这些限制的深度学习模型。ProtSeqGen将蛋白质结构编码为局部几何图,使用消息传递神经网络明确模拟残基级别的相互作用,并通过多层感知器预测最优氨基酸序列。在CATH 4.2数据集上进行训练并在标准和具有挑战性的基准测试中进行评估后,ProtSeqGen在序列恢复方面优于许多最先进(SOTA)方法。它还为九种拓扑结构不同的蛋白质生成了准确且可设计的序列,展示了显著的泛化能力。这些结果证明了ProtSeqGen是解决蛋白质反向折叠问题的一个强大且可扩展的方案,推动了具有高结构精度的从头蛋白质设计。
蛋白质反向折叠问题是指设计一种氨基酸序列,使其能够折叠成指定的骨架结构,这是从头蛋白质设计中的一个基本挑战。现有的计算方法,包括基于深度学习的方法,往往无法同时优化准确性、稳定性、效率以及在多种折叠结构下的泛化能力。在这里,我们提出了ProtSeqGen,这是一种通过多阶段图基框架克服这些限制的深度学习模型。ProtSeqGen将蛋白质结构编码为局部几何图,使用消息传递神经网络明确模拟残基级别的相互作用,并通过多层感知器预测最优氨基酸序列。在CATH 4.2数据集上进行训练并在标准和具有挑战性的基准测试中进行评估后,ProtSeqGen在序列恢复方面优于许多最先进(SOTA)方法。它还为九种拓扑结构不同的蛋白质生成了准确且可设计的序列,展示了显著的泛化能力。这些结果证明了ProtSeqGen是解决蛋白质反向折叠问题的一个强大且可扩展的方案,推动了具有高结构精度的从头蛋白质设计。