
-
生物通官微
陪你抓住生命科技
跳动的脉搏
S8kPred:一种利用8000种三肽倾向性进行蛋白质二级结构预测的新方法
《Peptide Science》:S8kPred: A Novel Approach for Protein Secondary Structure Prediction Using 8000 Tripeptide Propensities
【字体: 大 中 小 】 时间:2026年03月28日 来源:Peptide Science 1.7
编辑推荐:
蛋白质二级结构预测通过分析8000个三肽的构象倾向性,结合机器学习模型(如XGBoost)实现高精度预测,在CB513验证集上Q3和Q8准确率分别达93%和88%,并开发了S8kPred在线工具。
准确预测蛋白质的二级结构对于可靠地预测其三级结构和设计肽序列至关重要。为此,已经提出了多种算法。多肽链中某个残基的构象受到其直接相邻残基的强烈影响。我们计算了20个残基在其第一个相邻残基存在下的构象倾向,共构成了8000个三肽。利用这8000个三肽变体的倾向值,我们提出了一种准确的二级结构预测方法。通过使用倾向值、位置特异性评分矩阵(PSSM)和氨基酸的二进制特征,构建了多种机器学习(ML)模型来预测三级结构(Q3)和八级结构(Q8)。结果表明,XGBoost机器学习模型在验证数据集CB513上实现了高达93%和88%的预测准确率。我们开发了一个名为S8kPred的预测程序。该工具以及基于共识的二级结构预测功能可在线访问:https://www.s8kpred.in。
作者声明没有利益冲突。
本研究中的原始贡献包含在文章的支持信息部分。如有进一步疑问,请联系相应作者。二级结构预测服务器的地址为:https://www.s8kpred.in/。网站上有详细的执行说明和帮助文档。相关脚本可在GitHub上找到:https://github.com/mayank2801/s8kpred。