S8kPred:一种利用8000种三肽倾向性进行蛋白质二级结构预测的新方法

《Peptide Science》:S8kPred: A Novel Approach for Protein Secondary Structure Prediction Using 8000 Tripeptide Propensities

【字体: 时间:2026年03月28日 来源:Peptide Science 1.7

编辑推荐:

  蛋白质二级结构预测通过分析8000个三肽的构象倾向性,结合机器学习模型(如XGBoost)实现高精度预测,在CB513验证集上Q3和Q8准确率分别达93%和88%,并开发了S8kPred在线工具。

  

摘要

准确预测蛋白质的二级结构对于可靠地预测其三级结构和设计肽序列至关重要。为此,已经提出了多种算法。多肽链中某个残基的构象受到其直接相邻残基的强烈影响。我们计算了20个残基在其第一个相邻残基存在下的构象倾向,共构成了8000个三肽。利用这8000个三肽变体的倾向值,我们提出了一种准确的二级结构预测方法。通过使用倾向值、位置特异性评分矩阵(PSSM)和氨基酸的二进制特征,构建了多种机器学习(ML)模型来预测三级结构(Q3)和八级结构(Q8)。结果表明,XGBoost机器学习模型在验证数据集CB513上实现了高达93%和88%的预测准确率。我们开发了一个名为S8kPred的预测程序。该工具以及基于共识的二级结构预测功能可在线访问:https://www.s8kpred.in

图形摘要

蛋白质的二级结构受到邻近残基的显著影响。通过分析8000个三肽的构象倾向,我们开发了一种基于机器学习的预测器。XGBoost模型在CB513数据集上达到了93%(Q3)和88%(Q8)的高准确率,从而实现了S8kPred网络服务器,用于提供可靠且基于共识的二级结构预测。

利益冲突

作者声明没有利益冲突。

数据可用性声明

本研究中的原始贡献包含在文章的支持信息部分。如有进一步疑问,请联系相应作者。二级结构预测服务器的地址为:https://www.s8kpred.in/。网站上有详细的执行说明和帮助文档。相关脚本可在GitHub上找到:https://github.com/mayank2801/s8kpred

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号