《Computational Biology and Chemistry》:Attention-Enhanced CNN–BiLSTM Models for Predicting Luteinizing Hormone Sequence Variations
编辑推荐:
D. Kalyani | Vimala Devi | A.M. Arunnagiri
生物医学工程系,工程学院,Guindy,Anna大学,CEG,金奈,泰米尔纳德邦
摘要
黄体生成素(LH)在调节生殖功能中起着关键作用,其氨基酸序列的变化会深刻影响激素活性。蛋白质序列的变异
D. Kalyani | Vimala Devi | A.M. Arunnagiri
生物医学工程系,工程学院,Guindy,Anna大学,CEG,金奈,泰米尔纳德邦
摘要
黄体生成素(LH)在调节生殖功能中起着关键作用,其氨基酸序列的变化会深刻影响激素活性。蛋白质序列的变异对于理解激素失衡及相关生殖疾病至关重要。在本研究中,我们提出了一个基于深度学习的计算框架,利用蛋白质序列数据预测LH序列的变化。在模型开发之前,对蛋白质序列进行了预处理、数字化编码和平衡处理。分别实现了卷积神经网络(CNN)和双向长短期记忆(BiLSTM)等深度学习模型,并将其与混合注意力增强架构进行了比较,最终提出了CNN + Attention + BiLSTM模型。通过分层训练、验证和测试的分割进行实验评估,发现CNN模型的测试准确率为86.07%,而BiLSTM网络的性能提升到了91.47%,这突显了建模序列依赖性的重要性。值得注意的是,所提出的CNN + Attention + BiLSTM模型的测试准确率和验证准确率分别达到了99.42%和99.60%,同时具有近乎完美的精确度(0.995)、召回率(0.99)和F1分数(0.995)。这项研究验证了基于注意力的混合深度学习架构在预测LH序列变化方面的有效性,为识别新的蛋白质生物标志物和提升生殖健康诊断能力提供了一种有前景的方法。
部分片段
引言
计算生物学的最新进展显著改变了蛋白质序列分析的方法,使得能够从蛋白质的一级结构(包括氨基酸序列)高效预测其结构和功能特征(Ali等人,2025年;Lilhore等人,2024年)。蛋白质在细胞过程中起着关键作用,其序列的变化以及残基间的分子相互作用会导致疾病状态下的功能异常(Cui等人,2025年)。
方法
本研究的整体工作流程,包括数据收集、模型开发、训练、测试和评估,如图1所示。
结果与讨论
利用深度学习架构(CNN、BiLSTM和基于注意力的CNN-BiLSTM)研究了导致女性激素失衡的LH蛋白质序列的变化及其变体,并对其性能进行了比较和分析。
结论与未来工作
本研究提出了一种基于注意力的深度学习框架,用于预测黄体生成素(LH)序列的变化,测试准确率达到99.7%,精确度、召回率和F1分数均接近完美。注意力机制通过突出关键氨基酸残基增强了模型的可解释性,而混合架构的表现优于单独的CNN或BiLSTM模型。这些结果展示了基于注意力的深度学习在计算生物学中的潜力。
资助声明
本研究未获得公共部门、商业部门或非营利组织的任何特定资助。
未引用的参考文献
(Jain等人,2009年;Rahman等人,2022年)
伦理声明
本研究未涉及人类参与者、动物实验或临床数据,因此无需伦理批准。
CRediT作者贡献声明
Durai Kalyani: 概念构建、数据整理、研究、方法论设计、监督、初稿撰写。Vimala Devi: 数据整理、软件使用、资源协调、可视化处理、正式分析。Arunnagiri AM: 研究实施、验证、修订及编辑。
声明创作过程中使用的生成式AI和AI辅助技术
在准备本文的过程中,作者使用了Python、Jupyter Notebook、TensorFlow/Keras和Canva等计算和AI辅助工具,以提高手稿的清晰度、准确性和整体质量,并支持数据分析、模型开发、可视化和展示。使用这些工具/服务后,作者对内容进行了必要的审查和编辑,并对发表文章的内容负全责。
利益冲突声明
作者声明没有已知的财务利益或个人关系可能影响本文的报告内容。
致谢
我们感谢印度泰米尔纳德邦金奈Anna大学生物医学工程系的G. Kavitha教授。同时,我们也衷心感谢Anna大学生物医学工程系生物化学实验室的Sreeja B.S副教授提供的实验室设施和技术支持,这些对于完成本项工作至关重要。
声明创作过程中使用的AI技术
作者声明在撰写过程中未使用任何可能影响研究结果的AI技术。