贝叶斯神经网络在基因组预测中的应用:利用SHAP和GWAS进行不确定性量化与单核苷酸多态性(SNP)解读

《Theoretical and Applied Genetics》:Bayesian neural networks for genomic prediction: uncertainty quantification and SNP interpretation with SHAP and GWAS

【字体: 时间:2026年01月11日 来源:Theoretical and Applied Genetics 4.2

编辑推荐:

  本研究提出结合LASSO正则化的贝叶斯神经网络框架与GSMeSP可解释性工具,用于棉花基因组预测。在1385份样本、12,000个SNP数据下,模型预测准确率提升0.46-47.85%,并生成可信区间,同时GSMeSP识别出D亚基因组及D05染色体作为纤维性状相关热点。

  

摘要

核心观点

本研究提出了一种基于贝叶斯神经网络的框架,该框架结合了LASSO正则化方法和GSMeSP可解释性工具,实现了准确、具有不确定性意识且生物学上可解释的基因组预测。

摘要

深度学习在通过建模复杂的非线性基因型-表型关系来进行基因组预测方面具有巨大潜力。然而,其在植物育种中的应用受到模型可解释性有限以及缺乏不确定性量化的限制。为了解决这些挑战,我们开发了一种基于贝叶斯神经网络(BNNs)的框架,该框架采用了最小绝对值收缩与选择算子(LASSO)正则化方法,用于多性状基因组预测,并能够提供可信的不确定性估计。同时,我们引入了GSMeSP这一新型可解释性框架,该框架将SHapley加性解释(SHAP)技术与全基因组关联研究(GWAS)信号相结合,从统计和生物学角度对与性状相关的单核苷酸多态性(SNPs)进行优先排序。我们将这一框架应用于1385个陆地棉(Gossypium hirsutum)样本,这些样本共携带超过12,000个SNPs,评估了其在多个纤维相关性状上的预测性能。BNN模型在预测准确性方面始终优于传统方法和深度学习基准模型,准确率提高了0.46%至47.85%。此外,该模型还生成了特定于性状和样本的95%可信区间,从而实现了稳健的不确定性量化,并为更明智的选择决策提供了依据。利用GSMeSP,我们识别出了具有生物学意义的基因位点,其中大部分排名靠前的SNPs位于D亚基因组中。值得注意的是,D05染色体是一个基因组热点区域,其中富含与纤维长度、绒毛百分比和均匀性相关的SNPs。通过结合高预测性能、可信的不确定性估计以及生物学上有根据的可解释性,我们的框架为加速作物育种计划中的基因组选择提供了一种透明且稳健的深度学习方法。

核心观点

本研究提出了一种基于贝叶斯神经网络的框架,该框架结合了LASSO正则化方法和GSMeSP可解释性工具,实现了准确、具有不确定性意识且生物学上可解释的基因组预测。

摘要

深度学习在通过建模复杂的非线性基因型-表型关系来进行基因组预测方面具有巨大潜力。然而,其在植物育种中的应用受到模型可解释性有限以及缺乏不确定性量化的限制。为了解决这些挑战,我们开发了一种基于贝叶斯神经网络(BNNs)的框架,该框架采用了最小绝对值收缩与选择算子(LASSO)正则化方法,用于多性状基因组预测,并能够提供可信的不确定性估计。同时,我们引入了GSMeSP这一新型可解释性框架,该框架将SHapley加性解释(SHAP)技术与全基因组关联研究(GWAS)信号相结合,从统计和生物学角度对与性状相关的单核苷酸多态性(SNPs)进行优先排序。我们将这一框架应用于1385个陆地棉(Gossypium hirsutum)样本,这些样本共携带超过12,000个SNPs,评估了其在多个纤维相关性状上的预测性能。BNN模型在预测准确性方面始终优于传统方法和深度学习基准模型,准确率提高了0.46%至47.85%。此外,该模型还生成了特定于性状和样本的95%可信区间,从而实现了稳健的不确定性量化,并为更明智的选择决策提供了依据。利用GSMeSP,我们识别出了具有生物学意义的基因位点,其中大部分排名靠前的SNPs位于D亚基因组中。值得注意的是,D05染色体是一个基因组热点区域,其中富含与纤维长度、绒毛百分比和均匀性相关的SNPs。通过结合高预测性能、可信的不确定性估计以及生物学上有根据的可解释性,我们的框架为加速作物育种计划中的基因组选择提供了一种透明且稳健的深度学习方法。

相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号