
-
生物通官微
陪你抓住生命科技
跳动的脉搏
PyMSQ:一个Python软件包,用于快速进行孟德尔抽样(共)方差分析以及基于单倍型的基因组选择相似性分析
《BMC Bioinformatics》:PyMSQ: a Python package for fast Mendelian sampling (co)variance and haplotype-based similarity in genomic selection
【字体: 大 中 小 】 时间:2026年02月24日 来源:BMC Bioinformatics 3.3
编辑推荐:
基因组选择虽能快速提升遗传增益,但长期应用易导致单倍型多样性下降和近交增加。为此,PyMSQ包通过矩阵方法计算Mendelian sampling方差(MSV)和协方差(MSC),并引入基于共享杂合片段的单倍型相似性度量,有效缓解遗传多样性损失。该工具利用优化库实现332倍于现有工具gamevar的计算效率,同时保持数值精度。在荷斯坦-弗里森牛数据验证中,其新相似性度量可补充传统亲缘矩阵,为平衡即时遗传增益与长期多样性保护提供新方法。PyMSQ已以MIT协议开源(https://github.com/aromemusa/PyMSQ)。
虽然基因组选择通过利用密集的标记数据来计算基因组估计育种值(GEBVs)从而实现快速的遗传增益,但长期应用可能会降低单倍型多样性并增加近亲繁殖。为了解决这些风险,最近的研究表明,基于孟德尔抽样方差(MSV)和协方差(MSC)进行选择可以通过利用GEBVs无法捕捉到的家族内(共)分离现象来部分缓解遗传变异的丧失。与此同时,理论上的进展引入了一种基于单倍型的相似性度量方法,该方法针对共享的杂合片段,从而能够更直接地控制单倍型多样性,既可以单独使用,也可以与传统的基于共同祖先关系和基因组关系的矩阵结合使用。
我们推出了开源的Python包PyMSQ,用于估计与孟德尔抽样相关的量。该包实现了两个关键发展:(1)一种基于矩阵的方法,用于在单性状、多性状和合子背景下计算MSV和MSC;(2)一种基于单倍型的相似性矩阵,用于比较父母本之间的孟德尔抽样特征。通过将这种基于矩阵的框架与优化的科学库相结合,PyMSQ的计算速度比公开可用的替代工具gamevar快了332倍,同时保持了数值准确性。利用荷斯坦-弗里斯安牛的数据集,我们展示了PyMSQ在计算MSV和MSC方面的有效性,以及其新颖的相似性度量方法。这种方法通过明确量化共享的杂合片段而非整体等位基因共享情况,补充了标准的基因组关系矩阵,从而为平衡即时收益与长期多样性提供了额外的见解。
PyMSQ通过促进MSV、MSC和基于单倍型的相似性度量的实际应用,使育种者和数量遗传学家能够采用单倍型多样性约束,无论是作为独立标准还是与最优贡献选择相结合使用。这一框架为保护关键单倍型片段开辟了新的可能性,最终支持更可持续的基因组选择策略。PyMSQ根据MIT许可证免费提供,网址为https://github.com/aromemusa/PyMSQ。
生物通微信公众号
知名企业招聘