
-
生物通官微
陪你抓住生命科技
跳动的脉搏
lcUMAPtSNE:将非线性降维技术与基因型概率相结合的应用
《BMC Genomics》:lcUMAPtSNE: use of non-linear dimensionality reduction techniques with genotype likelihoods
【字体: 大 中 小 】 时间:2026年05月20日 来源:BMC Genomics 3.7
编辑推荐:
摘要背景了解种群结构对于保护遗传学至关重要,因为它可以提供关于种群连通性的见解,并有助于制定保护遗传多样性和适应性的策略。T分布随机邻居嵌入(t-SNE)和均匀流形近似与投影(UMAP)已被证明在使用明确基因型的情况下有效揭示人类和模式生物的种群遗传结构,但它们在利用低覆盖度测序
了解种群结构对于保护遗传学至关重要,因为它可以提供关于种群连通性的见解,并有助于制定保护遗传多样性和适应性的策略。T分布随机邻居嵌入(t-SNE)和均匀流形近似与投影(UMAP)已被证明在使用明确基因型的情况下有效揭示人类和模式生物的种群遗传结构,但它们在利用低覆盖度测序得到的基因型似然值(作为一种成本节约措施)来研究野生物种中的应用仍较少。
在这里,我们介绍了一个基于Jupyter Notebook的工作流程,该流程便于在由基因型似然值派生的主成分上使用UMAP和t-SNE。该流程使用来自重新引入野外的弯角剑羚的中等至低覆盖度全基因组测序数据进行了演示,这种动物面临着多种保护挑战。
我们还提供了关于超参数调整和实际实现的详细指导,从而增强了这些方法在野生动物遗传学中的应用,有望支持生物多样性保护。lcUMAPtSNE被设计为一个补充性和探索性的降维工具,而不是替代或基准测试框架,其优势在这里通过实证数据得到了证明。
了解种群结构对于保护遗传学至关重要,因为它可以提供关于种群连通性的见解,并有助于制定保护遗传多样性和适应性的策略。T分布随机邻居嵌入(t-SNE)和均匀流形近似与投影(UMAP)已被证明在使用明确基因型的情况下有效揭示人类和模式生物的种群遗传结构,但它们在利用低覆盖度测序得到的基因型似然值(作为一种成本节约措施)来研究野生物种中的应用仍较少。
在这里,我们介绍了一个基于Jupyter Notebook的工作流程,该流程便于在由基因型似然值派生的主成分上使用UMAP和t-SNE。该流程使用来自重新引入野外的弯角剑羚的中等至低覆盖度全基因组测序数据进行了演示,这种动物面临着多种保护挑战。
我们还提供了关于超参数调整和实际实现的详细指导,从而增强了这些方法在野生动物遗传学中的应用,有望支持生物多样性保护。lcUMAPtSNE被设计为一个补充性和探索性的降维工具,而不是替代或基准测试框架,其优势在这里通过实证数据得到了证明。
生物通微信公众号