
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一个涵盖生命之树中同源和非同源等效功能酶的综合性数据集
《BMC Research Notes》:A comprehensive dataset of homologous and non-homologous isofunctional enzymes across the tree of life
【字体: 大 中 小 】 时间:2026年02月26日 来源:BMC Research Notes 1.7
编辑推荐:
本研究构建了包含非同源等功酶(NISE)和同源等功酶(HISE)的大型数据库,整合UniProtKB 2025_01版本中200,000条Swiss-Prot和27,000,000条TrEMBL条目,通过EC编号和SCOP结构注释进行分类,揭示分子收敛与分化规律,为代谢进化、功能冗余及药物靶点研究提供基础。
趋同进化,即相似特征的独立出现,越来越多地被认为是塑造分子和代谢多样性的一个普遍力量。在分子层面上,趋同的一个显著表现是非同源同功能酶(NISE)——这些酶是不同的蛋白质,没有可检测到的共同祖先,但能够催化相同的生化反应。尽管它们在概念上和实践上都非常重要,NISE往往被视为特例,目前还没有一个大规模、系统整理的资源来探索它们在所有生命领域中的分布和特性。
在这里,我们提供了一个经过整理的同源和非同源同功能酶(HISE和NISE)数据集,该数据集来源于UniProtKB 2025_01版本,包括经过审查的(Swiss-Prot)和未经审查的(TrEMBL)条目。我们使用酶委员会(EC)编号来定义催化等价性,并利用SUPERFAMILY(SCOP结构超家族)注释来推断进化关系,从而实现了一个透明且可重复的流程,将酶分类为同源和非同源的功能组。该数据集包含超过200,000个Swiss-Prot酶和2700万个TrEMBL酶,这些酶都配备了完整的EC和SUPERFAMILY注释,并按生命域、酶类和结构域组成进行了组织。提供了多种输出文件,包括存在/缺失矩阵、聚类酶组、系统发育树以及完整的注释表,以方便后续的进化、功能和比较分析。这一资源提供了关于酶功能分子趋同和分化的全球视角,突显了NISE在各种分类单元和酶类中的广泛存在。它为研究代谢进化、功能冗余、药物靶点发现以及塑造生化解决方案的进化约束提供了基础。
趋同进化,即相似特征的独立出现,越来越多地被认为是塑造分子和代谢多样性的一个普遍力量。在分子层面上,趋同的一个显著表现是非同源同功能酶(NISE)——这些酶是不同的蛋白质,没有可检测到的共同祖先,但能够催化相同的生化反应。尽管它们在概念上和实践上都非常重要,NISE往往被视为特例,目前还没有一个大规模、系统整理的资源来探索它们在所有生命领域中的分布和特性。
在这里,我们提供了一个经过整理的同源和非同源同功能酶(HISE和NISE)数据集,该数据集来源于UniProtKB 2025_01版本,包括经过审查的(Swiss-Prot)和未经审查的(TrEMBL)条目。我们使用酶委员会(EC)编号来定义催化等价性,并利用SUPERFAMILY(SCOP结构超家族)注释来推断进化关系,从而实现了一个透明且可重复的流程,将酶分类为同源和非同源的功能组。该数据集包含超过200,000个Swiss-Prot酶和2700万个TrEMBL酶,这些酶都配备了完整的EC和SUPERFAMILY注释,并按生命域、酶类和结构域组成进行了组织。提供了多种输出文件,包括存在/缺失矩阵、聚类酶组、系统发育树以及完整的注释表,以方便后续的进化、功能和比较分析。这一资源提供了关于酶功能分子趋同和分化的全球视角,突显了NISE在各种分类单元和酶类中的广泛存在。它为研究代谢进化、功能冗余、药物靶点发现以及塑造生化解决方案的进化约束提供了基础。