
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在CHEBI中定义肽
《Journal of Cheminformatics》:Defining peptides in ChEBI
【字体: 大 中 小 】 时间:2026年05月04日 来源:Journal of Cheminformatics 5.7
编辑推荐:
摘要现代生物化学产生了大量的化学知识。诸如“生物相关化学实体”(ChEBI)这样的本体论可以帮助组织这些知识。然而,仅依靠手动分类,本体论无法跟上其领域的发展速度。在这项工作中,我们提出了一种新的分类体系,涵盖了与肽相关的67个类别,肽是ChEBI中的一个重要分支,包含近15,0
现代生物化学产生了大量的化学知识。诸如“生物相关化学实体”(ChEBI)这样的本体论可以帮助组织这些知识。然而,仅依靠手动分类,本体论无法跟上其领域的发展速度。在这项工作中,我们提出了一种新的分类体系,涵盖了与肽相关的67个类别,肽是ChEBI中的一个重要分支,包含近15,000种化合物。ChEBI中现有的自然语言定义得到了扩展和更精确的规范。这些自然语言定义还附有基于一元二阶逻辑(MSOL)的逻辑公理化表述。为了利用这种公理化进行自动化分类,我们开发了一种方法论,该方法首先将一元二阶定义转化为部分一阶定义,最终实现算法分类。这结合了本体论定义的三个重要方面:它们反映了专家的意见,表述清晰无误,并且可以自动验证。在我们的评估中,我们将我们的分类结果与ChEBI当前的分类体系进行了比较,发现了ChEBI中可能存在的一些不一致之处,以及可以从自动化扩展中受益的领域。我们还在专家调查中评估了这些自然语言定义的有效性。
科学贡献:本研究为ChEBI现有的14个类别以及53个新的与肽相关的类别提供了精确的自然语言定义。这些定义采用MSOL形式化,并配备了高效的实现机制,能够进行大规模分子分类,包括对ChEBI和PubChem数据的全面分类。
现代生物化学产生了大量的化学知识。诸如“生物相关化学实体”(ChEBI)这样的本体论可以帮助组织这些知识。然而,仅依靠手动分类,本体论无法跟上其领域的发展速度。在这项工作中,我们提出了一种新的分类体系,涵盖了与肽相关的67个类别,肽是ChEBI中的一个重要分支,包含近15,000种化合物。ChEBI中现有的自然语言定义得到了扩展和更精确的规范。这些自然语言定义还附有基于一元二阶逻辑(MSOL)的逻辑公理化表述。为了利用这种公理化进行自动化分类,我们开发了一种方法论,该方法首先将一元二阶定义转化为部分一阶定义,最终实现算法分类。这结合了本体论定义的三个重要方面:它们反映了专家的意见,表述清晰无误,并且可以自动验证。在我们的评估中,我们将我们的分类结果与ChEBI当前的分类体系进行了比较,发现了ChEBI中可能存在的一些不一致之处,以及可以从自动化扩展中受益的领域。我们还在专家调查中评估了这些自然语言定义的有效性。
科学贡献:本研究为ChEBI现有的14个类别以及53个新的与肽相关的类别提供了精确的自然语言定义。这些定义采用MSOL形式化,并配备了高效的实现机制,能够进行大规模分子分类,包括对ChEBI和PubChem数据的全面分类。
生物通微信公众号