ProHistoneDB:原核与病毒组蛋白数据库的构建与功能解析

《Journal of Molecular Biology》:ProHistoneDB: A database of prokaryotic and viral histones

【字体: 时间:2026年01月17日 来源:Journal of Molecular Biology 4.5

编辑推荐:

  本研究针对原核生物和病毒中组蛋白多样性高、功能复杂且缺乏系统资源的问题,开发了在线数据库ProHistoneDB。研究人员通过AlphaFold2结构预测、系统发育分析和HMM谱图构建,对7334个组蛋白进行多层级分类,鉴定出24个功能类别,揭示了组蛋白在DNA弯曲、桥接和超核小体组装中的新机制。该数据库为探索染色质进化提供了关键平台,推动了对非经典组蛋白功能的研究。

  
在所有生命领域的细胞中,基因组DNA需要通过结合特定蛋白质实现高效压缩和功能调控。真核生物的核心染色质蛋白——组蛋白,能够形成核小体结构,像线轴一样缠绕DNA。然而在原核生物(包括古菌和细菌)以及病毒中,组蛋白的存在形式与功能长期笼罩在迷雾中。传统观点认为古菌仅存在类似真核生物的核小体型组蛋白,而细菌则完全缺乏组蛋白。近年来研究发现,原核组蛋白具有惊人的多样性:它们不仅能像真核组蛋白那样包裹DNA形成超核小体(hypernucleosome),还能通过独特的寡聚化方式实现DNA弯曲、桥接甚至膜锚定等新颖功能。这种功能多样性的结构基础是什么?不同类别的原核组蛋白在进化上有何关联?这些问题亟待系统解答。
为解决上述问题,莱顿大学的研究团队在《Journal of Molecular Biology》发表了题为"ProHistoneDB: A database of prokaryotic and viral histones"的研究论文。他们构建了首个专门针对原核和病毒组蛋白的在线数据库ProHistoneDB,通过整合多维组学数据与人工智能预测,揭示了组蛋白家族的功能演化图谱。
研究团队采用了一系列关键技术:从UniProt数据库系统筛选组蛋白序列;利用AlphaFold2(v3)预测单体、二聚体、四聚体和六聚体结构;通过HMMER3构建隐马尔可夫模型(HMM)谱图识别保守域;基于MUSCLE多序列比对和IQ-TREE2构建系统发育树;采用CLANS进行序列相似性聚类分析。特别值得注意的是,研究者首次对Pacman病毒组蛋白进行了AlphaFold3的DNA-蛋白质复合物预测。
ProHistoneDB内容概览
数据库包含7334个组蛋白,主要来源于古菌(67%)、细菌(28%)和病毒(5%)。通过AlphaFold2多聚体预测,将这些蛋白划分为24个功能类别。古菌中主要存在核小体型和面对面(FtF)组蛋白,而细菌特有的组蛋白类别包括细菌二聚体、ZZ型等。蛋白长度和等电点分布显示,超过70个氨基酸的组蛋白常含有额外结构域,嗜盐菌组蛋白则呈现独特的负电性特征。
组蛋白分类与功能解析
核小体型组蛋白占63%,主要存在于古菌,能形成可延伸的超核小体结构。α3超家族被细分为FtF、细菌二聚体等亚类,其中FtF组蛋白可形成环状四聚体包裹DNA。DNA桥接类组蛋白(如CC型、Methanococcales型)通过C端螺旋介导四聚化,实验证实HMfC和MJ1647具有DNA桥接功能。值得注意的是,研究者新发现了Thermoplasmatota门特有的Xer和Poseidoniia双体组蛋白,前者可能与DNA重组相关,后者可能通过伪二聚体折叠弯曲DNA。
非DNA结合型组蛋白
β-螺旋桨(beta-propeller)组蛋白通过四个组蛋白折叠形成自抑制结构;DUF1931组蛋白缺乏典型DNA结合残基,可能与热应激响应相关;跨膜组蛋白的组蛋白折叠域可能介导蛋白质相互作用而非DNA结合。这些发现拓展了对组蛋白功能多样性的认知。
新型组蛋白的发现
在链霉菌中鉴定出细菌H2A H2B组蛋白,其伪二聚体结构与真核H2A-H2B异源二聚体高度相似但序列差异显著,提示水平基因转移可能。在巨型病毒中发现的Pacman双体组蛋白具有独特的臂状结构域,AlphaFold3预测显示其能部分环绕DNA,揭示了病毒染色质组织的新机制。
数据库功能与应用
ProHistoneDB网站(prohistonedb.org)提供交互式系统发育树、HMM保守位点图谱和三维结构可视化。每个蛋白页面展示AlphaFold2预测的pLDDT(局部距离差异测试)和PAE(预测对齐误差)置信度指标,支持多蛋白结构批量下载。分类页面提供进化树和HMM文件下载,便于后续分析。
该研究通过构建综合数据库系统揭示了原核组蛋白的功能多样性:核小体型组蛋白主要实现DNA压缩,α3超家族通过不同寡聚化模式介导DNA弯曲与桥接,而新发现的非典型组蛋白则可能参与环境适应和膜相关功能。ProHistoneDB不仅为染色质进化研究提供资源平台,其发现的细菌H2A H2B组蛋白和病毒特异性组蛋白更为水平基因转移和病毒-宿主共进化提供了新视角。随着更多原核基因组被测序,该数据库将持续更新,推动对生命最基本的信息压缩机制的理解。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号