跨生物界蛋白质复合体预测结构全景图

《Nature Communications》:Atlas of predicted protein complex structures across kingdoms

【字体: 时间:2026年03月26日 来源:Nature Communications 15.7

编辑推荐:

  本研究致力于解决蛋白质-蛋白质相互作用(PPI)大规模结构表征严重滞后的问题。研究人员利用AlphaFold2驱动的ColabFold框架,对从细菌、古菌到人类、植物等多界生物体的全蛋白质组互作进行结构预测,生成了包含110万个预测结构的数据库,并从中鉴定出181,671个高置信度结构。该图谱揭示了跨生物界保守的复合体结构,识别了病毒候选受体,并展示了其在推动结构生物学与生物医学应用方面的巨大潜力。

在生命科学的宏伟蓝图中,蛋白质并非孤立地工作,它们更像精密的机器零件,必须精确地组合在一起形成“蛋白质复合体”,才能驱动从细胞分裂到信号传递的几乎所有生物过程。然而,一个巨大的“结构鸿沟”横亘在我们面前:公共数据库里已经记录了数百万条潜在的蛋白质-蛋白质相互作用(PPI)信息,告诉我们谁可能与谁牵手,但我们却对绝大多数“牵手”的具体姿势——也就是三维结构——一无所知。这种结构的缺失,严重限制了我们从分子层面理解生命机制、开发靶向药物以及应对病毒感染的步伐。尤其是,不同生物界(如细菌、古菌、真核生物)之间的相互作用结构全景更是模糊不清。为了填补这一空白,一项雄心勃勃的研究展开了。
研究人员利用基于深度学习革命性工具AlphaFold2搭建的ColabFold计算框架,发起了一场大规模的结构预测“普查”。他们的目标是为从细菌、古菌,到人类、小鼠、植物,乃至人类-病毒配对在内的广泛生物体系,预测其蛋白质相互作用的结构。这项浩大的工程最终产生了一个包含110万个预测蛋白质复合体结构的全景图谱。相关成果已发表在《Nature Communications》上。
为开展此项研究,作者主要运用了以下几个关键技术方法:首先是基于AlphaFold2的ColabFold计算框架,用于大规模预测蛋白质-蛋白质相互作用的三维结构。其次,研究者对预测结果进行了系统的置信度评估,以筛选出高置信度的复合体结构。此外,研究还采用了结构聚类分析方法,来识别跨不同生物界的保守结构模体。在实验验证方面,使用了共免疫沉淀(co-immunoprecipitation)技术,对计算预测的特定病毒-宿主蛋白质相互作用进行了验证。最后,通过将预测的复合体结构与AlphaFold单体蛋白质结构数据库进行整合比较,开展了进化分析,以探索基因融合(gene fusion)和基因分裂(gene fission)事件。
研究结果
大规模预测结构数据库的构建
研究团队成功构建了一个涵盖多界生物的综合性数据库,包含了总计1,100,000个预测的蛋白质-蛋白质相互作用结构。通过严格的置信度评估,从该数据集中鉴定出181,671个高置信度的蛋白复合体结构,其中在人交互组(human interactome)中发现了37,855个高置信度结构。这极大地扩展了已知蛋白质复合体结构的覆盖范围。
跨生物界的保守结构发现
通过对预测结构进行系统性聚类分析,研究揭示了大量保守的蛋白质复合体结构架构,这些架构在不同的生物界(如细菌、古菌和真核生物之间)共享。这一发现为理解那些功能尚未明确的蛋白质复合体的生物学功能提供了重要的结构线索。
病毒-宿主相互作用的实验验证
利用共免疫沉淀实验对计算预测的病毒-宿主互作进行验证,研究进一步成功鉴定了针对Human mastadenovirus APapiine alphaherpesvirus 2的候选病毒受体。这证明了该计算预测数据库在指导实验发现、尤其是识别病原体侵染机制方面的实用价值。
进化事件的洞察
通过将本研究预测的复合体结构与AlphaFold单体结构数据库进行整合与比较分析,研究发现了在进化过程中广泛存在的基因融合与基因分裂事件。这些事件影响了蛋白质结构域的组合与分离,为了解蛋白质复合体的进化起源提供了新的视角。
数据集的扩展应用
最后,研究展示了如何利用该预测结构数据库来提升基于深度学习的蛋白质结合表面预测性能。这表明该图谱的价值不仅限于提供静态的结构模型,更能作为工具和训练数据,推动计算方法在蛋白质界面预测等更广泛领域的发展。
结论与讨论
本研究呈现的“跨生物界蛋白质复合体预测结构全景图”,是迄今为止最广泛的交叉生物界结构资源之一。它系统性地将海量的蛋白质相互作用数据转化为可计算、可分析的三维结构信息,初步弥合了互作组学与结构生物学之间的鸿沟。该工作不仅鉴定出数以万计的高置信度蛋白复合体结构,揭示了跨物种保守的结构蓝图,还通过实验验证了其在识别病毒受体等具体生物医学问题上的应用潜力。此外,对基因融合与分裂事件的分析,从进化角度丰富了我们对蛋白质复合体组装的理解。更重要的是,该数据集作为一个基础平台,其效用已超越单纯的结构建模,能够赋能深度学习等新方法,提升对蛋白质相互作用界面等关键特征的预测能力。总而言之,该图谱为未来在基础生物学、病原体防控、药物靶点发现等多个生物医学领域的研究开辟了新的道路,是一项兼具广度与深度的基础性资源。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号