
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于结构模型预测Asgard古菌中的真核生物细胞复杂性及其起源意义
《Nature Microbiology》:Prediction of eukaryotic cellular complexity in Asgard archaea using structural modelling
【字体: 大 中 小 】 时间:2026年03月06日 来源:Nature Microbiology 19.4
编辑推荐:
本研究针对真核细胞起源(eukaryogenesis)这一关键演化难题,旨在深入探究其古菌祖先——Asgard古菌的细胞复杂程度。通过利用蛋白质从头结构预测与结构比对等前沿技术,研究人员构建了Asgard古菌的全基因组结构目录,新识别出908个“同构”真核特征蛋白(iESP),极大扩展了已知的真核样蛋白库。该发现表明,真核细胞的古菌祖先比先前认识的具有更高程度的真核样细胞复杂性,为解决真核细胞核心特征的起源问题提供了新的结构证据。
生命起源的宏大叙事中,真核细胞的诞生堪称一个决定性的转折点。与结构相对简单的细菌和古菌相比,真核细胞以其内部复杂的膜系统、精细的细胞骨架和功能各异的细胞器而独树一帜。这个被称为“真核化”的演化过程是如何发生的?其先驱者是谁?长久以来,这些问题一直深深吸引着演化生物学家。近年来,一个名为Asgard的古菌类群被确定为真核细胞在古菌界最亲近的“亲戚”,为解答这个谜题带来了曙光。科学家们在这些Asgard古菌的基因组中发现了许多先前被认为是真核生物特有的蛋白质,即真核特征蛋白。然而,由于序列在漫长演化中高度分化,仅凭序列相似性搜索难以全面识别这些同源蛋白,使得我们对真核细胞古菌祖先的“复杂程度”认知模糊不清。究竟这位祖先已经具备了多高的“真核特质”?它是否已经拥有了驱动复杂细胞功能的分子机器雏形?这些悬而未决的问题,正是本研究试图解答的核心。
为了深入探究Asgard古菌的“真核”潜力,研究人员开展了一项大规模的蛋白质结构组学研究。他们收集了936个Asgard古菌基因组,构建了其泛基因组,并从中选择了37,313个蛋白质簇的代表性序列。为了克服序列高度分化带来的识别难题,研究巧妙地结合了基于蛋白质语言模型的ESMfold和基于多重序列比对的ColabFold(一个优化的AlphaFold工作流程)两种方法,高效预测了这些蛋白质的三维结构,获得了高质量的蛋白质结构模型目录。有了这个结构“图谱”,研究人员利用Foldseek等工具,将其与包含真核、细菌和其他古菌蛋白的庞大结构数据库进行比对。这种方法的核心优势在于,蛋白质的三维结构比一级序列在演化中更为保守,因此能够“穿透”序列的迷雾,发现那些序列相似性极低、但结构和功能可能相似的“远房亲戚”。
研究结果
1. 结构建模扩展了Asgard古菌泛基因组的注释
通过结构相似性搜索,研究成功注释了近半数的Asgard古菌蛋白簇。与仅依赖序列同源性检测的方法相比,结构搜索显著提升了同源蛋白的发现率,使获得显著比对结果的蛋白簇比例从29%提升至47%。许多蛋白与其最佳结构匹配蛋白之间的序列同一性低于20%,落入了传统序列比对的“模糊区”,但通过结构比对得以清晰识别。例如,研究成功恢复了Asgard古菌中与真核细胞Retromer/Retriever复合体组分Vps29高度同源的蛋白,尽管其序列相似性仅为27.5%,但结构高度相似。
2. 发现了大量新的“同构”真核特征蛋白
本研究提出了“同构”真核特征蛋白(iESP)的新定义,即那些在结构相似性搜索中,其匹配结果在统计学上显著富集于真核生物蛋白的Asgard古菌蛋白。基于此标准,研究共识别出1,319个先前未被报告的iESPs,它们归属于908个结构簇。这一发现将已知的可能进入真核演化主干的Asgard古菌蛋白数量增加了两倍多。值得注意的是,此前基于序列识别的1,323个ESP中,仅有46%被本研究的结构富集方法所捕获,表明先前的定义可能过于宽松,纳入了一些在更广泛的原核生物中也普遍存在的蛋白域。
3. iESPs提示了更广泛的Asgard古菌细胞复杂性和功能
功能分析显示,新发现的iESP与之前已知的ESP在功能分布上存在显著差异。已知的ESP主要富集于细胞过程和信号转导功能,例如包含大量与小GTP酶相关的簇。而新发现的iESP则更多涉及信息存储与处理(如翻译、核糖体生物合成相关蛋白)以及代谢功能。例如,研究识别出与真核生物RNA干扰机制相关的Argonaute蛋白同源物,其结构与真核AGO/PIWI蛋白高度相似。这些发现表明,真核细胞信息处理系统的更多组件可能具有古菌起源,并且Asgard古菌的代谢能力可能被低估。
4. 关键iESPs揭示了细胞区室化相关复合体的古菌起源
研究进一步聚焦于与细胞区室化相关的关键iESPs。令人瞩目的是,发现了真核生物重要细胞器相关复合体成分的古菌同源物。例如,研究人员识别出了构成真核生物Vault核糖核蛋白复合体主要成分的主要穹隆蛋白的同源物,并对其进行多聚体建模,预测其可能形成类似真核Vault的闭合杯状结构。此外,还发现了真核生物内体分选Commander复合体中COMMD蛋白家族的同源物,该家族此前未在任何原核生物中发现。系统发育分析表明,真核COMMD蛋白(COMMD1-10)形成一个近单系群,而Asgard古菌的同源物可能代表其祖先形式。多聚体建模提示Asgard古菌COMMD同源物可能形成同源多聚体复合物。
5. 发现了真核与Asgard古菌特异性共享的蛋白
研究还鉴定出一些目前仅发现于真核生物和Asgard古菌的蛋白质。例如,类泛素修饰蛋白Ufm1的同源物存在于九个主要Asgard古菌类群中,但在其他原核生物中未见,强烈提示真核生物的Ufm1直接起源于Asgard古菌。另一个例子是细胞周期蛋白依赖性激酶2相互作用蛋白,其同源物存在于包括Hodarchaeales在内的多个Asgard古菌类群,系统发育分析支持真核生物从它们的Heimdallarchaeia祖先那里继承了该蛋白。
研究结论与意义
本项发表于《Nature Microbiology》的研究,通过大规模蛋白质结构预测与比对,构建了首个Asgard古菌泛基因组结构目录,并以前所未有的广度揭示了其与真核生物在蛋白质结构层面的深层联系。该研究不仅将可能与真核起源相关的Asgard古菌蛋白库扩大了超过两倍,更重要的是,它重新描绘了真核细胞古菌祖先的“肖像”。研究结果表明,这位祖先并非一个简单的原型,而是已经拥有了一系列复杂分子机器的雏形,其“工具箱”的丰富程度远超之前的想象。这些工具不仅包括已知的与细胞骨架、膜运输相关的组件,还扩展到了信息处理、代谢以及细胞区室化等核心生命过程。例如,Vault和Commander复合体关键成分的古菌同源物的发现,为理解真核细胞内膜系统复杂性的起源提供了全新的线索。
这项工作的主要意义在于方法论和生物学认知层面的双重突破。在方法上,它成功展示了如何利用AlphaFold、ESMfold等新一代结构预测工具结合高效结构搜索算法,来克服深度演化分歧带来的序列识别障碍,为研究非模式生物及深层同源关系开辟了新途径。在生物学上,它极大地丰富了我们对于“真核特征”在古菌祖先中预适应程度和范围的理解,将真核化过程的研究从“是否拥有某些部件”推进到“这些部件如何被组装和优化以构建复杂细胞”的新阶段。尽管许多iESP在现存Asgard古菌中的分布是斑块状的,且其精确功能尚待实验验证,但它们的结构保守性强烈暗示了功能的相似性。这些发现支持了一个观点:真核细胞的诞生并非一场分子层面的“凭空创造”,而是基于其Asgard古菌祖先已经具备的、相当可观的复杂性的进一步革新和跃升。未来,对这些iESP进行生化与细胞生物学功能验证,将能更清晰地勾勒出从复杂古菌到第一个真核细胞之间那失落的演化图景。
生物通微信公众号
知名企业招聘