关于口腔细菌Tannerella serpentiformis双糖蛋白表面层的分子机制研究
《Journal of Molecular Graphics and Modelling》:Molecular Insights into the Dual-Glycoprotein Surface-Layer of the oral bacterium Tannerella serpentiformis
【字体:
大
中
小
】
时间:2026年05月04日
来源:Journal of Molecular Graphics and Modelling 3
编辑推荐:
斯蒂芬妮·格里尔-瓦尔彻(Stephanie Grill-Walcher)、安德烈亚斯·布赖特维泽(Andreas Breitwieser)、穆罕默德·阿夫扎尔(Muhammad Afzal)、迪特马尔·普姆(Dietmar Pum)、亚历山大·M.J.J.邦文(Alexandr
斯蒂芬妮·格里尔-瓦尔彻(Stephanie Grill-Walcher)、安德烈亚斯·布赖特维泽(Andreas Breitwieser)、穆罕默德·阿夫扎尔(Muhammad Afzal)、迪特马尔·普姆(Dietmar Pum)、亚历山大·M.J.J.邦文(Alexandre M.J.J. Bonvin)、克里斯·奥斯滕布林克(Chris Oostenbrink)、克里斯蒂娜·谢弗(Christina Sch?ffer)
奥地利维也纳BOKU大学自然科学与可持续资源学院生物化学研究所,邮编1190
**摘要**
表面(S-)层是广泛存在的蛋白质晶格结构,构成了许多细菌和古菌最外层的细胞膜。然而,多蛋白S-层的分子组织结构仍然知之甚少。Tannerella serpentiformis是一种长而分段的口腔共生菌,它表达两种高度糖基化的S-层蛋白(TssA和TssB),这两种蛋白与牙周病原菌Tannerella forsythia的双S-层系统具有同源性。然而,T. serpentiformis S-层的结构排列和组装原理此前尚未被阐明。在本研究中,我们结合了电子显微镜观察、序列保守性分析、糖基化定位以及综合结构建模技术,重建了TssA-TssB晶格的合理分子结构。表面成像显示该晶格为正方形(p4)结构,单元格尺寸约为10–12纳米,外膜到表面的距离约为21纳米,这与T. forsythia的S-层特征相似。通过使用AlphaFold2 Multimer、AlphaFold3和HADDOCK对接软件,我们生成并评估了TssA-TssB异二聚体的结构,并组装了具有p4对称性的单元格模型。AlphaFold2 Multimer倾向于预测一种延长的串联二聚体(ipTM+pTM = 0.71),而当提供实验验证的糖基化位点时,AlphaFold3和HADDOCK 2.4则更倾向于侧向排列(ipTM+pTM = 0.55)。这种二聚体的对称对接形成了一个中心带有约3.5纳米孔洞的单元格模型:TssA在中心形成紧凑的核心结构,而TssB则形成外围环状结构,其表面的糖链向外延伸,保守的残基朝向细胞膜。这种结构与其他S-层系统的灵活性一致,并允许营养物质通过中心孔洞进行交换。我们的结果为T. serpentiformis的S-层提供了一个合理的分子模型,并为通过糖链信息进行多蛋白S-层的结构解析提供了潜在的框架。
**1. 引言**
表面(S-)层几乎是所有古菌和许多细菌细胞膜的重要组成部分[1] [2]。它们是由蛋白质组成的结晶晶格,在细胞最外表面自组装形成规则且具有旋转对称性的图案[3]。这些晶格形成了具有特定物种大小的规则排列的孔洞,既作为分子筛参与营养物质交换,同时也保护细胞免受恶劣环境的影响[1] [4] [5]。迄今为止,已经描述了斜方(p1, p2)、正方形(p4)和六边形(p3, p6)等多种S-层晶格对称性,在高曲率区域(如细胞极点)偶尔会观察到五聚体或七聚体单元格等局部缺陷,或者存在修复机制以确保S-层在整个细胞表面的连续性[6] [7] [8]。在古菌中,S-层通常是细胞壁的唯一结构成分,并且高度保守。相比之下,普遍维持S-层的细菌种类较为罕见[2] [9]。细菌的S-层具有多种生物学功能,包括提供结构支持、分子筛分以及调节细胞与环境或细胞间的相互作用,这些功能通常通过翻译后修饰实现,尤其是糖基化修饰,后者可以影响病原性[10] [11] [12]。然而,对这些功能的直接实验验证仍然有限。
由于S-层具有自我组装的倾向和二维晶体规律性,传统晶体学方法在对其结构进行表征时一直面临挑战[5]。近年来,冷冻辅助电子显微镜技术和图像处理方法的进步使得能够在接近原子分辨率的水平上阐明多种古菌和细菌的S-层结构[13] [14] [16]。S-层在晶格参数上表现出显著的多样性,单元格尺寸从乳酸杆菌(Lactobacillus acidophilus)的约37 ?到Odoribacter splanchnicus的近300 ?不等[2]。晶格的孔隙率与环境适应性相关——较小的孔洞在极端条件(如高温或低pH值)下提供保护,而较大的孔洞则有利于营养物质的吸收和增加灵活性[17]。大多数S-层由单一的高分子量S-层蛋白(SLP)形成,这种蛋白通常经过翻译后修饰,其多结构域包括一个锚定区域(例如革兰氏阳性细菌中的S-层同源结构域三聚体[18] [19] [20])和一个可通过非共价相互作用(通常是阳离子依赖的)稳定在表面的晶格形成区域[3]。在少数情况下,S-层的形成涉及两种或更多具有不同功能的SLP,例如在Sulfolobus属古菌中,SlaA负责晶格形成,SlaB负责锚定[21];在Clostridioides difficile(前称Clostridium difficile)中,SLPL负责晶格形成,SLPH负责锚定[16];在乳酸杆菌(Lactobacillus acidophilus)中,SLP SlpA起主导作用,SLP SlpX起辅助作用[14]。尽管多蛋白S-层会带来更高的代谢成本,但它们提供了更大的适应性,允许在细菌生长过程中选择性地修饰暴露在表面的亚基或进行阶段特异性表达(例如炭疽杆菌Bacillus anthracis中的Sap和EA1[22])。尽管SLP的锚定区域相对保守,但在密切相关的物种中,形成晶格的SLP仍可能表现出不同的晶格对称类型(例如在Bacillota门中[2])。
最特殊的S-层是由两种SLP对称组装成单一晶格的情况,而不是其中一个主要作为锚定元件或辅助元素。文献中描述的这类案例非常少,例如某些Bacillus thuringiensis菌株[23]。最著名的例子是Tannerella forsythia,这是一种革兰氏阴性口腔病原菌,它产生两种糖基化的SLP蛋白TfsA(UniProt A0A1D3UND3)和TfsB(UniProt A0A1D3UN43),这两种蛋白以等摩尔比组装成p4对称的晶格[24]。尽管这两种SLP之间的精确分子相互作用和相对位置尚不清楚,但通过透射电子显微镜(TEM)已经确定了p4旋转对称晶格的晶格尺寸(中心到中心的距离约为10纳米)和外膜到表面的距离(约为22纳米)[24]。根据已发表的小角X射线散射数据,我们估计孔洞大小约为3-4纳米[25]。这两种S-层蛋白均通过IX型分泌系统(T9SS)输出,经过C末端切割,并与外膜脂多糖共价结合[24] [26]。因此,这两种蛋白被认为是成熟S-层晶格的同等结构元素,各自独立锚定在外膜上,并共同参与细胞表面的晶格形成。
T. forsythia的近亲Tannerella serpentiformis是一种革兰氏阴性口腔微生物群中的共生菌,其情况类似但尚未得到充分研究。这种长达40微米的分段杆菌表达两种SLP蛋白——TssA(UniProt A0A2R4KII9)和TssB(UniProt A0A2R4KIF3),它们在序列和结构域上与TfsA和TfsB高度相似[27] [28],包括C末端的T9SS基序[28]。这两种SLP都高度糖基化,尤其是N末端结构域,AlphaFold2模型预测它们的多结构域结构与TfsA和TfsA相似[28]。尽管存在这些相似性,T. serpentiformis双SLP晶格的分子组织和对称性仍然未知。
最近的计算技术进步,特别是基于深度学习框架(如AlphaFold2-Multimer[29] [30])的算法,在预测单蛋白系统的对称S-层结构方面表现出显著的准确性[2] [31]。然而,目前的算法仅限于同源晶格,尚无法处理像Tannerella spp这样的异源组装结构。在本研究中,我们结合了实验和计算方法对T. serpentiformis的双糖蛋白S-层进行了分析。通过完整细胞的电子显微镜观察和与T. forsythia S-层的比较建模,我们研究了晶格的几何形状和对称性。我们还应用了多种计算方法,包括AlphaFold2-Multimer、AlphaFold3以及基于物理学的对接平台HADDOCK(High Ambiguity Driven DOCKing[32] [33] [34]),来模拟TssA-TssB二聚体并重建合理的p4对称单元格。通过整合结构预测、糖基化位点和保守残基的定位以及生物物理合理性评估(与晶格中相邻单元格的冲突情况和孔隙率),我们确定了最可能的S-层结构,并提出了T. serpentiformis双糖蛋白晶格的模型。这项研究为理解T. serpentiformis的S-层提供了分子层面的见解,并为通过糖链信息进行多蛋白S-层结构解析提供了比较框架。
**材料与方法**
2.1. 细菌的培养和收集
T. serpentiformis W11667细胞(由英国谢菲尔德大学临床牙科学院的Graham Stafford博士提供)在厌氧条件下培养于Fastidious Anaerobe琼脂(FAA;Neogen)上,添加了5% v/v马血(Sigma-Aldrich)和20 μg/ml N-乙酰氨基己糖酸(NAMA;Sigma-Aldrich)[35]。培养条件为37°C,培养时间为6天。通过轻轻刮取琼脂表面的细菌细胞,用预温的1x磷酸盐缓冲盐水(PBS,Sigma-Aldrich)洗涤一次,然后以500 x g离心3分钟进行收集。
2.2. RNA提取和定量实时PCR(qRT-PCR)
RNA提取按照上述方法在培养6天后进行。使用Bacterial RNA试剂盒(innuPREP,IST Innuscreen)根据制造商的说明提取总RNA。RNA样品用2U无RNase I(Invitrogen)处理以去除残留的基因组DNA[36]。根据Thermo Fisher Scientific的说明书,使用High-Capacity cDNA逆转录试剂盒合成cDNA,包括最后的80°C酶失活步骤。对于qRT PCR,设计了针对管家基因gyrA(位点标签:BCB71_02740)以及两种S-层蛋白基因(TssA和TssB)N末端结构域的特异性正向和反向引物,并由Thermo Fisher Scientific合成(见表1)。反应使用PowerUp SYBR Green Master Mix进行基因表达分析(Applied Biosystems),每个反应使用50 ng cDNA模板。扩增在CFX Opus 96热循环仪(Bio-Rad)上进行,循环参数为:初始变性95°C 3分钟,随后40个循环,每个循环95°C 10秒和55°C 30秒。定量结果使用比较Ct(ΔΔCt)方法进行分析[37]。计算每个基因的Ct值,相对基因表达量为2?ΔΔCt,其中ΔΔCt = (Cttarget–Ctgyrase)sample – (Cttarget–Ctgyrase)control。比较TssA和TssB的相对表达水平以确定它们的表达比例。
表1. 用于qPCR的寡核苷酸引物
| 名称 | 5’ – 3’ 序列 | Tm (°C) | CG%nt |
|----------------|------------------|--------|-------|
| gyrA | cgtacgtcgcattttcc | 64.6 | 5.6 |
| tssA | attgacaacgctatcgag | 63.6 | 5.6 |
| tssB | cagtaggggaggagtaccttctgacc | 63.6 | 6.5 |
| tssA | atccttaatagccctctgacc | 60.4 | 7.6 |
| tssB | caggggaggagtaccttcttaaag | 64.3 | 5.7 |
2.3. S-层蛋白TssA和TssB的系统发育分析
为了识别和分析T. serpentiformis S-层蛋白TssA和TssB的最接近的同源物,构建了一个最大似然系统发育树。使用protein BLAST(E-value <1 × 10-5)和Foldseek [38](afdb50)搜索独立检索同源序列。合并得到的数据集后去除重复序列,并使用MUSCLE [39]算法在AliView [40]中进行序列比对。然后使用Galaxy网络平台[42]和Jukes-Cantor + CAT蛋白质进化模型在FastTree2 [41]中生成最大似然系统发育树。
2.4. 冻裂电子显微镜
细菌的培养和收集方法同上。将1-2 μl的样品滴加到400目Cu/Pd网格(Agar Scientific,英国埃塞克斯)上,该网格夹在一对拉伸断裂样品载体(镀金铜棒,带有平坦平台,直径4.6毫米;Balzers,列支敦士登)之间。使用Leica EM GP2 plunge冷冻器(Leica Microsystems,奥地利维也纳)在–185°C的液态乙烷中立即进行冷冻断裂。冷冻后的样品转移到预冷的冻裂装置(Balzers BAF 400高真空蒸发器;Balzers,列支敦士登)中,并配备电子枪。在达到–110°C、2 × 10?7 mbar的真空度后,按照Severs [43]的方法进行断裂。暴露的表面先涂覆一层2纳米厚的铂(Leica Microsystems,奥地利维也纳),然后以45°角涂覆20纳米厚的碳层(Balzers,列支敦士登),最后将金属涂层样品从载体上取下。为了去除残留的生物物质,样品用2.5%(w/v)SDS、15 mM蔗糖和5 mM Tris/HCl缓冲液(pH 8.0)处理约2小时,然后用蒸馏水彻底冲洗。制备好的网格使用透射电子显微镜(FEI Morgagni 268;荷兰埃因霍温)在80 kV下观察。数字显微图像由MegaView III CCD相机(Olympus-SIS,德国明斯特)拍摄。
2.5. 负染色电子显微镜
细菌的培养和收集方法同上。使用FEI Tecnai T20 G2显微镜(FEIEurope(现属ThermoScientific,荷兰埃因霍温)在160 kV下进行透射电子显微镜(TEM)观察负染的整个细胞及其S-层。样品制备过程中,将细胞吸附在300目铜网格(Agar Scientific Ltd.,英国斯坦斯特德)上,该网格表面覆盖有Formvar支撑膜和一层额外的薄碳层(Christine Gr?pl Elektronenmikroskopie,奥地利图尔恩)。样品通过将网格浸入2%(w/v)乌拉酰醋酸溶液中10分钟进行染色。所有操作均在室温下进行[44]。使用Fiji(ImageJ2,v2.3.0)软件对整个细胞的负染色和冻裂样品进行图像分析。对选定的感兴趣区域进行了互相关平均处理,以估计晶格周期性和晶胞尺寸[45]。2.6. AlphaFold2建模使用了AlphaFold2(v.2.2)[30]和AlphaFold2 Multimer(v.2.2)[29]来模拟T. serpentiformis的S层蛋白TssA(Uniprot: A0A2R4KII9,位于W11667菌株完整基因组中的位点标签BCB71_RS00675)和TssB(Uniprot: A0A2R4KIF3,位于W11667菌株完整基因组中的位点标签BCB71_RS00680),以及相应的T. forsythia S层蛋白TfsB(UniProt A0A1D3UN43),其中TfsA(Uniprot: A0A1D3UND3)已经存在于AlphaFold数据库中[46]。对于二聚体建模,使用AlphaFold2-Multimer流程对TssA的N端结构域(残基25-439)和TssB的N端结构域(残基27-637)进行了建模,排除了它们的N端信号肽。生成了五个模型(针对单个蛋白)或25个模型(针对二聚体模型),并使用默认参数对这些模型进行了优化和排名,然后选择了排名最高的模型进行后续分析。使用ColabFold(v1.5.5:使用MMseqs2的AlphaFold2)[47]对TssA和TssB的两个上游结构域进行了自定义单体MSA建模(见“保守残基评估和自定义MSA生成”部分),通过预测的局部距离差异测试(pLDDT)生成了五个优化模型,并对模型进行了排名。在pyMOL[48]中使用测量工具对模型结构中的孔径尺寸和晶胞尺寸进行了测量。结构比对在pyMOL中使用Alignment插件进行,在ChimeraX[49]中使用MatchMaker工具进行。所有分子可视化结果,包括补充电影1,都是在pyMOL中准备的,除了没有糖链信息或糖链信息被修改的AlphaFold3二聚体图像(见补充表1和补充表2),这些图像是在ChimeraX中可视化的。以下是与本文相关的补充数据:下载:下载视频(5MB)2.7. AlphaFold3建模使用AlphaFold3网络服务器(2024年6月访问)[50]进行了AlphaFold3建模。进行了25次独立运行来模拟由TssA25-439和TssB27-637组成的二聚体。输入包括初级氨基酸序列,其中包含或不包含先前识别的糖基化位点的信息[28]。由于T. serpentiformis的天然十一糖或十糖(代表两种糖型)的结构复杂性,无法输入确切的糖链组成。因此,使用了简化的代理糖链,由八个单糖单元组成,要么是葡萄糖(主链),要么是岩藻糖(侧链),表示为GLC(FUC)(GLC(GLC(GLC(FUC)(GLC(GLC))))。将得到的25个模型转换为一个结构集合,进行聚类,并使用HADDOCK 3[34]进行评分,仅考虑蛋白质-蛋白质相互作用(排除了糖链信息)。将AlphaFold3衍生的指标——包括界面预测模板建模(ipTM)得分、预测模板建模得分(pTM)和综合排名得分(加权ipTM + pTM)——与使用md评分模块获得的HADDOCK 3得分进行对比,然后选择了表现最佳的模型作为在HADDOCK 2.4[32]、[33]中进行后续受限二聚体对接的模板。2.8. HADDOCK 2二聚体对接为了进行受限二聚体对接,选择了表现最佳的AlphaFold3二聚体模型(运行11)作为模板。使用七个残基对定义了模糊的界面距离约束,这些残基对在两个蛋白质结构域之间形成了氢键(TssA活性残基-TssB非活性残基:Asp102-Arg213、Tyr412-Arg19、Thr246-Asp536、Glu247-Arg557、Glu247-Thr540、Arg280-Phe541和Glu42-Arg274)。通过两个平行的静态正方形平面(15 nm x 15 nm)实施了平面约束,这两个平面相隔3 nm,这大约是一个N端结构域单体的厚度,每个平面由间隔1.5 nm的规则排列的珠子组成。定义了TssA和TssB中选定残基与这些珠子之间的模糊距离约束,以限制蛋白质在这两个人工珠子平面上的平面排列。为了促进二聚体相互作用,启用了蛋白质之间的质心约束。对于刚性对接,采样参数设置为10,000;对于半柔性对接和最终精炼阶段,采样参数设置为400,最小聚类大小为1。对于不受限制的二聚体对接,应用了相同的参数,但仅使用了紧密的质心约束以确保结构域之间的相互作用;没有包括模糊或明确的距离约束。对于所有对接运行,都启用了使用MARTINI2[51]、[52]的粗粒化模型[53],并且使用HADDOCK的默认水精炼协议对选定的运行进行了精炼。2.9. HADDOCK 2.4八聚体对接为了构建一个p4对称的晶胞,在HADDOK 2.4[32]、[33]中对称地对接了四个单独的TssA-TssB上游结构域二聚体单元。该过程使用了AlphaFold2 Multimer衍生的二聚体和AlphaFold3/HADDOCK衍生的二聚体。每个二聚体表示为单条链(A、B、C和D),在每种情况下,TssB亚基的索引都向前移动了+1000,以保持唯一的残基编号。在所有四条链上强制实施了C4对称性。对于AlphaFold2 Multimer衍生的二聚体,对称性约束应用于每个单体的第200个残基(即TssA的第200个残基和TssB的第1200个残基)。对于基于AlphaFold3的二聚体,对称性是使用TssA的第一个残基(残基1)和TssB的最后一个残基(残基1611)来定义的。启用了非晶体对称性约束。在适用的情况下,使用两个平行的静态正方形平面(21 nm x 21 nm)实施了明确的平面约束,这两个平面相隔3 nm,并由间隔1.5 nm的规则排列的球体组成。将组装体约束在三个不同的平面上:i) 紧密约束(7.5 ?),应用于AlphaFold2和AlphaFold3衍生的组装体;ii) 松散约束(12 ?),仅应用于AlphaFold3衍生的组装体;或iii) 无平面约束,仅应用于AlphaFold3衍生的组装体。所有对接运行都在粗粒化级别进行,以减少计算需求。为了促进二聚体间的相互作用,应用了质心约束。对于刚性对接,采样参数设置为10,000个模型;对于半柔性对接和最终精炼阶段,分别设置了400个模型,最小聚类大小为1。在刚性能量最小化过程中,通过将范德华能降低0.001来减少分子间相互作用,并将HADDOCK评分函数中的范德华项的权重设置为零(Evdw 1=0)。2.10. 保守残基评估和自定义MSA生成使用DeepMSA2网络服务器[54]为TssA和TssB的每个上游结构域单体生成了多序列比对(MSAs)。序列集合来自全基因组数据库(Uniclust30、UniRef90)和宏基因组数据(Metaclust、BFD、Mgnify、TeraDB、MetaSourceDB和JGlclust)。或者,也可以从BLASTp(E值=10-5)、Foldseek(数据库afdb50)[38]和UniRef90搜索中使用两种S层蛋白的完整序列手动编译独特的同源序列。使用AliView[40]中实现的MUSCLE算法[39]对结果序列进行了重新比对,并修剪比对结果,仅包括每种蛋白的第一个(上游)结构域。修剪后的MSAs以及基于自定义MSAs的AlphaFold2(ColabFold)生成的pdb结构文件被提交到ConSurf网络服务器[55]、[56]、[57]、[58]、[59]、[60](2024年10月)进行序列保守性分析和可视化。随后将得到的TssA和TssB单体模型与二聚体和提出的八聚体(晶胞)组装体对齐,以评估在提出的S层晶格内的保守残基的空间分布。3. 结果3.1. T. serpentiformis S层的结构表征T. serpentiformis细胞通常形成细长的分节棒状结构,平均直径为1 μm,总长度可达40 μm[27]。在这项研究中,获得了负染色、冷冻断裂和薄切的整个细胞的TEM图像,从而可以估计S层晶胞尺寸和晶格对称性,以便进行后续的建模实验。根据表面TEM分析,晶胞尺寸略有变化,主要是因为图像很少以与细胞表面完美的90°角度获取。这种偏差是由于细长细胞体的自然曲率造成的,特别是在冷冻断裂制备中尤为明显。来自负染色图像的测量结果(图1ab)显示平均晶胞尺寸为11.34 ±0.37 nm x 11.94 ±0.54 nm(n=6),平均基角为89.56° ±2.32°。相比之下,冷冻断裂图像(图1c)产生的值略小,平均晶胞尺寸为8.8 ±0.14 nm x 9.43 ±0.43 nm(n=4),基角为87.6°±1.05°。两种实验类型之间的晶胞长度测量差异可能是由于基角的不同以及冷冻蚀刻制备相对于投影平面的强烈倾斜造成的,而负染色图像正是基于该投影平面的。下载:下载高分辨率图像(633KB)下载:下载全尺寸图像图1. T. serpentiformis S层的透射电子显微镜和计算重建。(a) 基于负染色整个细胞制备计算的功率谱,表明晶格为正方形,晶格向量为11 nm x 12 nm,基角约为90°。(b) 从(a)中的数据得出的p4(正方形)对称晶格的二维图像重建。(c) 冷冻蚀刻并金属阴影处理的整个细胞制备,显示S层。(d) Epon嵌入细胞的薄切片TEM。插图:虚线框内区域的放大视图;黄色条表示从外膜到表面的距离(约21 nm)。尽管测得的基角略有偏离90°,数据清楚地表明T. serpentiformis S层具有正方形(p4)晶格对称性。Epon嵌入的T. serpentiformis细胞的薄切片图像(图1d)还显示了外膜到表面的距离约为21 nm,这与之前对T. forsythia的测量结果一致[24],尽管分辨率较低。3.2. 在AlphaFold2和AlphaFold3中对TssA和TssB的比较结构建模使用内部安装的AlphaFold2(TssA和TssB使用版本2.0.1,TssB使用版本2.3.2)对全长T. serpentiformis S层蛋白TssA(Uniprot: A0A2R4KII9;位于W11667菌株完整基因组中的位点标签BCB71_RS00675)和TssB(Uniprot: A0A2R4KIF3;位于W11667菌株完整基因组中的位点标签BCB71_RS00680)进行了建模,使用了默认的单体设置。分别生成了五个优化和排名的模型,其中排名最高的模型的全局pLDDT得分分别为81.49(TssA)和78.29(TssB),表明置信度很高(图2ab)。下载:下载高分辨率图像(1MB)下载:下载全尺寸图像图2. T. forsythia和T. serpentiformis的S层蛋白(SLPs)的结构比较。(a) TfsA与TssA的叠加,以及TfsB与TssB的叠加。T. forsythia的SLPs(TfsA/B)显示为浅蓝色;T. serpentiformis的SLPs(TssA/B)显示为洋红色(TssA)和黄橙色(TssB)。两组SLPs的整体折叠结构非常相似,尤其是在它们的N端结构域(TfsA1-437与TssA1-437:RMSD=0.72 ?;TfsB1-635与TssB1-635:RMSD=1.55 ?)。(b) TssB(左)和TssA(右)的预测比对误差(PAE)图。个别结构域边界由虚线框表示;形成晶格的N端结构域用红色标出。(c) AlphaFold3模型的TssA(洋红色)和TssB(黄色),以及实验确认的糖基化位点处的模型化糖链代理(灰色)。在网络服务器可用后,使用AlphaFold3再次对这两种S层蛋白进行了建模。在TssA的13个已知糖基化位点和TssB的21个已知糖基化位点处,将它们分支的O-连接糖链的简化表示纳入模型,使用了由八个葡萄糖或岩藻糖单糖组成的截短版本,而不是天然的10-11个单糖,其中包括修饰的半乳糖、葡萄糖、岩藻糖、鼠李糖和葡萄糖醛酸[28](图2c)。AlphaFold3模型产生了相当的质量指标:TssA(ipTM = 0.54,pTM = 0.64,排名得分 = 0.57)和TssB(ipTM = 0.53,pTM = 0.55,排名得分 = 0.54)。总体而言,AlphaFold3预测的结构比AlphaFold2更紧凑,结构域略微向内弯曲而不是向外延伸。除了轻微的环状重排外,两种版本之间的结构域组织高度一致。AlphaFold2和AlphaFold3生成的N端结构域之间的均方根偏差(RMSD)分别为TssA的0.79 ?和TssB的0.94 ?。系统发育分析证实,T. serpentiformis的S层蛋白与T. forsythia的相应蛋白最为接近(见补充图1)。TfsA-TssA的序列同一性为59.1%(97.3%覆盖率),TfsB-TssB的序列同一性为49.5%(93.4%覆盖率)。将AlphaFold2生成的T. serpentiformis S层模型与T. forsythia模型(TfsA:Uniprot A0A1D3UND3,AlphaFold DB模型AF-A0A1D3UND3-F1-v4,平均pLDDT = 83.24;TfsB:内部AlphaFold2 v2.0.1模型,平均pLDDT=75.57)进行结构比较,显示出高度的结构相似性,仅在结构域方向上略有不同(图2a)。每种S层蛋白对的N端结构域几乎相同(TfsA1-437与TssA1-437:RMSD=0.72 ?;TfsB1-635与TssB1-635:RMSD=1.55 ?)。TfsA/TssA和TfsB/TssB蛋白都包含四个不同的结构域(图2ab)。C端结构域完全不含糖基化[28],是一个结构上高度保守的T9SS相关结构域[26],在蛋白质分泌时被蛋白酶切割,并被认为与外膜脂多糖(LPS)共价连接[61]。接下来的两个结构域中度糖基化,长度分别约为10 nm(TssA/TfsA)和11 nm(TssB/TfsB)。N端结构域是最大的(高度约为3-4纳米,长度约为6-8纳米),并且承载了大部分糖基化修饰——在TssA的13个糖基化位点中,有5个位于该结构域;在TssB的21个糖基化位点中,有14个位于该结构域[28]。T. forsythia粗糙脂多糖(LPS)的结构已经部分被阐明[62],从外膜突出的粗糙LPS层的典型厚度约为15-30埃[63]、[64]、[65]、[66](仅包括核心寡糖区域,因为脂质A骨架嵌入在外膜中作为LPS的锚定基团),这支持了我们的假设:每个SLP的两个中间结构域位于细胞表面下方,与粗糙LPS相连,而N端结构域形成了可被表面接触的S层晶格。因此,所有后续的晶格建模分析都专注于TssA和TssB的N端结构域。
3.3 TssA-TssB二聚体建模
为了评估这两种T. serpentiformis S层蛋白的相对表达量,进行了定量PCR(qPCR)分析。与T. forsythia之前的研究结果一致[24],qPCR结果显示,在标准培养条件下(在37°C的血琼脂板上进行6天的厌氧生长),这两种S层基因(位点标签BCB71_00675和BCB71_00680)相对于管家基因gyrB(位点标签BCB71_02740)的表达比例为大约1:1(数据未显示)。
T. forsythia[24]和T. serpentiformis(本研究)的S层都表现出p4晶格对称性,由两种不同类型的S层糖蛋白以等摩尔比组成。为了在计算上再现这种对称性,需要每种蛋白四个拷贝才能实现90°的旋转(C4)对称性。作为重建完整单元格的第一步,首先对TssA-TssB异二聚体进行了建模,然后使用HADDOCK软件对四个二聚体拷贝进行对称对接,以生成候选的p4单元格组装。
TssA-TssB二聚体的建模采用了三种互补的方法:i) 基于从单独的AlphaFold2模型中提取的N端结构域的HADDOCK 2.4;ii) 仅使用初级蛋白序列的AlphaFold2 Multimer(图3a);以及iii) 结合实验确定的糖基化位点信息的AlphaFold3(图3b)。在每种序列中,在建模之前都去除了信号肽(TssA:MNKKVFTLLAASFMLLLGAVGASA;TssB:MIMNKKIFTLLAGILMLGLFAVSGNA)。
下载:下载高分辨率图像(1MB)
下载:下载全尺寸图像
图3. 预测的TssA-TssB N端二聚体排列。(a) AlphaFold2 Multimer生成的最为常见的二聚体构象,始终呈现延长的S形。(b) AlphaFold3预测的主要并排二聚体结构,以及HADDOCK 2.4对接推荐的结构。图(a)和(b)中展示的二聚体排列都将C端置于同一侧面上,这与膜锚定和糖链的可接近性一致。
为了细化各个结构域的预测,使用DeepMSA2[54](搜索Uniclust30、UniRef90、BFD、MGnify和IMG/M数据库)以及来自BLASTp、Foldseek[38]和UniRef90搜索的序列集生成了自定义的多序列比对(MSA)。这些MSA在AlphaFold Colab[47](单体设置)中用于建模TssA和TssB的N端结构域。所得到的基于自定义MSA的结构与标准AlphaFold2模型高度一致(RMSD分别为TssA 0.93 ?和TssB 0.95 ?),并且模型置信度有所提高,平均pLDDT从79.10增加到85.48(TssA)和64.31增加到74.87(TssB),pTM得分从0.87(TssA)增加到0.84(TssB)。
同样,也使用相同的方法为TssA-TssB N端结构域对生成了自定义的异二聚体MSA。然而,由于检索到的序列数量有限(来自Uniref 100的13个序列),生成的ColabFold模型深度不足,无法得出可靠的二聚体预测。
**AlphaFold2 Multimer建模**
使用AlphaFold2 Multimer流程和默认参数,生成了25个经过优化的TssA-TssB二聚体模型。排名前五的模型的加权ipTM + pTM得分均大于0.50,其中排名第一的模型(排名0)的得分达到0.71,全局平均pLDDT为70.23(图3a)。在这25个模型中,有15个模型(包括所有排名前五的结构)都收敛到了一个一致的延长型S形二聚体构型。在这种构型中,两个单体形成了覆盖每个结构域大约一半的界面,而剩余部分向外延伸。使用Deeprank[67]预测的这种界面的天然接触比例为0.62,表明存在类似天然的相互作用。该模型在生物学上被认为是合理的:两个单体在平面方向上对齐,其C端朝向相同方向,与向外部膜的延伸一致,而预测的糖基化位点主要位于相反的一侧,表明糖链有足够的空间进行延伸。排名较低的模型显示出明显不同的构型,例如单体在z轴上旋转约90°或方向颠倒,这使它们与生物学约束不太兼容。
使用HADDOCK 3[34]基于mdscoring模块对所有25个AlphaFold2 Multimer结构进行了聚类和排名。HADDOCK得分是各种项的加权和,包括代表静电分子间能量、距离约束能量、对称性约束能量和脱溶剂能量的项。HADDOCK得分是一个无量纲的属性,能量项总和最低的组装被排在首位。HADDOCK 3的得分与AlphaFold得出的(ipTM + pTM)得分相关性良好。重要的是,排名最高的AlphaFold2 Multimer模型也是得分最高的HADDOCK簇的成员(补充图2a-d)。
**AlphaFold3二聚体建模**
当AlphaFold3在2024年6月可用时[50],再次对TssA和TssB的N端结构域二聚体进行了建模,这次还加入了糖基化信息。使用了一种简化的8聚体代理糖链——代表更复杂的T. serpentiformis O-糖链——这些糖链位于通过质谱验证的糖基化位点[28]。尽管天然糖链在其主链上含有两个带电的葡萄糖醛酸残基(一个靠近还原端,一个靠近主链中心),但由于羧酸通常被分支的(甲氧基修饰的)岩藻糖残基所掩盖,其局部电荷密度较低,因此这种8聚体代理糖链是对天然糖链的合理近似。与AlphaFold2 Multimer不同,AlphaFold3始终偏好并排的二聚体构型,形成沿两个单体全长延伸的平面界面(约6纳米×约8纳米;图3b)。在生成的25个模型中,有24个采用了这种几何构型(全局RMSD <1.0 ?),表明有很强的收敛性。值得注意的是,这种并排排列在AlphaFold2 Multimer的预测中并未出现,相反,AlphaFold2的S形构型也没有出现在AlphaFold3的输出中。在AlphaFold3的二聚体模型中,两个C端指向同一方向,而糖基化表面朝外——与细胞外晶格的暴露一致。
为了评估糖基化的影响,进行了十次额外的AlphaFold3运行,但这些运行没有包含糖链信息(补充表1)。这些无糖链的运行产生了更多样化的结果集:十个模型中有四个类似于AlphaFold2 Multimer的排列,但界面位于每个单体的相反面上。得分最高的无糖链模型的ipTM = 0.78,pTM = 0.83,在数值得分上优于含糖链的模型,而生物学上不太合理的解决方案(如堆叠或角度陡峭的二聚体)得分较低(平均ipTM = 0.17;pTM = 0.59)。重要的是,在含糖链的模型中观察到的主要并排几何构型在无糖链的集合中不存在,这表明糖链可能稳定了这种排列。
在HADDOCK 3中,使用仅包含蛋白质的结构数据(不包括糖链)对这25个AlphaFold3模型进行了聚类和重新评分。识别出八个簇(最小簇大小=1),其中表现最好的簇(簇1)包含17个模型(平均HADDOCK得分=-218.8 ± 4.43),第二好的簇(簇2)包含两个模型(平均HADDOCK得分=-191.75 ± 4.06),而簇3-8各包含一个模型。
尽管AlphaFold3和HADDOCK 3的得分总体上相关,但它们的排名顺序并不完全一致(补充图2b-d)。例如,得分最高的AlphaFold3模型(运行1)对应于一个次优的HADDOCK簇(簇4),而排名第二的AlphaFold3模型(运行23)属于得分最高的HADDOCK簇(簇1)。整体上表现最好的结构(运行11)在结构上与运行23相似(RMSD = 0.62 ?),并且属于同一个簇(簇1)。运行11的ipTM = 0.53,pTM = 0.62,排名得分 = 0.55(AlphaFold3),HADDOCK得分 = -219.29,并随后被选用于HADDOCK中的受限二聚体对接(图3b)。
为了更好地理解局部结构差异,我们比较了使用Alphafold2 Multimer和Alphafold3(补充糖基化信息)建模的单独TssA和TssB N端结构域的结构。TssA N端结构域在两种Alphafold版本中的建模几乎相同,除了极点处的一个灵活环的位置略有不同(RMSD = ~0.86 ?)。TssB N端结构域在结构上定义得不够明确,特别是在其“顶部”部分。尽管如此,两种模型之间的结构差异相对较小(RMSD = ~0.84 ?)。
我们更仔细地研究了糖基化残基处的局部结构差异,以测试糖基化是否对使用Alphafold2 Multimer或Alphafold3生成的两种二聚体之间的残基级差异有显著影响,特别是关于二聚体的界面。为此,我们使用了HADDOCK3.0中的一个模块,该模块使用两个定义半径的球体(2.5 ?代表半乳糖的半径,5.0 ?代表分支寡糖的半径)来探测可被溶剂接触的表面积(模块‘sasascore’[34])。
在Alphafold2 Multimer模型中,没有实验确认界面区域内的潜在糖基化位点是糖基化的,尽管发表的质谱数据不足以证明界面中的一个潜在位点(TssBThr225)是否被占据[28]。将较小的球体应用于Alphafold2 Multimer二聚体时,TssA中有五个残基(TssASer338)和TssB中有十四个残基(TssBThr57、Thr93、Ser248、Thr318、Ser421、Ser439、Thr484)中的七个被标记为“不可接近”。使用较大的球体半径时,我们在TssA中检测到另外两个位点(TssASer50、Thr111),在TssB中检测到另外三个位点(TssBSer36、Thr235、Ser382)。这总共在Alphafold2 Multimer模型中发现了八个或十三个不可被溶剂接触的糖基化位点,而在二聚体的界面中没有任何位点。
Alphafold3二聚体特征是在其界面中有六个实验确认为糖基化的残基——TssASer62、Thr111和TssBSer36、Thr57、Ser439、Thr484[28]。将相同的模块应用于Alphafold3生成的二聚体,并使用较小的球体半径时,TssA中有五个残基(TssASer62,位于界面内)和TssB中有四个残基(TssBSer36、Thr235、Ser382、Ser421、Thr484,其中一个位于界面内)被标记为“不可接近”。使用较大的球体半径时,我们在TssA中检测到另一个位点(TssASer50,Thr111),在TssB中检测到另外三个位点(TssBSer36、Thr235、Ser382),这总共在Alphafold2 Multimer模型中发现了八个或十三个不可被溶剂接触的糖基化位点,而在二聚体的界面中分别有两个或四个。因此,与不考虑糖链的Alphafold2 Multimer模型相比,Alphafold3二聚体中糖基化位点的可溶剂接触性仅略有改善,而且由于糖基化导致的残基重新定位不太可能显著影响Alphafold3模型中的界面。相反,糖链本身可能有助于界面的稳定。
为了评估六个界面糖基化位点对二聚体形成的贡献,我们进行了十次额外的AlphaFold3运行,在这些运行中,这些位点被随机替换为选定的、可被溶剂接触的Ser或Thr残基(替换后的糖基化位点为TssASer62、Thr111到TssAThr158、Ser351和TssBSer36、Thr57、Ser439、Thr484到TssBThr153、Ser172、Ser288、Thr504)(补充表2)。替换后的运行产生了更多样化的结构解决方案,平均置信度得分较低(替换后:平均ipTM = 0.38,平均pTM = 0.50;原始:ipTM = 0.53,pTM = 0.62)。最常见的排列(运行#1-4和#9)将两个单体并排排列在相对偏移的位置,界面形成在TssA的底部面和TssB的糖基化顶部面之间。第二常见的排列(运行#5-7)也采用了并排配置,但界面形成在两个单体的底部面之间,而糖基化的顶部面暴露在溶剂中。两次运行(运行编号8和10)采样了与原始二聚体相似的几何结构(RMSD分别为1.05 ?和0.84 ?),不过TssA单体的底部朝向TssB单体旋转。总体而言,排列糖基化位点的运行产生了结构不一致的解决方案,pTM和ipTM得分降低。此外,这些排列在生物学上不太合理,因为将TssA的底部面置于界面处,糖链朝外,可能会导致蛋白质链的碰撞以及单元格组装的问题。这些结果表明,天然的界面糖基化位点对二聚体界面的形成有特定贡献,因为在糖基化位点排列后,原始二聚体的几何结构无法再现。
为了进一步验证和完善二聚体结构,使用了HADDOCK 2.4,它提供了一种基于物理的对接方法,与MSA驱动的AlphaFold预测相辅相成。HADDOCK允许使用用户定义的约束(随机采样的子集以增强构象采样)和明确的约束(严格执行的)。进行了三类对接运行:i) 无约束运行,仅由质心(CoM)约束引导;ii) 严格约束运行,对偏离正方形平面超过7.5 ?的偏差进行惩罚;iii) 松散约束运行,对偏离正方形平面超过12.5 ?的偏差进行惩罚。为了评估是否可以在没有AlphaFold3模型结构指导的情况下恢复AlphaFold3二聚体几何结构,我们首先进行了无约束的HADDOCK运行,在这些运行中仅施加了CoM约束以确保单体接触。没有应用基于之前生成的AlphaFold3模型的其他约束,也没有对非平面组装进行惩罚。值得注意的是,尽管缺乏约束,最高得分的无约束HADDOCK解决方案(HADDOCK得分 = -159.8)独立地收敛到了一个与AlphaFold3二聚体(RMSD = 1.10 ?,对应于AlphaFold3运行11;补充图3)和下面描述的受约束HADDOCK解决方案(RMSD = 0.94 ?)非常接近的几何结构。排名较低的簇虽然在能量上相似,但产生了生物学上不太合理的方向——包括倒置或严重倾斜的二聚体,其C末端方向不匹配。
3.4. HADDOCK 2.4对T. serpentiformis S层单元格八聚体的建模
假设T. serpentiformis S层晶格的p4对称单元格由TssA和TssB以大约1:1的比例组成。因此,一个单元格预计包含四个TssA和四个TssB分子,即四个以90°旋转对称性排列的TssA-TssB二聚体。为了验证这一假设,使用HADDOCK 2.4以C4对称方式对接了表现最佳的AlphaFold2 Multimer衍生和AlphaFold3/HADDOCK衍生的TssA-TssB二聚体,生成了候选单元格模型。
T. serpentiformis S层晶格的p4对称单元格由TssA和TssB以大约1:1的比例组成。因此,一个单元格预计包含四个TssA和四个TssB分子,即四个以90°旋转对称性排列的TssA-TssB二聚体。为了验证这一假设,使用HADDOCK 2.4以C4对称方式对接了表现最佳的AlphaFold2 Multimer衍生和AlphaFold3/HADDOCK衍生的TssA-TssB二聚体,生成了候选单元格模型。
四个基于AlphaFold2 Multimer的二聚体使用HADDOCK 2.4在平面C4配置中对称对接,受到两个相距3 nm的21 × 21 nm平面的约束。在得到的簇中观察到了多个重复的单元格几何结构。得分最高的排列(排名第一)在前十名簇中出现了四次,在前五名中出现了两次,表明收敛到了一个一致的解决方案(图4)。这种排列形成了一个四角星形的单元格,TssA单体位于中心,而TssB单体围绕外围弯曲。一些替代簇产生了不规则或生物学上不可行的几何结构,要么形成了过大的孔洞(>8 nm),要么在保持规则孔隙率的同时与晶格传播不兼容。
T. serpentiformis S层晶格的p4对称单元格由TssA和TssB以大约1:1的比例组成。因此,一个单元格预计包含四个TssA和四个TssB分子,即四个以90°旋转对称性排列的TssA-TssB二聚体。为了验证这一假设,使用HADDOCK 2.4以C4对称方式对接了表现最佳的AlphaFold2 Multimer衍生和AlphaFold3/HADDOCK衍生的TssA-TssB二聚体,生成了候选单元格模型。
使用HADDOCK 2.4对T. serpentiformis S层晶格的p4对称单元格进行了建模。T. serpentiformis S层晶格的p4对称单元格由TssA和TssB以大约1:1的比例组成。因此,一个单元格预计包含四个TssA和四个TssB分子,即四个以90°旋转对称性排列的TssA-TssB二聚体。为了验证这一假设,使用HADDOCK 2.4以C4对称方式对接了表现最佳的AlphaFold2 Multimer衍生和AlphaFold3/HADDOCK衍生的TssA-TssB二聚体,生成了候选单元格模型。
T. serpentiformis的细胞表面完全被一个周期性的二维晶体S层覆盖,这是已知的少数几个由两种不同的SLP(TssA和TssB)共同形成晶格的案例之一,这两种SLP都锚定在外膜LPS上[26]。在这项研究中,我们结合了表面电子显微镜、位点特异性糖基化数据[28]和进化保守性分析,对多种候选分子单元格几何结构进行了建模和评估。系统发育分析确定T. forsythia的TfsA和TfsB是TssA和TssB的最接近的同源物(图2,补充图1)。尽管细菌之间的S层在进化上具有广泛的多样性,但Tannerella ssp.的SLP在序列和结构域上异常保守(图2a)。与此一致的是,T. serpentiformis和T. forsythia具有相同的p4晶格对称性、相似的单元格尺寸,以及从外膜到细胞表面的相似距离(分别约为10 × 10 nm和约21 nm)(图1)。
我们应用了AlphaFold2 Multimer、AlphaFold3和HADDOCK 2.4/3来采样和评估TssA-TssB异二聚体,并组装p4对称的单元格候选者。每种方法都独立地收敛到了一个主要的二聚体排列:AlphaFold2 Multimer倾向于一个延长的、序列式的(“S形”)二聚体(15/25个模型;所有排名前五的模型的ipTM+pTM = 0.71)(图3),而AlphaFold3和HADDOCK则一致倾向于并排的二聚体(24/25个AF3运行和得分最高的HADDOCK簇,ipTM+pTM = 0.55)(图4)。这些差异与最近的CASP16观察结果一致,即i) AlphaFold2 Multimer高度依赖于MSA的深度,并可能受到浅层MSA的偏见[68]、[69]、[70]。尽管手动编译和自定义生成的MSA提高了本研究中单个TssA和TssB N端结构域的信心,但由于缺乏可用序列,相同的工作流程无法生成TssA-TssB异二聚体模型。这可能与细菌S层的高度多样性以及对于双SLP结构的结构洞察有限有关。ii) AlphaFold3较少依赖于进化耦合,并且能更好地处理序列多样性有限的异聚体复合体[50]、[68]。
本研究的一个关键结果是,向AlphaFold3提供实验性的糖基化模式显著减少了模型的不确定性,并有选择地丰富了生物学上合理的二聚体(补充表1)。值得注意的是,尽管几乎所有生物系统中的蛋白质糖基化都编码了重要信息[71],但在结构生物学领域,这一点迄今为止受到的关注相对较少——PDB条目中只有大约8%包含糖链结构[72],导致神经网络训练数据中糖基化结构的代表性不足。同时,糖基化在S层中非常普遍,在表面保护、结构稳定性和晶格间距方面起着明确的作用[28]、[73]、[74]、[75]。研究表明,蛋白质复合体的形成可能受到“糖链引导的组装”的驱动[21],其中限制糖链的运动会带来熵惩罚,因此有利于糖链自由蛋白质界面之间的相互作用。更广泛地说,本研究中提供的证据表明,糖链可能在复杂的组装中非共价地稳定蛋白质界面。通过将AlphaFold3二聚体模型界面上六个实验确认的糖基化位点随机排列到表面可访问的位置,足以防止原始二聚体几何结构的再现,表明它们的界面位置不是偶然的,而可能反映了特定的结构作用。结果表明,考虑糖链的建模比单独的进化耦合提供了更强的结构约束。重要的是,完全独立于MSA的HADDOCK也收敛到了相同的并排二聚体排列,这强调了将基于物理的方法整合到S层建模流程中的价值。
在将Tss S层糖蛋白排列成C4对称组装时,出现了两个关键趋势:i) 无论从哪种二聚体排列派生的单元格,都收敛到了结构上相似的架构,尽管起始几何结构不同(比较表2c,排名3和图4排名1);ii) 当放松或移除平面约束时,组装自然采用了浅“坑状”曲率,减小了单元格尺寸,并更接近实验观察到的晶格常数。这种向内弯曲的“坑”构型提供了稳定的TssA-TssA界面,形成了一个内部方块;更动态的TssB相互作用形成了一个外部环;朝向外部的糖链具有不受限制的构象灵活性;而保守的残基则位于面向膜或单元细胞表面[2],不会暴露在外部(补充视频1)。这种结构在功能上与T. forsythia中观察到的锯齿状S层轮廓[24]、Bacillus anthracis S层中看到的灵活的多接触域稳定机制[7]以及S层作为结构支架和柔韧但可变形的保护屏障的能力一致,因为需要始终保持细胞表面的连续S层覆盖。此外,“坑状”单元细胞组装中心约3.5纳米宽的方形孔洞(表2c,等级3)足够宽,可以容纳相关营养物质(例如葡萄糖或小肽)的通过,同时又足够小,可以阻止酶(例如淀粉酶或某些直径通常超过4纳米的蛋白酶)进入细胞。总体而言,我们提出“坑”状的p4单元细胞是T. serpentiformis S层最合理的生物学组装方式(表2c,等级3)。然而,我们强调可能存在多种密切相关的构型共存,需要额外的实验约束——包括交联质谱、冷冻电子断层扫描或高分辨率亚层平均技术——来明确界定接触界面。对所提出的复合物进行长期分子动力学模拟是未来工作的一个有价值方向,因为它们可能提供关于这些组装体稳定性和构象动力学的更多见解。然而,这些系统的巨大规模以及糖链的构象灵活性带来了重大挑战,超出了本研究的范围。更重要的是,适当的边界条件将强制形成二维晶格,这反过来又会有利于任何复合物的稳定性,因此很难对相互作用的稳定性得出可靠的结论。
5. 结论
在这项工作中,我们结合了表面电子显微镜、进化分析、糖基化数据和整合分子建模来研究T. serpentiformis的双蛋白S层。我们发现TssA和TssB组装成一个p4对称的晶格,其尺寸与相关细菌T. forsythia的尺寸非常接近,并且结合实验支持的糖基化信息显著提高了预测的TssA-TssB二聚体的生物学可行性。基于AlphaFold3或HADDOCK二聚体几何结构的模型表明了一种“坑”状的单元细胞排列方式,这与实验观察到的晶格间距一致,允许糖链自由移动,并表明TssA形成了一个稳定核心,而TssB提供了外围结构多样性。这些结果为多SLP S层的建模建立了一个潜在的工作流程,并为未来的高分辨率实验改进提供了结构框架,同时也为理解Tannerella S层的结构奠定了基础。
CRediT作者贡献声明
Muhammad Afzal:研究
Andreas Breitwieser:研究
Stephanie Grill-Walcher:写作——审阅与编辑,写作——初稿,可视化,研究,形式分析
Christina Sch?ffer:写作——审阅与编辑,监督,资金获取,概念化
Chris Oostenbrink:监督,资金获取
Alexandre Bonvin:监督,资源获取,资金获取
Dietmar Pum:形式分析
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
手稿准备过程中使用生成式AI和AI辅助技术的声明
在准备这项工作时,作者使用了ChatGPT来润色英语语言。使用该工具/服务后,作者根据需要审查和编辑了内容,并对发表文章的内容负全责。
资助
这项研究完全由奥地利科学基金(FWF)(资助CS,DOI: 10.55776/P33618)和生物分子蛋白质技术博士项目-BioToP(DOI: 10.55776/W122)资助。为了实现开放获取,作者对由此提交的任何接受版本的手稿作者应用了CC BY公共版权许可。AMJJB感谢Horizon Europe和欧洲高性能计算联合体(项目BioExcel,编号823830和101093290)的资助。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号