SKALE：一种可解释的多尺度机器学习模型用于解码神经退行性蛋白病中相特异性蛋白质聚集

《Aggregate》：SKALE: An Interpretable Multiscale Machine Learning Model for Decoding Phase-Specific Protein Aggregation in Neurodegenerative Proteinopathies

【字体：大中小】 时间：2026年01月29日 来源：Aggregate 13.7

编辑推荐：

　　本文推荐一篇名为《SKALE：一种可解释的多尺度机器学习模型用于解码神经退行性蛋白病中相特异性蛋白质聚集》的重要研究。该研究开发了SKALE（可扩展动力学与聚集学习引擎）框架，创新性地整合了序列基序、AlphaFold预测的结构描述符和实验动力学参数，实现了对蛋白质聚集机制的多尺度、可解释性解码。文章通过ALS相关SOD1 G86R和TDP-43 S332N等案例验证，表明SKALE能识别传统工具遗漏的潜在聚集热点，并揭示β-折叠倾向性等共享决定因素，为理解错误折叠分子逻辑和指导治疗设计提供了强大工具。

1 引言

理解为何某些蛋白质变体保持可溶而其他迅速聚集，需要一个整合原子结构、折叠动力学和细胞环境的框架。肌萎缩侧索硬化（ALS）的一个明确病理学标志是错误折叠蛋白质的细胞内聚集，最显著的是TAR DNA结合蛋白43（TDP-43）和铜/锌超氧化物歧化酶1（SOD1）。尽管存在差异，这两种蛋白质通过包括氧化应激、细胞器功能障碍和神经炎症级联激活在内的趋同机制破坏细胞稳态。神经炎症越来越被认为是ALS神经退行性的核心驱动因素，并与蛋白质错误折叠紧密交织。聚集蛋白质可以作为危险相关分子模式，激活先天免疫传感器，如cGAS-STING通路，触发I型和II型干扰素反应。这一级联建立了一个自我延续的循环，其中激活的小胶质细胞和反应性星形胶质细胞释放促炎细胞因子，放大神经元应激并加速运动神经元死亡。一个关键未解答的问题是特定突变如何重塑内在聚集动力学和结构稳定性，从而差异性地启动这种炎症信号。

SOD1是家族性ALS最早和最常见的遗传原因之一，为解答这个问题提供了一个易于处理的模型。已记载超过200种SOD1变体，涵盖广泛的临床表型和疾病进展速率。聚集是SOD1连锁ALS中的一个核心致病事件，在运动神经元和周围胶质细胞中均检测到包涵体。生物物理学研究阐明了金属结合、二硫键形成和局部构象不稳定性在SOD1错误折叠中的贡献，但这些方法资源密集，且常常产生对本质是动态过程的事件的静态视图。

计算方法已成为实验分析的重要补充。第一代基于序列的算法从物理化学属性（如疏水性和β-折叠倾向性）估计聚集倾向区域（APR），但很大程度上忽略了三维结构背景。这一限制对于如SOD1这样的球状蛋白质尤其重要，其中许多APR位于埋藏疏水核心并被溶剂屏蔽，导致经常高估聚集风险。进一步的限制是当局部氨基酸组成改变最小时，它们无法区分野生型（WT）和突变体序列。因此，这些工具预测WT和突变蛋白质具有相同的热点区域，尽管有大量实验证据表明许多突变体比WT聚集更快更广泛。结构信息预测器通过纳入折叠构象和表面疏水性部分缓解了这些问题，但它们仍然受计算成本和高质量结构数据可用性的限制。

AlphaFold等高精度结构预测方法的出现扩展了基于结构方法的潜力，但这些方法仍然无法捕捉聚集的完整动力学连续体或细胞环境的影响。当代机器学习模型通过利用复杂的序列-结构模式提高了预测准确性，但许多作为不透明的“黑匣子”运行，缺乏机制可解释性，并且与物理化学原理脱节。蛋白质聚集本质上是一个多尺度过程，但大多数现有模型未能将原子水平相互作用与分子动力学和细胞尺度结果联系起来。缺乏一个统一这些尺度并区分突变特异性聚集行为的整合框架仍然是预测和机制洞察的主要障碍。

本文介绍SKALE（可扩展动力学与聚集学习引擎），一个整合的多尺度机器学习框架，旨在预测和机制性地剖析蛋白质聚集。SKALE整合了序列衍生描述符、AlphaFold预测的结构特征、分子动力学和实验测量的动力学参数，以捕捉控制聚集行为的微妙突变特异性相互作用。其可解释的架构重建动力学轨迹并识别跨聚集阶段的主导分子决定因素，将原子扰动与细胞后果联系起来。

我们在SOD1变体的聚集动力学和结构特性的大量实验数据集上验证SKALE，并用TDP-43对其通用性进行基准测试，其中它识别了传统工具遗漏的隐蔽聚集热点。在SOD1中，SKALE展示了诸如改变的氢键几何形状或增加的溶剂暴露等适度变化如何显著改变聚集倾向。通过绘制从成核到原纤维成熟的连续体，SKALE为合理的、相靶向治疗策略建立了一个机制框架。除了ALS，SKALE可推广到tau病相关的Tau P301L和朊病毒蛋白E200K，并且对朊病毒疾病和系统性淀粉样变性病具有更广泛的潜在相关性，提供了一个可扩展和可解释的平台，将不同蛋白病中的分子结构与细胞病理学联系起来。

2 结果

2.1 用于预测聚集动力学的可解释多尺度机器学习框架

为了预测病理性蛋白质聚集并捕捉其在多个生物尺度上的动态行为，我们开发了SKALE，一个多尺度机器学习平台。SKALE整合了氨基酸基序、物理化学属性和AlphaFold衍生的结构描述符，如氢键、溶剂可及性和波动动力学，以及来自硫黄素T（ThT）聚集实验的实验测量动力学参数。这些输入被整合到一个多尺度特征矩阵中，为执行分类和回归任务的监督机器学习框架提供信息。该平台生成聚集倾向的定量预测，模拟相特异性动力学轨迹，并纳入SHAP（沙普利加性解释）来解析成核、延伸和饱和阶段的机制决定因素。通过将可解释性嵌入其预测框架，SKALE在提高准确性的同时，揭示了个体结构和能量特征如何影响聚集进程。 resulting 输出包括聚集风险图、模拟动力学和相解析特征图谱，支持聚集驱动疾病中的机制见解和转化应用。

我们首先使用WALTZ-DB 2.0数据集将SKALE的分类性能与逻辑回归基线和特征受限的极限梯度提升（XGBoost）模型进行基准测试。SKALE实现了0.94的曲线下面积（AUC），显著优于基线模型（AUC = 0.87）。它还提供了更高的准确度（0.883 vs. 0.788）、精确度（0.900 vs. 0.771）、召回率（0.836 vs. 0.761）和F1分数（0.867 vs. 0.766）。相比之下，仅基于序列衍生和物理化学描述符训练的独立XGBoost分类器实现了0.87的AUC（基线AUC = 0.85），并显示出降低的准确度（0.82）、精确度（0.76）、召回率（0.70）和F1分数（0.73）。这些比较突显了即使采用先进算法，仅序列模型也无法完全解析聚集风险。结构描述符和能量描述符的整合显著提高了预测性能，并确立SKALE为一个强大的平台，用于识别超出传统基于序列预测器范围的聚集倾向肽。

然后我们通过模拟WT SOD1和ALS相关G86R突变体在存在槲皮素（一种通过稳定天然构象抑制淀粉样形成的类黄酮）的情况下的ThT荧光轨迹来测试SKALE模拟动态聚集行为的能力。G86R突变位于β-链5-7和Zn²⁺结合基序IV的环紧接C端的β-链内，引入了一个带正电荷的精氨酸， destabilizes the β-桶支架，增加溶剂暴露和成核倾向。SKALE正确地再现了WT SOD1的S形聚集曲线（R = 0.92），并捕捉到G86R中槲皮素介导的抑制，这使ThT荧光相对于WT减少超过两倍。通过将β-折叠含量、静电扰动和水合层效应纳入其预测，SKALE有效地将结构去稳定和小分子稳定直接与 emergent 动力学结果联系起来。该平台不仅仅是匹配终点指标，而是模拟轨迹如何在内在扰动和外在调节器下演化。

为了进一步检查SKALE的通用性，我们模拟了WT SOD1在五个浓度（15、20、25、30和35 μM）下的聚集。SKALE成功地重现了实验观察到的浓度依赖性聚集加速，预测在升高浓度下更短的滞后阶段和更高的平台强度。在30 μM时，该模型还预测G86R相对于WT更快的聚集，与突变体增强的成核潜力一致。在所有测试条件下，预测和实验曲线强烈相关（R = 0.96），反映了模型捕捉控制聚集动力学的环境影响和突变驱动扰动的能力。

2.2 局部结构去稳定化揭示了序列模型遗漏的隐蔽SOD1聚集热点

在动力学分析的基础上，我们接下来评估了SKALE解析SOD1中局部聚集热点的能力，特别是在传统基于序列的预测器忽略的区域。传统算法如WALTZ倾向于标记残基15-23处的单个N端热点，并且无法识别埋在折叠结构域内的隐蔽位点。为了建立基线，我们训练了SKALE的仅序列版本并评估其对WT和G86R的预测。正如预期，该模型仅识别了一个对应于残基15-23的高风险区域，WT和突变体之间差异最小。结果与WALTZ网络服务器输出紧密匹配，强调了仅序列方法对于球状蛋白质的局限性，其中微妙的结构扰动驱动致病性。

相比之下，完整的SKALE平台整合了AlphaFold衍生的结构指标，包括二级结构、氢键、溶剂可及表面积（SASA）和动态灵活性特征，为WT和G86R SOD1生成全面的聚集图谱。AlphaFold预测的模型表现出高结构可靠性，每个残基预测局部距离差异测试（pLDDT）置信度图谱显示WT和G86R的全局平均值分别为98.1 ± 2.1和97.3 ± 2.6。两个变体中的最低置信度残基保持在80以上，与缺乏本质无序区域的高分辨率折叠一致。在对应于G86R替换的残基86处，pLDDT值从WT的98.9下降到G86R的92.6，局部平均值（±10个残基）分别为98.7和96.6，反映了模型确定性的轻微和局部降低。高置信度分数的整体连续性为定量特征推导和下游聚集分析建立了一个稳健的框架。使用这些结构验证的输入，SKALE的滑动窗口聚集图谱被计算并使用单侧Wilcoxon符号秩检验和错误发现率（FDR）校正进行统计评估。识别了几个APR，包括一个显著的跨越残基72-91的热点，在G86R中显示聚集风险比WT增加超过两倍（调整后FDR ≤ 0.05）。该片段整合了β-链5-7和Zn²⁺结合基序，这些在结构完整性中起重要作用。此外，SKALE还突出了G86R中C端结构域的广泛聚集倾向升高，集中在残基86附近。相应的氢键（H-bond）图谱（ΔH-bond，G86R-WT）显示在残基81-91内稳定相互作用的局部损失，表明突变破坏了β-桶内的骨架键合。

为了测试该热点是否反映了β-链错位或改变的链间几何形状，我们量化了β-片层注册和角度关系。人SOD1形成一个八链β-桶，排列为β1–β8，具有特征性的发夹；G86R位于β5上，靠近桶中心。注册位移分析表明保留了对齐。全局分布在零处崩溃，所有比较对齐（0-残基位移；58/58对），并且在位置86的15个残基内未检测到位移（0-残基位移；14/14对）。然后我们按拓扑对链对进行分类。β-链段从连续的DSSP“E”运行中定义。发夹对是由最多五个残基分隔的连续链。面对发夹内环连接伙伴的位置被标记为“内部”。其最近的β-链伙伴位于发夹外的位置被标记为“外部”，并使用7 ?截止值的K维（KD）树识别。使用该方案，内部链以零为中心，具有紧密分散（N = 55，平均值±SD ≈ 0.00 ± 0.19；计数-1/0/+1 = 1/58/1），外部链显示类似模式（N = 59，平均值±SD ≈ 0.00 ± 0.13；计数-1/0/+1 = 1/58/1）。独立的角几何进一步支持保留的堆积。局部链切线之间的α-角分布在分离0、2或至少3条链时在WT和G86R之间无法区分（Kolmogorov-Smirnov [KS] p = 0.997, 0.998, 0.998；Mann-Whitney U [MWU] p = 0.758, 0.735, 0.961）。这些注册计数、内外分解和α-角测试表明β-片层完整性在G86R中得以维持，没有链滑动或改变的链间几何形状的证据。

受此结果指导，我们接下来量化氢键占据率和供体-受体距离以解析热点下的特定键合缺陷。减少的占据率表明跨构象体的键形成频率较低，信号局部去稳定化或部分展开。增加的供体-受体分离超出典型的2.7–3.2 ?范围反映了较弱的键强度。在G86R中，占据率在残基86附近急剧下降，伴随着供体-受体距离的增加。这些转变对应于β-桶内骨架完整性的丧失，特别是在残基80-95之间。该区域与SKALE预测的聚集热点精确重叠，加强了模型在捕捉突变诱导破坏方面的机制准确性。

然后我们询问这些氢键变化是否与更广泛的物理化学扰动共变。氢键计数（G86R-WT）对疏水性、体积、静电电荷和SASA的线性回归分析揭示了几个趋势。在G86R中更密集聚集的疏水残基显示氢键计数减少，斜率为4.05，表明增加的疏水堆积干扰了极性稳定，创造了有利于聚集的环境。与侧链体积的负相关（斜率 = -0.15）表明来自体积较大侧链的立体阻碍取代了天然键合伙伴， destabilizes the local fold。同样，与静电电荷的陡峭负相关（斜率 = -16.61）反映了由精氨酸取代引入的电荷不平衡引起的去稳定化。最后，增加的溶剂暴露也与氢键减少相关（斜率 = -0.13），暗示水合动力学在削弱结构内聚力中的作用。在所有分析中，G86R作为一个清晰的异常值出现，与其作为生物物理破坏者的角色一致。

然后我们检查了这种局部去稳定化是否也改变了溶剂暴露。跨SKALE识别的热点72-91片段的SASA图谱显示G86R中持续升高的表面积，在位置86处达到峰值。用精氨酸替换甘氨酸引入了立体体积和带正电荷的胍基团，改变了局部堆积和水合。分子表面比较支持这种解释。WT中位置86的甘氨酸是紧凑且部分埋藏的，而G86R中的精氨酸投射到溶剂中并扭曲了β-桶拓扑。溶剂暴露的这种增加加剧了由氢键缺陷检测到的去稳定化，并与预测的聚集潜力上升一致。静电映射提供了进一步的见解。精氨酸替换在位置86引入了+1的净正电荷，创造了WT中不存在的局部电荷不对称。序列范围的静电热图在突变位点显示出一个尖锐的尖峰，而邻近残基保持中性。结构、静电和水合分析共同将残基86确定为一个焦点，其中氢键、溶剂可及性、电荷、疏水性和立体体积协同去稳定化折叠。这些协同效应验证了SKALE将残基72-91识别为ALS连锁SOD1中结构脆弱的APR，即使在掩蔽pLDDT低于70的残基后，预测也保持稳健，因为基线和掩蔽的聚集分数对于WT和G86R都紧密沿着同一性线聚集。

为了评估这种敏感性是否扩展到G86R之外，我们分析了四个额外的临床相关SOD1变体：D90A、G93A、E100G和G127R。这些突变涵盖了一系列表型和结构背景。尽管仅引入微妙的全局偏差（均方根偏差，RMSD < 1.0 ?），G127R成为局部构象应变的一个异常值。虽然D90A、G93A和E100G保留了在规范范围内的骨架扭转角，但G127R表现出从链状到线圈状Ramachandran几何的显著转变（Φ = 76.3°, Ψ = 9.9° 在WT中到 Φ = 65.6°, Ψ = 26.0° 在突变体中），位于结构化和柔性区域的界面。令人惊讶的是，这种拐点并未引发聚集风险的广泛升高。相反，SKALE预测了一个尖锐的局部热点在残基130-140，直接位于突变位点C端，其中风险超过两倍生物学阈值。这种焦点变化与氢键减少和残基127-128处SASA的尖峰相吻合，表明该片段中屏蔽容量减少。

关键的是，传统预测器如WALTZ、PASTA和AGGRESCAN在G127R基因座附近未检测到变化。相比之下，SKALE识别了一个与局部应变相关的从头聚集热点。通过整合额外特征，如氢键网络和溶剂暴露，SKALE揭示了一个隐蔽的结构脆弱性，指向一个非规范致病通路。该结果说明了SKALE如何超越序列启发式方法并解析传统工具仍然不可见的微妙但疾病相关的扰动。

2.3 β-结构和氢键作为蛋白质聚集风险的主要决定因素

为了揭示SKALE预测的机制基础，我们调查了哪些生物物理特征最强烈地影响分类结果。使用SHAP，我们对特征贡献进行排名并可视化它们对聚集风险的个体影响。该分析揭示SKALE学习了一个结构和物理化学描述符的协调层次结构，使模型能够从机制上有意义的相互作用推断聚集风险，而不是孤立的统计相关性。

在所有特征中，平行β-折叠倾向 emerged as the most influential determinant。较低的平行分数与全局水平较高的预测风险相关。在G86R背景下，天然β-片层注册和链间几何形状得以保留，因此残基72-91内增加的风险并非源于β-片层重新堆积。相反，它反映了由其他特征捕捉的局部去稳定化，包括天然氢键的削弱和该窗口中更大的溶剂暴露。骨架氢键（Backbone_Hbond）特征在全局分析中也排名很高，与模型加权支持有序堆叠的模式一致。这种全局决定因素与测量的天然氢键占据率不同，后者在G86R热点中下降。

除了β-折叠含量，溶剂化疏水性（Solvation_Hydrophobic）和β-折叠不对称性[β-sheet (α-parallel)]也具有影响力。变得更具疏水性和溶剂暴露的区域显示更高的预测风险，与暴露的疏水斑块自我关联的趋势一致。同样，降低的平行β-折叠分数和增加的反平行倾向也与升高风险相关，表明β-架构的变化 loosens native packing and favors aberrant strand interactions。侧链氢键（Sidechain_Hbond）也放大了聚集分数，特别是在溶剂暴露的背景下。屏蔽不足的极性侧链可以通过瞬时相互作用稳定中间寡聚体，为原纤维延伸提供支架。值得注意的是，传统预测器如WALTZ排名低于这些结构信息特征，突显了SKALE多尺度上下文学习的优势。

结构异质性和构象可塑性是额外的决定因素。局部体积（volume_sd）、β-折叠含量（sheet_sd）和二级结构波动的变异性，包括螺旋（helix_sd）和转角流动性（Turn_sd），通过反映局部灵活性塑造了易感性。从多样化训练集学习的这种特征层次结构使SKALE能够推广到本质无序蛋白质如TDP-43，其中螺旋动力学调节聚集风险而不降低天然β-折叠含量。SKALE进一步识别部分无序或环丰富片段当动态波动瞬时暴露APR时是脆弱的。额外的物理化学因素，包括溶剂化极性（Solvation_Polar）和静电（Electrostatics），通过次优水合或电荷不平衡去稳定天然折叠而促成风险。虽然平均体积（volume_mean）和主链熵（Entropy_mainchain）排名略高，但它们的效果遵循相同的趋势，其中较大的侧链和减少的骨架熵使区域易于聚集。

为了探究功能相关性，我们检查了SHAP依赖图。聚集风险以阈值样方式随着溶剂化疏水性增加。一旦归一化疏水性超过约-0.5，小的增量产生风险的大幅增加。这种效应与侧链氢键（Sidechain_Hbond）协同作用，其中增加的极性暴露增加了进一步的风险。这些瞬时氢键可能通过稳定早期聚集中间体来支持寡聚体形成，而不是稳定天然折叠。同时，下降的骨架熵（Entropy_Mainchain）减少了β-折叠堆叠的构象障碍，并使得有序聚集体的形成成为可能。疏水性、极性侧链和减少熵的收敛定义了淀粉样变性的复发生物物理模式。总体疏水性（Hydropathy_mean）进一步强化了这一观点，显示与聚集倾向正相关。

关键的是，骨架氢键（Backbone_Hbond）也显示与聚集风险强烈的正相关。SKALE捕捉到了细微差别，即密集的氢键网络稳定天然折叠并在促进有序堆叠时促成聚集。这种区别说明了模型分离功能性氢键与那些促进发病的能力。比较分析进一步支持这种解释。SKALE一致地捕捉了跨β-折叠形成倾向的量化的非线性依赖性，由PASTA_parallel和PASTA_antiparallel量化。较低的平行分数与较高风险相关，而较高的反平行分数与增强的聚集潜力一致。Chou-Fasman β-折叠倾向也与其全动态范围正相关。总之，SHAP结果区分了全局决定因素和突变局部机制。在G86R中，β-折叠核心保持对齐，而残基72-91内升高风险由模型捕捉的天然氢键削弱和溶剂暴露增加解释。跨蛋白质，聚集源于溶剂化、熵约束、氢键模式和β-架构在特定结构背景下的组合效应。

2.4 无序TDP-43 S332N含有通过结构去稳定化揭示的突变特异性聚集热点

在球状SOD1中建立性能后，我们接下来评估了对具有广泛本质无序的蛋白质的通用性。我们选择了TDP-43，一个与ALS相关的关键RNA结合蛋白，它提供了一个严格的测试案例，因为它结合了折叠的N端结构域和低复杂性、本质无序的C端区域。这些特征使TDP-43高度易于聚集，但对计算预测具有挑战性。

我们专注于临床报道的S332N变体，一个在家族性ALS中识别的TDP-43错义突变。该突变位于TDP-43的富含甘氨酸的低复杂性C端结构域内，该区域包含许多ALS相关突变并构成ALS中致病原纤维核心的一部分。我们最初的分子动力学模拟显示该突变诱导了显著的局部结构扰动。每个残基RMSD图谱显示突变位点下游显著的构象可塑性，值超过20 ?，特别是在一个α-螺旋片段内。尽管全局折叠保持完整，扭转位移分析表明骨架几何的局部转变，从WT中的Φ = -74.0°, Ψ = -23.6° 到S332N中的Φ = -70.2°, Ψ = -28.1°。这些改变表明局部应变和堆积破坏，并激励更深入的结构评估。

为了评估TDP-43中S332N替换的结构后果，我们首先使用注册位移分析量化β-链注册。全局分布尖锐地以零为中心，所有链比较对齐（0-残基位移；88/88）。在位置332的±15个残基内，未检测到局部β-链。按片层拓扑划分同样显示无注册变化。补充这些注册测试，我们分析了从DSSP注释的β-链衍生的局部链切线之间的α-角分布。跨分离0、2或≥3条链，WT和S332N的角分布无法区分，具有重叠的频率分布和通过KS和MWU检验的非显著差异。这些数据表明β-片层堆积未被突变扰动。建立在这种稳定性上，我们接下来检查了替换是否扰动α-螺旋组织。跨所有螺旋的全局注册位移分析显示无系统性位移，而在位置332的±15个残基内的局部分析识别了突变体中一致延伸六个残基。螺旋边界映射确认相同的起始位置但S332N在残基340处的端点相对于WT的334延伸，产生螺旋长度增加六个残基。

S332N突变通过深刻影响TDP-43 C端螺旋的稳定性和程度来实现这种延伸。尽管有来自扭转分析的局部骨架变化的证据，整体结构得以维持，没有诱导主要的全局重新定向。局部弯曲角的四残基滑动窗口分析显示在叠加的公共片段324-329上WT和S332N几乎重叠的扭结图谱。关键的是，该跨度上全局螺旋轴之间的最小折叠差异，仅测量~0.13°，确认了相对于蛋白质体的螺旋无检测到的重新定向。然而，在位置332周围的±15-残基窗口内，螺旋性从WT的48.4%急剧上升到S332N的67.7%。螺旋参数分析精确地捕捉了伴随这种增强螺旋性的微妙几何转变。相对于WT片段，S332N螺旋证明了每个残基平均上升从1.600 ?到1.626 ?的适度增加，平均半径从2.26 ?到2.28 ?的边际增加，和平均角扭转从101.1°到98.9°的轻微减少。这些值对应于WT和S332N分别为3.56和3.64个残基每转，牢固地确立了两个片段都保留规范α-螺旋几何。集体地，这些数据证明S332N增加了残基332周围的局部螺旋性并延伸了C端α-螺旋，具有轻微的螺距 loosening 和保留的螺旋方向与β-片层堆积。这些特征提供了SKALE通过二级结构倾向性和动态灵活性描述符捕捉的结构输入。

受这些局部结构变化指导，我们询问SKALE是否检测到跨TDP-43的残基水平聚集倾向的相应转变。该模型报告了S332N相对于WT的预测聚集风险的全局增加。尽管广泛升高，统计分析识别了两个离散区域（残基85-103和313-337）超过了预设的严格阈值（倍数变化 ≥ 2.0；FDR ≤ 0.05）。两个片段都 emerged as mutation-amplified hotspots。预测风险的上升与这些窗口内局部氢键的显著减少相吻合。传统预测器如WALTZ、PASTA和AGGRESCAN标记了TDP-43内的组成性APR；然而，它们未能识别突变位点附近的热点作为S332N中独特去稳定的。溶剂暴露测量支持突变特异性效应，在S332紧接C端具有更高的SASA，特别是在残基333-337。与跨313-337的氢键减少一起，这些观察确立S332N增加溶剂暴露并削弱残基332附近的局部氢键，创造一个成核易感环境。

我们接下来使用TDP-43 S332N和SOD1 G86R变体中的缺失构建体在细胞中验证这一预测。设计缺失以选择性移除SKALE预测的片段或传统工具标记的区域。构建体包括单一位点缺失（P1–P3）、双区域缺失（P4）和来自基于序列预测器的更广泛组合（P0, P5）。这些构建体在HEK293T细胞中瞬时表达，并使用8-苯氨基萘-1-磺酸（ANS）荧光量化它们的相对聚集状态。ANS是一种小的疏水染料，优先结合蛋白质的暴露、非极性区域。增加的ANS信号作为错误折叠构象的替代物，提供了天然裂解液中聚集倾向疏水暴露的敏感测量。正如预期，全长G86R SOD1显示比WT显著更高的ANS荧光，与其由于破坏的β-桶完整性更容易错误折叠和聚集的已知趋势一致。SKALE热点的缺失（P1: Δ72

热点排行

新闻专题