《Viruses》:Identification of a Key Hemagglutinin Mutation Mediating Antibody Escape in Influenza A(H1N1)pdm09 Viruses
Weili Song,
Chuan Wang,
Wenping Xie,
Yiqing Li,
Kaiyun Chen,
Wenjun Song and
Taijiao Jiang
编辑推荐:
这篇研究性论文(非综述)揭示了甲型流感病毒(H1N1)pdm09亚型通过血凝素(HA)蛋白130-loop区的关键K147N突变,逃避广谱中和抗体C12H5的分子机制。该研究整合机器学习(ESM-2模型、SHAP值分析)与实验验证,证实该突变在2023年流行株中高频存在,可导致中和活性显著下降(8倍HI滴度、约6倍微量中和)并为病毒带来复制优势,为优化广谱抗体疗法和疫苗更新预警提供了关键靶点。
1. 引言
甲型流感病毒是全球主要的呼吸道病原体,每年感染数百万人,具有较高的发病率和死亡率,给社会带来了沉重的负担。其表面糖蛋白血凝素(HA)是病毒入侵宿主细胞的关键,它介导病毒与宿主细胞受体的结合及随后的膜融合过程,同时也是宿主中和抗体的主要靶点。然而,HA通过抗原漂移和抗原转变不断发生突变,使病毒能够逃避免疫系统的识别和保护,从而在人群中持续循环,引发季节性流行甚至大流行。2009年出现的甲型流感(H1N1)pdm09病毒已在人群中持续季节性流行,并不断进化。2023年的主要流行株属于进化枝6B.1A.5a.2a及其衍生亚支,表现出显著的遗传和抗原性漂移。
广谱中和抗体C12H5是近年来报道的一种靶向HA受体结合域(RBD)的人源化单克隆抗体,能对多种H1N1和H5N1病毒株表现出交叉中和活性。然而,持续的突变积累对抗体的长期有效性构成严重威胁。传统单点突变实验通量有限,而深度学习模型尚未系统地应用于评估H1N1特异性广谱抗体的逃逸机制。本研究通过结合基于ESM-2大语言模型的机器学习预测与传统实验验证,系统评估了C12H5对2009年至2023年代表性H1N1毒株的交叉中和能力,并鉴定了导致中和逃逸的关键突变位点。
2. 材料与方法
本研究首先从GISAID数据库获取了2009年至2024年的48,762条H1N1 pdm09的HA序列,整合了Bloom实验室的深度突变扫描(DMS)数据,构建了基于ESM-2大模型的抗原-抗体结合预测模型。利用SHAP(SHapley Additive exPlanations)值分析等方法筛选候选逃逸位点。随后,选择了三个代表性毒株:2009年的起始株A/California/04/2009、2018年的中间株A/Guangdong/GLW/2018和2023年的当前流行株A/Guangzhou/4402/2023。通过序列比对,重点关注了HA1区域随时间推移的保守性变化,并结合机器学习预测,优先选择了位于Pa位点(K147)、Sa位点(N173)或Sb位点(A203/Q206)以及Cb边缘(E241)的五个候选位点进行后续验证。
通过基于质粒的反向遗传学系统,以CA/09病毒的HA基因为模板,利用定点诱变技术,构建了野生型重组病毒(rCA09-WT)和五个单点突变病毒(rCA09-K147N、rCA09-N173K、rCA09-A203T、rCA09-Q206E和rCA09-E241A)。通过血凝抑制(HI)试验、微量中和试验和病毒生长动力学分析,验证了这些突变对C12H5抗体的中和能力及病毒复制适应性的影响。所有病毒相关操作均在生物安全二级(BSL-2)实验室的生物安全柜中进行。
3. 结果
3.1. 机器学习模型筛选出关键候选逃逸位点
本研究构建的基于ESM-2的双分支预测模型在独立测试集上表现出色,展现出强大的抗原-抗体结合预测能力。利用SHAP重要性评分对HA1蛋白上约950个潜在突变位点进行评估,成功将候选范围缩小至五个高风险位点,按其综合优先级排序为:K147、N173、A203、Q206和E241。其中,K147位点在HA蛋白的130-loop区域内获得了最高的SHAP重要性评分(0.28),综合得分也最高(0.92),提示其可能是介导C12H5抗体逃逸的最关键位点。
3.2. K147N的结构定位与流行病学监测
结构定位分析显示,K147N位于Pa抗原位点的核心区域,紧邻受体结合位点(RBS),直接面向抗体结合界面。流行病学分析发现,K147N突变在H1N1pdm09病毒群中呈现出戏剧性的时间扩张趋势:从2009-2017年的零星检测(<1%),到2019年的16.2%,随后迅速固定,到2023年达到98.9%,2024年达到99.6%。地理分析显示,到2024年,该突变在全球主要地区已接近完全固定。这强烈表明该突变在免疫压力下受到了强烈的正向选择。
3.3. K147N是介导C12H5逃逸的关键突变
实验验证证实了计算预测。血凝抑制(HI)试验表明,C12H5对野生型病毒(rCA09-WT)的几何平均HI滴度为1:1024,而对含有K147N单点突变的病毒(rCA09-K147N)的滴度降至1:128,降低了8倍。其他四个候选突变(N173K、A203T、Q206E、E241A)与野生型相比则无统计学显著差异。微量中和试验结果与HI试验结果相互印证,显示K147N突变使中和滴度从8.3 log2降至5.7 log2,相当于降低了约6倍,这一降低幅度超过了界定流感抗原变异的常规≥4倍阈值,从功能上强有力地验证了其抗体逃逸表型。
3.4. K147N突变赋予病毒复制优势
除了介导免疫逃逸,研究还评估了K147N突变对病毒复制适应性的影响。一步生长曲线分析显示,在MDCK细胞中,rCA09-K147N突变病毒在感染中期至后期(24-72小时)的病毒滴度显著高于野生型病毒。在其他突变株中,仅A203T在12小时时表现出轻微的早期复制优势,而其余毒株的生长曲线与野生型基本重叠。这表明K147N突变不仅赋予了病毒逃避特定抗体的能力,还可能为其带来了特定阶段的复制优势。这种免疫逃逸和复制适应的双重优势,可能解释了该突变在自然流行毒株中被快速选择并固定的原因。
3.5. 计算预测与实验验证高度相关
系统性相关性分析表明,预测的结合概率下降与实验测量的HI滴度降低高度相关(Spearman ρ = 0.89),其中K147N的预测下降(0.58)与观察到的逃逸水平(约8倍)最为吻合。同时,模型预测的蛋白质稳定性变化(ΔΔG)也反映了突变体的复制适应性。例如,K147N近乎中性的ΔΔG(+0.8 kcal/mol)与其观察到的复制优势一致。这些结果共同验证了本研究所采用的“计算预测 → 实验验证 → 机制阐释”闭环研究范式的可靠性。
4. 讨论
本研究通过整合基于ESM-2大模型的机器学习预测与传统反向遗传学和功能实验,成功鉴定并验证了HA蛋白130-loop区域的K147N单点突变是介导C12H5免疫逃逸的核心机制。该突变使抗体中和滴度降低8倍(HI试验)和约6倍(微量中和试验),同时赋予病毒一定的复制适应优势。两种独立中和试验结果的高度一致,强有力地证实了这一发现的可靠性。
本研究所采用的机器学习方法在提升效率、系统性分析和预测可靠性三个维度上展现出独特价值。相比传统基于深度突变扫描(DMS)的大规模实验筛选,该模型能够在数小时内快速预测并优先排序所有可能的氨基酸替换,将验证范围从约950个可能性缩小至5个高风险候选位点,并利用SHAP分析进行定量排序,显著提升了研究效率。更重要的是,计算预测与实验验证结果在逃逸效应和复制适应性影响方面均表现出高度一致性,不仅证实了机器学习框架的可靠性,也确立了“计算预测→实验验证→机制阐明”这一闭环研究范式在病毒免疫学研究中的可行性。
结构上,K147位于130-loop的顶端,紧邻受体结合口袋。其侧链从带正电荷的赖氨酸(K)变为中性的天冬酰胺(N),可能通过局部静电相互作用或构象变化削弱抗体结合。与传统的“抗原性-适应性权衡”概念不同,本研究发现K147N在介导C12H5逃逸的同时,并未损害病毒的复制适应性。计算预测也表明K147N对蛋白质稳定性的影响较小,这与实验观察结果一致。这表明位于RBS边缘的某些位点可以超越传统的权衡框架,为病毒提供更“经济”的免疫逃逸途径,同时也对单表位广谱抗体策略提出了更严峻的挑战。
K147N与其它抗原突变(如Sa位点的S164T和Sb位点的A203T)的共现模式分析表明,这些突变可能在免疫逃逸中具有协同效应。没有检测到拮抗相互作用,表明K147N与多样的抗原漂变轨迹兼容,使其能够在多个亚支中被固定下来。
当然,本研究仍存在一些局限。所有实验均在体外细胞模型中进行,K147N突变在动物模型中的传播性和致病性尚待验证。抗体逃逸评估主要依赖于血凝抑制试验,尽管该方法应用广泛,但缺乏更精确的中和滴度或亲和力数据。此外,本研究仅验证了单点突变的效果,未考虑高频突变之间潜在的协同或拮抗相互作用。未来需利用深度突变扫描技术分析K147N与Sa区、Sb区高频突变间的相互作用,并借助冷冻电镜技术和分子动力学模拟深入解析其分子机制。
5. 结论
本研究通过整合机器学习预测与多试验验证,系统阐明了甲型H1N1流感病毒HA蛋白130-loop区K147N单点突变介导免疫逃逸的分子机制。该突变被计算模型成功预测,并经实验证实可显著降低抗体C12H5的中和活性(HI试验降低8倍,微量中和试验降低约6倍),同时赋予病毒复制优势。两种独立中和试验的一致结果确立了K147N作为具有免疫逃逸和病毒适应性双重优势的关键逃逸突变的重要地位,暗示了其关键的适应性进化意义。K147N在全球H1N1pdm09群体中近乎完全的固定(至2023-2024年>98%),对C12H5及类似广谱中和抗体的临床开发具有重要提示意义。这一发现为优化广谱抗体、更新流感疫苗以及建立主动的疫情预警机制提供了关键分子靶点和理论依据。