编辑推荐:
本研究针对真菌感染管理中抗真菌药物耐药性的重大挑战,探讨了临床耐药机制能否解释整个酵母菌谱系中广泛存在的天然耐药性。研究人员整合了来自酵母菌亚门近千个物种的基因组、生态和表型数据,并利用机器学习算法分析了菌株对八种抗真菌药物的耐药性进化。研究发现,不同药物的耐药性在系统发育分布上存在差异,其中氟康唑耐药最为普遍。基于基因组数据的随机森林模型可预测耐药菌株,准确率达54-75%。尤为重要的是,研究在关键蛋白Erg11上发现了一系列与天然氟康唑耐药相关的新变异位点,这些位点与已知临床分离株中的耐药位点截然不同,且具有更中性的生物物理特性。该研究提示,对非临床环境中天然酵母菌的耐药性研究,将有助于更全面地理解抗真菌药物耐药性问题,为应对日益严峻的真菌感染威胁提供了新视角。
在人类与致病真菌的持久战中,抗真菌药物是我们手中的关键武器。然而,一个日益严峻的挑战横亘在治疗的道路上:耐药性。对于免疫功能低下等易感人群而言,由念珠菌等酵母菌引起的侵袭性感染可能致命,而耐药性的出现使得标准疗法失效,治疗选择变得极为有限。长期以来,科学家们对耐药性的认知,主要来源于对临床环境中分离出的病原体(如白色念珠菌Candida albicans)的研究。这些研究揭示了特定基因突变如何赋予病原体对抗真菌药物的抵抗能力。但一个根本性问题依然悬而未决:这些在特定病原体中,因强烈药物选择压力而产生的“获得性”耐药机制,能否解释在整个庞大的酵母菌家族中广泛存在的、与生俱来的“天然”耐药性?换言之,自然界中那些从未接触过人类药物的酵母菌,为何也会对现代药物产生抵抗?探究这个问题的答案,不仅有助于我们理解耐药性产生的进化根源,还可能揭示出超越现有认知的全新耐药机制,为开发下一代抗真菌策略指明方向。
为了回答这个宏大的进化与医学问题,一支研究团队将目光投向了酵母菌的整个谱系。他们聚焦于一个古老而多样的类群——酵母菌亚门。这个亚门包含了从酿酒酵母到多种致病念珠菌在内的广泛物种,是研究真菌生物学和进化的绝佳体系。研究人员巧妙整合了来自Y1000+项目的大规模数据资源,该计划系统性地收集了超过1000种酵母菌的基因组、代谢特征和生态隔离环境信息。他们将这套丰富的“生命图谱”与另一项独立研究中获得的、针对532个酵母菌物种对八种临床相关抗真菌药物的耐药性表型数据相结合。这八种药物覆盖了三大类主要抗真菌药物:棘白菌素类、唑类和多烯类,以及两类次要药物。利用这套前所未有的跨物种、多维度数据集,研究人员运用机器学习、结构生物学和系统发育学等多种方法,开启了一扇理解天然药物耐药性生物学及其进化规律的新窗口。
为开展这项研究,作者主要采用了以下几个关键技术方法:首先,研究依托Y1000+项目构建的数据矩阵,包括基于InterProScan的基因组功能注释数据、菌株代谢生长谱数据以及标准化的生态隔离环境分类数据。其次,通过隐马尔可夫模型搜索和多重序列比对,获取并分析了酵母菌亚门中Erg11蛋白的同源序列。抗真菌药物敏感性数据则源自公开的菌种保藏中心记录,采用欧洲抗菌药物敏感性试验委员会推荐的微量稀释法测定。核心分析工具是随机森林机器学习算法,用于从上述多维数据中预测耐药性并识别关键特征。此外,还运用了包括MAFFT、Muscle5在内的多种序列比对方法,以及基于ESMFold的蛋白质结构建模和基于Rosetta的计算机深度突变扫描,来探究Erg11蛋白变异的结构与能量稳定性影响。最后,通过基于系统发育的D统计量分析和逻辑回归,评估了耐药性分布和特定氨基酸位点与表型关联的进化信号。
研究结果
1. 药物耐药性的分布在整个酵母菌亚门系统发育树上存在差异
通过将532个酵母菌物种对八种不同抗真菌药物的耐药性数据绘制在系统发育树上,研究人员发现耐药性的分布因药而异。其中,氟康唑耐药最为常见,34.2%的受测物种具有耐药性;而5-氟胞嘧啶耐药则较为罕见,主要集中于脂酵母目。总体而言,对任何一种药物的耐药性在酵母菌亚门中既非完全随机分布,也不能完全用共同的进化历史来解释,呈现出一种散发性重复出现的模式,暗示耐药性(或对类似功能化合物的抵抗)在酵母进化过程中曾多次独立产生,并可能具有适应性意义。
2. 随机森林算法识别出可预测耐药性的基因和序列特征
研究人员训练随机森林算法,利用基因组功能注释数据来预测耐药性,对八种抗真菌药物的预测准确率在54%至75%之间,其中对氟康唑的预测准确率最高(75.2%)。有趣的是,预测氟康唑耐药的最重要基因组特征并非已知的耐药相关基因(如Erg11),而是与细胞壁相关的功能注释,例如絮凝蛋白3型重复序列和X8结构域。这表明机器学习模型能够捕捉到可能通过改变细胞壁组成、菌落结构或膜通透性等间接机制影响耐药性的特征。
3. 不同的随机森林模型得出相似的氟康唑耐药预测准确度并指向相同的Erg11位点
鉴于Erg11蛋白是唑类药物已知的作用靶点,研究人员进一步训练模型,仅基于Erg11蛋白的氨基酸序列变异来预测氟康唑耐药。结果显示,仅使用Erg11序列的模型预测准确率与使用全基因组功能注释数据的模型相似。更重要的是,无论采用MAFFT、Muscle5等不同序列比对方法,还是基于结构的比对方法,所有模型都识别出Erg11蛋白中相同的少数几个位点作为最重要的预测特征,包括Y477、A313、M372等。
4. 部分被随机森林模型识别出的重要Erg11位点经实验证实可赋予耐药性
为了验证这些模型识别出的位点变异是否真的能导致耐药,研究人员查阅了已发表的针对白色念珠菌Erg11的深度突变扫描实验数据。结果显示,在他们预测出的前十个重要位点中,有五个位点的多种氨基酸替换被实验证实能显著增加对氟康唑的耐药性,包括最重要的位点Y477,以及A313、S506和V404。这证明随机森林模型确实捕捉到了一些具有功能效应的耐药相关变异。
5. 随机森林模型识别出的重要Erg11位点变异度更高且与临床耐药位点在空间上分离
深入分析发现,模型识别出的前十个重要Erg11位点,与以往在临床分离株中发现的36个耐药相关突变位点完全没有重叠。临床变异位点在酵母菌亚门中高度保守(变异度低),因此在基于自然变异的机器学习模型中缺乏信息价值。而模型识别出的重要位点则变异度显著更高。将这些位点映射到白色念珠菌Erg11蛋白的晶体结构上后,发现它们聚集在空间上的一个特定区域,与临床耐药位点(主要集中在活性位点或血红素结合口袋12埃范围内)明显分离。
6. 预测氟康唑耐药的重要Erg11变异比临床和实验获得的耐药变异更具能量稳定性
通过计算机深度突变扫描评估每个可能氨基酸替换对Erg11蛋白结构稳定性的影响,研究人员发现了一个关键区别:在酵母菌亚门自然菌株中实际观察到的Erg11变异,其预测的平均能量稳定性扰动显著低于从未被观察到的变异。更重要的是,已知的临床耐药变异或实验确定的耐药变异,其能量不稳定性与从未被观察到的变异类似,显著高于自然存在的变异。而模型识别出的最具信息性的自然变异,其能量扰动程度则小得多,属于最保守的变异之列。这表明,自然选择倾向于剔除那些严重破坏Erg11能量稳定性的变异,而临床环境中强烈的药物压力可能允许这些高成本变异被选择。
7. 共同的进化历史不能解释单个Erg11变异与氟康唑耐药之间的关联
为了排除模型识别出的重要位点仅仅是反映了物种间的系统发育关系(而非与耐药性直接相关),研究人员进行了考虑系统发育关系的逻辑回归分析。结果显示,模型识别出的前十个重要位点,即使在控制了系统发育关联后,仍然与氟康唑耐药性存在显著统计关联。这表明这些位点与耐药性的关联是稳健的,并非完全由谱系历史所驱动。
结论与意义
这项跨越酵母菌亚门532个物种的研究,深化了我们对临床环境之外耐药性如何进化的理解。研究发现,对八种抗真菌药物的不同水平耐药性广泛存在于整个亚门中,且氟康唑耐药尤为普遍。利用随机森林模型,可以基于基因组特征以中等准确度预测耐药性。值得注意的是,模型并未将已知的直接耐药基因,而是将与细胞壁完整性相关的基因家族变异识别为最重要特征,暗示机器学习能捕捉到通过间接分子机制影响耐药性的因素。
研究最关键的发现之一在于对关键靶点蛋白Erg11的深入分析。仅凭Erg11的氨基酸序列变异就能达到与全基因组数据相当的预测准确度,证实了该蛋白序列组成对耐药性的贡献。然而,此前在临床病原体中确定的经典耐药突变位点,由于在自然酵母菌群体中极度保守、几乎不存在变异,在本次预测模型中几乎不提供信息。相反,模型识别出一组全新的、变异度更高的Erg11位点。这些位点与临床位点在空间上分离,并且经计算机模拟和部分实验验证,其氨基酸替换对蛋白结构的能量稳定性破坏更小,因而在自然群体中更为常见。这支持了一个重要假说:自然耐药中涉及的变异,可能与临床环境中因强烈短期药物选择压力而产生的、往往伴随较大功能代价的“获得性”耐药变异不同。在复杂的自然环境中,微生物面临多重选择压力,自然耐药更可能涉及效应较小、能平衡耐药性与蛋白功能之间权衡的变异。
该研究强调,对临床“获得性”耐药的研究与对整个谱系“天然”耐药的研究具有互补价值。正如耳念珠菌等多重耐药新发病原体的出现所警示的,理解病原体所在整个谱系的生态与进化至关重要。大规模的全谱系分析能够捕捉自然变异,揭示那些在临床获得性耐药研究中难以发现的进化途径。最终,要全面理解并应对抗真菌药物耐药性这一全球健康威胁,必须将临床病原体获得性耐药的研究,与对那些从未在临床环境中出现过的、多种多样酵母菌物种天然耐药的研究结合起来,方能获得更完整的图景。