综述:利用人工智能和生物信息学对抗耐甲氧西林金黄色葡萄球菌:基因组监测、诊断和治疗领域的创新

《Journal of Infection and Public Health》:Harnessing AI and Bioinformatics to Combat Methicillin-Resistant Staphylococcus Aureus: Innovations in Genomic Surveillance, Diagnosis, and Therapeutic Development

【字体: 时间:2026年05月07日 来源:Journal of Infection and Public Health 4

编辑推荐:

  萨姆森·A·阿德耶米(Samson A. Adeyemi)| 托卢洛佩·A·奥沃拉比(Tolulope A. Owolabi)| 雅赫亚·E·丘纳拉(Yahya E. Choonara) 南非约翰内斯堡威特沃特斯兰德大学健康科学学院治疗科学系药学与药理学系 Wits先进药

  萨姆森·A·阿德耶米(Samson A. Adeyemi)| 托卢洛佩·A·奥沃拉比(Tolulope A. Owolabi)| 雅赫亚·E·丘纳拉(Yahya E. Choonara)
南非约翰内斯堡威特沃特斯兰德大学健康科学学院治疗科学系药学与药理学系
Wits先进药物递送平台(WADDP)研究组

**摘要**
全球范围内抗菌素耐药性(AMR)的上升,特别是耐甲氧西林金黄色葡萄球菌(MRSA)的蔓延,对公共卫生构成了重大挑战,迫切需要创新策略进行监测、诊断和治疗。人工智能(AI)、机器学习(ML)和生物信息学领域的进展通过实现基因组、临床和流行病学数据的高通量分析,正在改变传染性疾病的管理方式。本文探讨了AI和生物信息学在抗击MRSA中的应用,重点关注早期检测、耐药机制分析以及靶向疗法的开发。文中讨论了包括全基因组测序(WGS)工作流程、泛基因组分析和分子分型工具在内的关键平台,以及AI驱动的风险评估、抗菌肽设计、药物重新利用和耐药性建模方面的创新。Next Gen Diagnostics、DeepARG和PyTorch_EHR等案例研究展示了诊断准确性的提高、周转时间的缩短以及对经验性治疗的支持。此外,本文还讨论了临床实施中的挑战,并强调了整合AI的方法在精准医疗和有效控制MRSA方面的未来潜力。

**引言**
抗菌素耐药性被公认为一个全球性的公共卫生紧急问题,其形成受到多种流行病学和经济因素的影响,促使世界卫生组织(WHO)制定了应对这一挑战的战略行动计划[1]。抗生素是医院和门诊环境中常用的药物之一。然而,许多处方的药物使用不当或剂量不准确;例如,广谱抗生素经常以不适当的剂量使用或用于需要更特定治疗的疾病。抗菌素的滥用导致了多重耐药(MDR)病原体的出现。MDR细菌感染的扩散显著增加了患者的死亡率、延长了住院时间,并提高了医疗成本[2]。
金黄色葡萄球菌是一种属于葡萄球菌科的革兰氏阳性细菌,直径约为1微米,通常以类似葡萄的簇状形式存在。这种细菌通常作为共生菌存在于人体各部位,包括皮肤和黏膜以及健康人的鼻腔和胃肠道[3]。金黄色葡萄球菌具有多种毒力因子,并能对大多数抗菌素产生耐药性。由于不断出现新的菌株,金黄色葡萄球菌被称为超级细菌。历史上,金黄色葡萄球菌在青霉素引入后两年内就出现了耐药性。1942年首次发现了耐青霉素的金黄色葡萄球菌菌株。随后,在20世纪50年代末引入了半合成抗生素甲氧西林,1960年确认了MRSA的存在[3]。
甲氧西林的临床应用导致了MRSA的兴起。在过去的几十年里,出现了新的MRSA菌株。与传统医疗设施中的MRSA菌株不同,这些新菌株能够渗透到社区环境中并感染那些没有易感风险因素的个体[3]。金黄色葡萄球菌的甲氧西林耐药性特征是其氧化青霉素最低抑菌浓度(MIC)达到或超过4微克/毫升[4]。MRSA感染可分为医院相关(HA-MRSA)感染和社区相关(CA-MRSA)感染两种类型[5]。
据WHO统计,所有地区的MRSA流行率已超过20%,某些地区的感染率甚至超过了80%[6]。在非洲,不同国家之间的MRSA流行率存在显著差异[7]。来自九个非洲国家的数据显示,MRSA的流行率大约在25%到50%之间,有些国家的感染率低于25%[8]。欧洲抗菌素耐药性监测系统的数据表明,欧洲长期护理机构和重症监护机构的HA-MRSA流行率差异较大,范围从1%到24%不等[9]。
多项流行病学研究确定了与MRSA定植和感染相关的多种独立风险因素,包括高龄、免疫抑制、长期住院和既往抗生素使用以及侵入性医疗程序[10]。MRSA对抗菌药物的耐药性为其治疗带来了严重困难。这种耐药性机制可能是其固有的,也可能是治疗过程中获得的[11]。表1显示,金黄色葡萄球菌对抗不同类别抗菌药物表现出多种耐药策略,凸显了其在逃避治疗选择方面的复杂性和适应性。

**表1. MRSA对各种抗菌药物的耐药机制**

**耐药机制**
- 抗菌药物的吸收受限
- 糖肽[11]
- 抗菌靶点变异
- 糖肽;氨基糖苷类;四环素类;大环内酯类;林可酰胺类;β-内酰胺类;噁唑烷酮类;脂肽类;链阳霉素类;氟喹诺酮类;代谢途径抑制剂[11]
- 抗菌药物失活
- β-内酰胺类;氯霉素[11]
- 活性药物排出
- 四环素类[11]

**抗菌药物管理(AMS)**是一种系统性的方法,旨在促进抗菌药物的合理使用,减少不必要的处方,并减轻抗生素耐药性的出现。该倡议包括在机构或医疗系统层面实施的策略,以鼓励负责任的抗菌药物处方、优化抗菌药物的选择和剂量,并防止MDR病原体的传播。虽然临床决策支持系统(CDSS)有助于个体临床决策,但抗菌药物管理计划侧重于与抗生素使用相关的整体实践,目的是保持药物的有效性和对抗抗生素耐药性[12]。AI和ML的出现彻底改变了这一领域,促进了快速的微生物检测和定制抗生素谱图的创建,大大提高了诊断准确性和治疗效果(图1)。AI和ML的创新已成为增强抗菌药物管理的宝贵工具,能够快速进行数据驱动的耐药性预测并支持抗菌药物治疗策略的制定[13]。

**图1. 使用AI和ML工具应对MRSA的应用和成果**(经Bilal等人2025年的创作共用许可改编)[14]。

AI是计算科学中的一个领域,致力于创建能够模拟人类认知功能的机器,包括学习、理解、模式识别、问题解决和决策。AI通过快速处理信息并促进逻辑决策显著改善了数据分析。ML利用复杂技术通过应用临床和实验室数据来实现基于证据的决策和预测分析[14]。鉴于其能力,AI和ML有可能通过评估复杂的电子健康记录(EHR)数据来极大地提高研究效率,从而预测易患抗菌素耐药性的患者以及潜在风险患者。AI/ML能够有效处理大型数据集,使其成为应对全球抗菌素耐药性挑战的理想工具[15]。这些模型有助于药物开发、现有药物的重新利用,并通过检查与MRSA病原体相关的大量化学化合物来制定协同治疗策略[16]。此外,它们在检测抗菌素耐药性基因的传播、评估相关风险以及为公共卫生监测提供关键资源方面发挥着重要作用。ML已证明能够区分耐甲氧西林菌株[16]。

**生物信息学**是一门处于生物学和计算科学交叉点的前沿学科,促进了基因组测序、数据分析、预测建模和复杂大规模数据集管理方面的重大技术进步[17]。尽管在这些努力中已经采取了许多措施来应对抗菌素耐药性,但它仍然是一个不可避免的挑战,削弱了抗生素治疗感染的效果。一种可行的实际方法可能是利用特定的生物信息学工具,使全球医疗系统能够更好地控制抗菌素耐药性[18]。
与以往提供AI在抗菌素耐药性应用概览的综述不同,本文专门针对MRSA,整合了用于监测、诊断、风险预测和治疗发现的计算工具。它特别强调了WGS作为ML模型关键输入的重要性,全面评估了这些模型的性能和局限性(包括数据集偏见和验证相关的问题),并阐明了从基因组信息到CDSS的转化路径。这种以MRSA为中心的综合视角为抗菌药物管理提供了更具临床相关性的框架。

**耐甲氧西林金黄色葡萄球菌(MRSA)**
MRSA通过甲氧西林结合蛋白2a(PBP2a)和甲氧西林结合蛋白2c(PBP2c)表现出抗生素耐药性,这两种蛋白分别由mecA和mecC基因编码。葡萄球菌染色体盒mec(SCCmec)是一种可转移的遗传元件,包含编码PBP2a的mecA或mecC基因。获得SCCmec基因可导致对β-内酰胺类抗生素的耐药性。另一种由mecA基因编码的PBP2a主要负责对甲氧西林的高耐药性[19]。因此,这一机制使MRSA对多种β-内酰胺类抗生素具有耐药性[20]。
MRSA菌株可以产生多种毒力因子,其中许多与CA-MRSA或HA-MRSA相关,但也存在例外。例如,潘通-瓦伦丁白细胞毒素(PVL)是一种噬菌体衍生的毒液,会导致细胞凋亡和组织坏死,通常与CA-MRSA相关;然而,最新研究在埃及的医院以及突尼斯和阿尔及利亚的社区中发现了携带PVL的HA-MRSA菌株。这些菌株还携带其他毒液基因,如毒性休克综合征毒素-1(一种超级抗原,可引发发热、低血压、皮疹、多器官疾病和可能致命的休克)和剥脱毒素1(一种可引起皮肤层水解的毒素,导致皮肤病)[21]。

**医院相关MRSA(HA-MRSA)**
HA-MRSA仍然是医疗环境中MDR感染的主要来源,尤其影响免疫系统较弱或其他有脆弱性的个体。自20世纪60年代发现以来,由于其对抗多种抗生素的耐药性和与高发病率和死亡率的相关性,HA-MRSA带来了巨大的临床和经济问题。有效的感染控制策略(包括手部卫生习惯和抗菌药物管理)的实施有助于降低其流行率。HA-MRSA菌株在医院环境中易于繁殖,常常导致疫情爆发。其持续存在的原因包括抗生素耐药性、毒力决定因素和定植能力,尤其是鼻腔定植,这增加了感染风险。全面了解这些因素对于降低医疗环境中的HA-MRSA传播至关重要[3]。

**社区相关MRSA(CA-MRSA)**
自20世纪90年代末以来,CA-MRSA已成为一种临床上重要且可能危险的病原体,与严重皮肤和软组织感染相关,尤其是在没有住院史的年轻健康人群中。最初记录的CA-MRSA病例出现在20世纪80年代的密歇根州底特律和爱尔兰都柏林,受影响者通常是静脉注射药物使用者或有住院史的人。1993年在澳大利亚西部的一个与世隔绝的原住民社区中首次发现了CA-MRSA病例,涉及非MDR变体WA-MRSA-1[3]。随后,在1997年至1999年间,美国发生了大规模疫情,导致明尼苏达州和北达科他州的四名儿童因严重CA-MRSA感染而死亡。这些事件使CA-MRSA成为一种独特的临床现象,早期菌株如MW2(USA400)被归类为MLST克隆复合体1。到了21世纪初,一种新的谱系USA300(CC8)出现,并迅速成为美国和加拿大的主要CA-MRSA菌株。此后,世界各地发现了多种CA-MRSA谱系,其中一些仍局限于特定地理区域[3]。

**动物相关MRSA**
MRSA流行病学的变化引发了对其在动物中流行情况的关注,特别是LA-MRSA。1972年首次在比利时的一头牛身上发现LA-MRSA后,2005年由于荷兰养猪场中定植率上升的报告而受到广泛关注[3]。这种菌株携带mecA基因,无法用传统的PFGE方法分类,因此不同于HA-MRSA和CA-MRSA。这项研究首次明确了MRSA从动物传播给人类的过程,正式将LA-MRSA认定为一个独立的类别。随后,全球范围内也报告了类似病例[22]。这些菌株主要被归类为克隆复合体CC398内的MLST类型ST398,在基因上与人类MRSA不同,现在构成了医院环境之外MRSA的主要存储库。随着MRSA类型之间基因交换证据的增加,CA-MRSA、HA-MRSA和LA-MRSA之间的区别变得越来越模糊。LA-MRSA可以在动物之间传播,从动物传播给人类,以及从携带该菌株的个体传播给其他人。全球研究评估了经常接触动物的个体中MRSA的流行情况,并提出了防止其进入农场的措施,以及减轻或根除牲畜种群中MRSA携带的策略[22]。图2下载:下载高分辨率图片(210KB)下载:下载全尺寸图片图2. MRSA在各种储存库中的潜在传播途径,经Bouali等人(2023年)许可改编,采用知识共享署名许可。

生物信息学工具在MRSA研究中的作用
生物信息学可以是更好地理解和应对MRSA的重要工具,因为它有助于分析广泛的基因组数据,预测抗生素耐药性,并确定可能的药物靶点。这一过程采用了WGS等方法来表征MRSA菌株,识别毒力因子,并研究耐药性的分子机制。下一代测序(NGS)技术与生物信息学、系统发育学和病原组学分析相结合,促进了致病体的确认。近年来,使用生物信息学工具分析WGS和核糖体(rRNA)基因测序数据以确认细菌和真菌病原体的应用变得越来越普遍。特别是在微生物组研究中,对改进的生物信息学工具的需求正在增长[24]。WGS已被用于不同情况下的MRSA调查和监测,如表2所示。WGS已被应用于已识别的MRSA分离株,以分析其基因组组成并研究其基因关系[21]。在英国进行的一项初步研究表明,自动化生物信息学平台Next Gen Diagnostics(NGD)在主动监测和识别MRSA疫情方面非常有效。在这项研究中,17份阳性MRSA的临床样本接受了WGS处理,NGD系统自动处理测序数据以识别细菌种类、检测耐药基因(包括mecA)、分配序列类型(ST)并评估分离株之间的基因关系。该系统每份样本的数据分析时间不到90秒,所得结果与传统基于研究的生物信息学流程得出的结果高度一致,耐药性预测的一致性达到了99.3%。重要的是,NGD检测到了两个MRSA基因簇,其中一个揭示了一条未识别的传播途径,将医院病房与门诊诊所联系起来[25]。这一发现需要立即采取感染控制措施,包括对医护人员进行筛查,从而证明了该系统在促进及时干预方面的能力。这个例子突显了此类技术在加强感染控制措施和抗击抗菌素耐药性方面日益重要的作用[25]。

表2. 用于MRSA调查和监测的WGS应用实例。

WGS在MRSA监测中的应用
地点 参考文献
社区和医疗机构中MRSA的纵向监测 英国东英格兰[26]
欧洲侵袭性金黄色葡萄球菌的基因组流行病学[27]
医院网络内MRSA传播的检测 英国伦敦[28]
手术部位感染来源的确定 美国亚利桑那州[29]
重症监护病房中MRSA的监测 英国剑桥[29]
医院获得性血流感染的监测 美国芝加哥[30]
万古霉素敏感性降低 美国和澳大利亚[29]

人工智能和机器学习在MRSA控制中的应用
人工智能通过有效处理和分析大量复杂的数据集,在解决抗菌素耐药性(AMR)方面具有巨大潜力。人工智能和机器学习算法能够解读电子健康记录(EHRs),预测哪些患者容易受到AMR感染,并识别已经感染的患者。此外,这些算法在药物发现和开发中发挥着关键作用,通过虚拟评估大量化学化合物来发现针对耐药病原体的有效组合[31]。此外,人工智能技术可以监测AMR基因的传播,评估风险因素,加强公共卫生监测,并加速新型诊断和治疗方法的创造[14]。人工智能系统通过跟踪抗生素使用情况并识别过度使用或误用的情况来改善医疗机构内的抗菌素管理(AMS)。它们评估处方行为,发现异常,从而促进有针对性的教育或干预,以改进临床实践。此外,它们还可以用于识别处方抗生素偏离推荐一线疗法的情况,或者在没有明确理由的情况下使用广谱抗生素的情况[16]。人工智能和机器学习中常用的技术包括监督学习算法(SLA)、无监督学习算法(ULA)、强化学习(RL)和深度学习(DL)框架。SLA利用标记的数据记录(如患者数据和微生物基因组)来进行预测和知情决策[14]。麻省理工学院(MIT)的研究人员有效地利用DL技术找到了一类对MRSA有效的新型抗菌药物。这些化合物在体外和体内测试中显示出强大的效果,同时对人类细胞的毒性很低,突显了它们作为安全有效的治疗选项的潜力。这项研究的独特之处在于该模型能够阐明与抗生素效果相关的化学特性,为开发更有效的药物提供了有价值的框架[32]。

逻辑回归(LR)以及各种传统统计技术一直是预测AMR的重要工具。先进的机器学习原型显著提高了预测AMR的能力,改进了经验性抗菌选择,并降低了治疗失败的可能性。通过分析相关变量和不足的数据,这些模型提供了超越传统方法的有效见解[13]。AMS中使用的关键机器学习模型包括决策树和随机森林,它们以其清晰性和处理分类数据和数值数据的能力而受到青睐,在处理多样化数据记录中的不同模式方面表现出色。此外,提升模型通过整合多个决策树的结果来提高预测性能,尤其是在复杂的数据集上。支持向量机在变量较多的情况下具有优势,尽管在处理大规模数据集时面临挑战。最后,神经网络(NNs),尤其是循环神经网络(RNNs),擅长处理复杂数据和时间序列。尽管它们的可解释性较低,但对于大规模、高维数据集来说非常有效[13]。

图3:图3. 用于对抗MRSA的机器学习技术和应用,经Perez de la Lastra等人(2024年)许可改编,采用知识共享署名4.0许可[16]。

人工智能和机器学习在MRSA诊断中的应用
一项研究探讨了神经网络(NNs)和逻辑回归(LR)方法在诊断MRSA方面的效果。研究结果表明,NNs在区分能力和稳健性方面均优于LR。由于其建模灵活性,NNs在处理涉及多个变量和复杂交互的MRSA和其他分类挑战时特别有效。相比之下,LR的性能略低,但它提供了更高的清晰度和较低的复杂性,因此在变量较少或需要结果确认时是更优选的选择[33]。一项回顾性发展研究表明,利用从EHR数据中提取的临床和非临床属性,可以通过机器学习技术有效预测MRSA的风险。值得注意的是,网络特征是最具预测性的,比以前的方法有了显著改进。此外,针对不同患者亚群定制多种预测模型可以进一步提高模型的整体性能[34]。表3展示了用于监测MRSA和AMR的生物信息学和人工智能工具的比较概览。

表3. 用于监测MRSA和AMR的生物信息学和人工智能工具的比较概览
工具 技术类型 案例研究 关键特性 优势 局限性 参考文献
NGD 自动化生物信息学系统 英国医院中MRSA疫情的实时检测 WGS分析、耐药基因检测、ST分配、基于SNP的相关性 快速(每样本90秒)、高准确性(99.3%)、用户友好 对不同MRSA谱系的验证有限[25]
Microreact 可视化工具 支持疫情追踪和谱系地理分析 系统发育树、时间线、地图 互动性强、适合公共卫生、便于数据共享 需依赖外部分析工具进行输入[35]
DeepARG 深度学习(AI) 在环境和临床宏基因组中预测ARG 使用神经网络预测ARG,超越序列相似性 高灵敏度、新基因检测、适用于宏基因组学 需要高质量训练数据;对罕见ARG的效果较差[36]

最近的研究强调了机器学习在提高金黄色葡萄球菌定植和感染风险预测方面的有效性。在弗吉尼亚大学医院进行的一项回顾性分析中,Choi等人利用超过27,000名患者的数据构建了机器学习模型,通过EHRs预测MRSA状态。这些网络特征包括患者间和患者与提供者之间的互动动态,显著提高了模型的预测能力[34]。在评估的各种方法中,包含网络衍生变量的惩罚逻辑回归模型在其他机器学习方法中表现最佳。更重要的是,这些特征的添加使预测准确性提高了15%以上。确定的关键预测因素包括之前的抗生素使用、手术程序、设备放置和住院时间。此外,针对特定亚组的模型比通用模型具有更高的预测准确性。这项研究强调了将机器学习与实际医院互动数据相结合的潜力,有助于早期识别高风险患者并加强临床环境中的主动感染预防措施[34]。

人工智能在临床决策支持系统(CDSS)中的应用
由人工智能/机器学习驱动的CDSS通过促进适当抗生素的选择、识别导致感染的病原体以及基于本地抗菌素耐药性(AMR)数据预测敏感性趋势来改善AMS。这些系统的一个重要优点是它们能够建议使用窄谱抗生素,有助于减少不必要的抗生素使用并遏制耐药菌株的发展。此外,它们可以识别不适当的治疗方案,例如不必要的病毒感染抗生素处方,并提供纠正指导[14]。Nigo等人开发了一个深度学习框架(PyTorch_EHR),利用时间序列EHR数据来预测患者在两周内检测出MRSA的概率。该模型利用纪念赫尔曼医院系统(MHHS)的56,000多个培养事件和医疗信息市场重症监护(MIMIC-IV)数据集的393,000多个事件进行了验证,其接收者操作特征曲线下面积(AUROC)得分分别为0.911(MHHS)和0.859(MIMIC-IV),显示出其在改善MRSA风险分层方面的潜力。通过结合序贯临床特征,如之前的抗生素使用、入院诊断和感染历史,该模型有效地将患者分为高风险、中等风险和低风险组。这种方法有助于减少不必要的MRSA靶向抗生素处方,并提高了高风险患者的早期检测,包括那些患有MRSA菌血症的患者。该模型在数据集之间表现出很强的泛化能力,并在实际治疗和感染控制措施 inform 分析中显示出实用性。其架构与实际临床工作流程兼容,可以在两周的时间框架内提供预测,这在临床环境中比静态的即时预测更有操作性[37]。

Jiang等人(2025年)最近展示了人工智能在对抗MRSA方面的开创性应用,他们开发了一个基于人工智能的平台AMP-Hydrogel-Designer,用于生产创新的AMP水凝胶,以治疗耐药细菌感染,包括MRSA。该平台使用了先进的机器学习方法,如生成预训练、强化学习和对比学习,制备了一种名为AK15的含硫醇的AMP,具有强效的广谱抗菌性能。AK15通过Cu/SH配位与铜修饰的二氧化钛纳米粒子结合,制成了一种可注射的、自愈的、压电的AI-AMP水凝胶[38]。体外和体内评估表明,AK15对MRSA和大肠杆菌的杀菌效果超过99.99%。这种水凝胶不仅破坏了MRSA生物膜和细胞膜,还通过将机械伤口能量转化为生物电刺激促进了MRSA感染大鼠模型的伤口愈合,从而促进了血管生成和组织再生。转录组分析进一步表明,AI-AMP水凝胶影响了MRSA的膜应激反应、代谢途径和毒力基因的表达。这项研究展示了如何利用人工智能系统性地设计多功能生物材料,这些材料结合了针对性的抗菌效果和再生功能,为应对MRSA及相关病原体提供了一种可扩展且精确的方法[38]。人工智能在抗微生物药物耐药性(AMSR)中的应用仍然是一个重大的全球健康问题,需要开发更有效的策略。人工智能和机器学习提供了强大的、基于数据的方法来提高抗生素的使用效率并优化临床决策。这些先进技术通过整合大量的临床、基因组和流行病学数据集,促进了病原体的快速识别、耐药性预测和实时监控。基于人工智能的工具通过推荐合适的抗生素来支持针对性治疗,从而减少了对广谱抗生素的依赖,并提高了治疗的准确性。在群体水平上,它们通过识别新的耐药趋势来加强AMSR的监测,并指导公共卫生倡议。此外,人工智能增强型的管理计划促进了对处方协议的遵守,并能够持续评估治疗结果。人工智能驱动的策略在AMSR中提供了显著的好处,包括通过复杂的数据分析来识别脆弱人群的能力。此外,它们通过实现对抗微生物耐药性模式的实时检测和监控来增强监测系统。这一进展提高了疫情早期识别的能力,并使得公共卫生措施更加有针对性和及时性。这些工具还有助于更好的资源分配,并支持更为明智的临床决策。然而,其有效性经常受到数据质量、监测覆盖范围不足以及数据集中潜在偏见等问题限制。这些挑战可能会影响预测的准确性和适用性,强调了进行严格验证和整合高质量数据的必要性[13]。

在MRSA中应用生物信息学工具

抗生素耐药性金黄色葡萄球菌(Staphylococcus aureus)菌株的增加突显了精确的抗菌敏感性评估和全面的流行病学监测的紧迫需求。这种情况强调了有效和可靠的分型方法的重要性。尽管全基因组测序(WGS)提供了详细的基因分析、菌株区分和广泛的分型功能,但其更广泛的应用受到财政和基础设施挑战的限制[39]。金黄色葡萄球菌基因组数据在公共数据库中的日益可用性促使出现了替代的、经济可行的比较方法,包括泛基因组分析。这种分析方法调查了各种菌株的全面基因谱系,提供了关于进化过程、基因增益和丢失以及重组事件的宝贵见解。泛基因组通常分为主要基因组(所有菌株类型都共有)和可选项基因组(包含菌株特异性或可变共享的基因)。通过泛基因组分析,研究人员可以确定对于后续应用(如多位点序列分型(MLST)至关重要的保守核心基因。MLST是一种成熟且可靠的技术,使用管家基因进行有效的菌株区分,并被广泛认为是金黄色葡萄球菌的最佳分型方法之一。MLST提供了一种更具经济性和标准化方法的细菌菌株分型和特征描述,使其成为常规流行病学研究的可行选择[39]。

利用基于人工智能的生物信息学流程,研究人员筛选了公开可用的抗菌肽(AMP)数据库(如CAMPs和DBAASP),并使用AlphaFold2进行序列同源性分析,以及使用GROMACS进行分子动力学模拟,以预测潜在肽的稳定性、生物活性和结构构象。所选抗菌肽的序列为AFCGGRCRGFRRRLFCTKAC,表现出有利的生物物理特性,包括一种阳离子两亲性结构,有助于与细菌膜相互作用并破坏它们[40]。在计算建模之后,该肽被合成并进行了全面的体外评估。结果显示其具有较强的抗菌效力,最小抑菌浓度(MIC/MBC)对MRSA介于500至1000 μg/ml之间。此外,它成功地消除了成熟的MRSA生物膜,这些生物膜由于对抗标准抗生素的增强耐药性而构成重大临床挑战。重要的是,这种抗菌肽对人体成纤维细胞和红细胞没有表现出细胞毒性、基因毒性或溶血效应,表明其具有良好的安全性。这突显了人工智能在增强下一代抗菌肽的理性设计和临床前评估方面的潜力,为传统抗生素提供了可行的替代方案。在MRSA特定抗菌肽的设计中优化使用人工智能工具不仅提高了抗菌开发的准确性,还加快了基于肽的治疗在临床应用中的转化潜力[40]。

在MRSA中应用全基因组序列(WGS)分析

Naorem等人(2021年)对来自德国和匈牙利的四个MRSA临床分离株进行了比较全基因组分析,以识别影响菌株多样性、耐药性和致病性的遗传因素。该研究使用了包括SPAdes在内的生物信息学工具进行基因组组装,RAST和PATRIC进行基因注释,以及CARD/VFDB数据库进行抗菌耐药基因(ARGs)和毒力因子基因(VFGs)的计算机检测。结果表明这些分离株之间存在显著的基因组差异,特别是在移动遗传元件、质粒、噬菌体和生物合成基因簇的存在方面。属于CC5谱系的德国分离株显示出比CC22谱系的匈牙利分离株更多的多重耐药基因和独特的毒力基因。重要的是,噬菌体编码的ARGs的变化以及PVL基因的检测对于区分社区相关菌株和医院相关菌株至关重要。泛基因组分析揭示了一个开放的基因组结构,具有显著的基因组可塑性,表明基因获取过程仍在进行中。此外,该研究将特定基因型特征(如ica基因和agr类型的存在)与表型特征(如生物膜形成和pH耐受性)联系起来。这项比较基因组学研究强调了WGS和生物信息学在理解MRSA菌株多样性以及增强流行病学监测和耐药性分析中的关键作用[41]。

在对来自南非畜牧业食品链的MRSA克隆(ST612-CC8-t1257-SCCmec_IVd(2B))的全面基因组调查中,研究人员使用了WGS以及RAST、PGAP、CRISPRCasFinder和PathogenFinder等人工智能增强的注释工具来识别高度保守的基因组特征。这些特征包括一个强大的耐药基因组、多样化的毒力因子和应激响应机制。重要的是,像PathogenFinder这样的机器学习模型被用来评估该克隆的致病潜力,得出的P分数高达0.927,表明其具有强烈的宿主-致病性关系[42]。此外,人工智能工具有助于绘制CRISPR-Cas系统、限制修饰系统和辅助基因调节器的图谱,所有这些对于理解免疫逃避、基因组可塑性和持久性都至关重要。分析强调了该克隆的高度适应性,包括形成生物膜的操纵子、与热休克和渗透压应激相关的基因,以及与毒素相关的决定因素。比较基因组学方法使得能够准确地确定该克隆在全球MRSA菌株中的系统发育位置,揭示了其在人类和动物宿主中的普遍存在。这进一步证明了人工智能支持的基因组分析在揭示病原体生物学、增强监测工作和指导针对MRSA的创新抗菌策略制定方面的有效性[42]。

在2022年Lagos等人的研究中,通过比较cgMLST和SNP分析方法评估了MRSA在宿主体内的进化。对2003年至2019年间从20名携带者中收集的95个MRSA分离株进行了WGS。为了评估方法相关的变异和差异,使用了Ridom SeqSphere+和基于云的1928平台开发了两种不同的核心基因组多位点序列分型(cgMLST)方案。此外,还使用了两种单核苷酸多态性(SNP)方法,即1928平台和Northern Arizona SNP Pipeline(NASP)。使用Ridom SeqSphere+和1928平台的cgMLST分析分别显示出每年5.0和2.0个等位基因变异的中值。在SNP分析中,使用COL和Newman两个参考基因组,1928平台显示出每年每个个体13个和24个SNP(包括推断为重组的SNP)以及3.8个和4.0个SNP(不包括重组的SNP)。相应地,NASP显示每年每个个体5.5个和5.8个SNP[43]。

一项探索性研究使用表型AST、VITEK-2和WGS检查了50个独特的MRSA分离株,其中18个符合最终分析的质量控制标准。WGS结果表明CC22(56.25%)和CC30(31.25%)克隆复合体的主导地位,以及多种SCCmec和spa类型,包括一种新的SCCmec V变体,这突显了基因组的持续进化。毒力基因的高发生率(luk-PV: 93.75%; tsst-1: 33.33%)进一步突显了这些分离株的致病潜力。重要的是,表型和基因型AST在关键抗生素类别上的完全一致(100%)支持使用WGS作为预测耐药性和进行监测的可靠方法[44]。这些结果强调了将基因组特征整合到人工智能/机器学习驱动的CDSS中以提高抗生素选择的重要性。然而,样本量的有限性和某些分离株的排除引发了对潜在数据集偏差的担忧,这在开发健壮、可推广的人工智能模型时是一个关键因素。

在MRSA中应用多位点序列分型(MLST)

在2022年Jalil等人的研究中,对金黄色葡萄球菌进行了全面的比较泛基因组和系统发育分析,评估了502个基因组以改进分子分型方法。研究表明,传统的MLST方法虽然比WGS更经济,但在区分新出现的、遗传多样性高的MRSA菌株方面存在不足。值得注意的是,现有方案未能捕获约43%的基因组内容,这影响了其在流行病学追踪和进化研究中的有效性。为了解决这些限制,作者引入了一种改进的MLST方案,其中包含了新的遗传候选基因(opuCC、aspS、rpiB),这些基因的选择基于它们在整个基因组中的存在、进化稳定性(由低dN/dS比率表示)以及可管理的测序大小。更新后的方案提高了分辨率,使可识别的序列类型数量从42增加到了58,从而更好地区分了菌株。关键的是,他们的结果提倡在病原体监测中结合计算基因组学和复杂分析技术,如泛基因组分析和反向疫苗学工具(例如PanRV)。这些技术可以通过人工智能进一步改进,以实现高风险MRSA克隆和耐药性趋势的实时识别[39]。

在使用人工智能应对MRSA方面的挑战和未来方向

尽管取得了显著进展,但在利用人工智能应对抗微生物药物耐药性(AMR)方面仍存在各种障碍,特别是在MRSA方面。主要挑战是缺乏高质量、具有代表性的数据集,这影响了模型的准确性和泛化能力。许多人工智能系统使用有偏或来源狭窄的数据进行开发,这降低了它们在不同患者群体或环境中的可靠性。这一问题在MRSA的情况下尤为突出,因为不同地区的菌株变异性和耐药机制可能存在显著差异[45]。诸如知情同意、数据隐私和算法偏见等伦理问题进一步复杂性化了人工智能在临床环境中的实施。此外,许多人工智能原型的“黑箱”特性降低了医疗专业人员的信任度。尽管深度学习技术(包括卷积神经网络(CNNs)和循环神经网络(RNNs)非常有效,但它们的不可解释性仍然是一个重大问题。此外,针对AMR的人工智能模型通常只关注孤立方面,如耐药性预测或MIC估计,而没有考虑宿主-病原体相互作用、生物膜形成或对理解MRSA发病机制和治疗失败至关重要的临床背景因素[45]。

将多模态数据整合到连贯的预测框架中的需求仍未得到满足。人工智能系统必须基于从高通量技术和现实世界临床来源获得的大型、更多样化的数据集进行训练[46]。全球合作、数据共享以及建立国际研究联盟对于解决这些问题和优化人工智能在全球抗击AMR中的作用至关重要[47]。目前关于人工智能在医疗保健中的监管和法律框架仍处于起步阶段。迫切需要关于安全性、有效性和数据隐私的明确标准来指导人工智能工具的实施。人工智能开发者、医疗保健从业者和监管机构之间的合作对于建立信任和确保负责任的应用至关重要[47]。可解释人工智能的发展、生物信息学工作流程的标准化以及监管监督对于保证人工智能在应对MRSA时的安全、公平和透明应用非常重要。

结论

MRSA带来的日益严重的挑战继续危及全球公共卫生并对医疗系统造成压力。随着传统诊断、监测和治疗方法的局限性,人工智能、机器学习和生物信息学的结合提供了强大且及时的解决方案。这篇综述强调了这些技术如何从高通量基因组分析、分子分型到预测建模、疫情检测和抗菌药物发现等方面彻底改变了MRSA的管理。生物信息学促进了耐药基因、毒力因子和菌株多样性的快速表征。与此同时,基于人工智能的平台被用于提高诊断准确性、预测患者风险、设计创新的抗菌肽、重新利用现有药物以及为经验性治疗提供依据。尽管潜力巨大,但仍存在诸多挑战,包括数据标准化、人工智能模型的可解释性、伦理问题以及监管监督的必要性。克服这些障碍需要跨学科合作、国际数据共享和政策制定,以确保这些技术的公平和合规应用。

展望未来,人工智能与合成生物学、纳米医学和计算流行病学的结合为个性化干预和实时管理耐药病原体提供了新的可能性。随着人工智能、机器学习和生物信息学的不断发展,它们将成为全球抗击耐甲氧西林金黄色葡萄球菌(MRSA)和抗菌素耐药性的关键工具。

**缩写说明**
AI:人工智能
AMR:抗菌素耐药性
AMS:抗菌素管理
AMP:抗菌肽
ARGs:抗菌素耐药基因
AUROCA:接收 Operating Characteristic 下的区域
CA-MRSA:社区相关耐甲氧西林金黄色葡萄球菌
CNN:卷积神经网络
EHR:电子健康记录
HA-MRSA:医院相关耐甲氧西林金黄色葡萄球菌
LA-MRSA:牲畜相关耐甲氧西林金黄色葡萄球菌
LR:逻辑回归
MBC:最低杀菌浓度
MDR:多重耐药
MIC:最低抑菌浓度
MIMIC-IV:重症监护医疗信息库
ML:机器学习
MLST:多位点序列分型
MMHSM:Memorial Hermann 医院系统
MRSA:耐甲氧西林金黄色葡萄球菌
NGD:下一代诊断技术
NN:神经网络
Pbp2a:青霉素结合蛋白 2a
Pbp2c:青霉素结合蛋白 2c
PVLP:Anton-Valentine 杀白细胞素
RNN:循环神经网络
SCCmec:金黄色葡萄球菌染色体盒 mec
STs:序列类型
VFGs:毒性因子基因
WGS:全基因组测序

**伦理声明**
本综述文章无需伦理审批,因为它仅关注现有文献和研究,不涉及人类受试者或任何原始数据收集。

**资金来源**
作者感谢南非国家研究基金会(NRF)在 SARChI 讲座计划(授权号:PPNT230823145247)下的财政支持,该资助授予了 Yahya Choonara 教授。

**作者贡献声明**
概念构建:Samson A. Adeyemi 和 Yahya E. Choonara;初稿撰写:Tolulope A. Owolabi 和 Samson A. Adeyemi;审稿与编辑:Samson A. Adeyemi 和 Yahya E. Choonara;指导:Samson A. Adeyemi 和 Yahya E. Choonara;资金获取:Yahya E. Choonara。所有作者均阅读并同意发表的手稿版本。

**关于生成式人工智能和人工智能辅助技术的声明**
作者声明,在本手稿的概念构建和撰写过程中未使用任何人工智能或人工智能辅助技术。全部工作均由署名的作者独立完成。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号