《Current Research in Biotechnology》:Artificial intelligence and machine learning across vaccine lifecycle: a systematic review
编辑推荐:
这篇综述全面梳理了2010年至2025年间AI/ML在疫苗生命周期各环节的应用与突破,涵盖从抗原发现(如CNN、SVM用于表位预测)到临床试验优化及公平分配(如基于LSTM的供应链预测)的全过程。文章系统性地总结了相关AI技术(如DNN、随机森林)如何加速疫苗研发、优化流程,并指出了当前面临的挑战,如数据孤岛、算法偏见和在真实世界中验证的局限性,为推动AI赋能疫苗学的下一步发展提供了清晰的路线图。
引言
反复发生的全球卫生突发事件凸显了疫苗在传染病防控中的关键作用。然而,传统疫苗研发过程漫长、昂贵且充满科学挑战。例如,艾滋病毒(HIV)疫苗的研制因病毒变异性而受阻,结核病(TB)每年仍导致大量死亡,呼吸道合胞病毒(RSV)则是婴幼儿和老年人严重感染的主要诱因。与此同时,传统疫苗平台也存在不良反应、减毒株毒力回复及大规模病原体培养的生物安全风险。疫苗生产集中在少数国家、富国的预先采购协议、复杂的冷链要求(如mRNA疫苗所需的?70°C储存)以及持续的疫苗犹豫,都加剧了全球公平获取的困境。
在此背景下,人工智能(AI)和机器学习(ML)已成为生物医学创新和健康物流领域的变革性力量。AI/ML加速了疫苗靶点识别、药物再利用和快速疫苗设计(例如COVID-19 mRNA疫苗的研发)。这些技术可支持表位预测、识别保守抗原,并为精准疫苗设计提供病原体结构洞察。AI驱动的革命性反向疫苗学方法,已加快了候选疫苗的筛选和优化进程。
方法
本综述遵循PRISMA 2020指南,系统检索了2010年1月至2025年4月期间发表在PubMed、Scopus等六大数据库中的相关研究。纳入标准涵盖了AI/ML在疫苗发现、研发、制造或分配等阶段应用的同行评审文章。研究筛选、数据提取和偏倚风险评估均由两名评审员独立完成,并使用JBI工具评估方法学质量。考虑到研究的异质性,主要采用描述性和叙述性综合方法进行数据整合。
研究特征与AI/ML在疫苗创新与发现中的应用
共纳入119项研究,涵盖了从临床前到临床试验的广泛设计。应用最多的AI/ML工具包括人工神经网络(ANN)、支持向量机(SVM)、卷积神经网络(CNN)、深度神经网络(DNN)和集成方法(如随机森林、XGBoost)。在创新与发现阶段,CNNs、SVMs和集成方法最常用于表位预测、抗原分类和免疫原设计。例如,CNN架构在预测SARS-CoV-2和丙肝病毒(HCV)等病原体方面表现出色,而集成方法在多病原体(如寨卡病毒、疟疾)预测任务中展现了强大的准确性。深度学习混合模型(如CNN-LSTM)进一步改善了多肽表征学习。然而,模型的可解释性,尤其是对于复杂的神经网络架构,仍然是一个挑战。
AI/ML在疫苗研发(临床前与临床)中的应用
在临床前和临床开发阶段,AI/ML主要加速了候选疫苗筛选并优化了临床试验结果。SVM和集成神经网络常用于T细胞和B细胞表位预测,在SARS-CoV-2模型中准确率常超过95%。基于Transformer的蛋白质语言模型(如DeepEpiIL13)展示了细胞因子特异性表位预测的优越性。计算免疫模拟和分子动力学模型有助于在体外实验前优化候选物,减少实验负担。AI方法还能在临床前进行安全性评估,预测无毒和非过敏性表位。
在临床应用中,集成和梯度提升模型提高了疫苗试验效率和个体化反应预测。例如,结合靶向最大似然估计(TMLE)的超级学习器(Super Learner)在HIV和疟疾试验的筛分析中使精确度翻倍。而AI驱动的生物标志物整合使得利用数字孪生方法预测个体免疫反应成为可能。上市后监测则利用ML识别不良事件并预测长期结果。
AI/ML在疫苗供应链优化中的应用
在供应链优化方面,研究主要利用ML时间序列模型和回归算法进行需求预测,同时结合人工智能物联网(AIoT)和区块链技术提升运营可靠性和实时监控能力。比较趋势表明,长短期记忆网络(LSTM)模型在预测COVID-19疫苗接种运动期间的需求激增方面表现最佳,而集成多层地理信息系统(GIS)的ML框架则能实现精准的路线优化,以促进公平配送。AIoT与区块链集成的系统提高了可追溯性,减少了冷链故障,并能动态应对物流中断。
AI/ML在公平疫苗部署中的应用
在促进公平部署方面,研究主要使用决策树、LightGBM和基于神经网络的框架来识别高风险人群、预测需求和优化资源配置。预测分析能快速识别服务不足的社区,地理空间ML模型则有助于自适应路线规划和疫苗分配优先级排序。LSTM和混合密度网络(MDN)模型在预测需求激增方面特别有效。AI驱动的仪表板和区块链-物联网集成提高了最后一公里配送的透明度和监控能力。然而,针对特定人群的算法偏见仍是主要挑战。
结论
AI/ML工具正在通过加速表位预测、候选物筛选、需求预测和公平分配等方式,变革整个疫苗生命周期。然而,其全部潜力受到数据孤岛、算法偏见以及在不同人群和环境中验证不均的限制。要充分认识其影响力,需要采取以公平为重点的策略、跨学科合作、伦理治理、开放数据标准,并开展关于实施、成本效益和可解释人工智能的研究,以确保建立公平、可信的疫苗体系。未来的方向包括开发标准化数据格式和本体,加强跨学科合作,并建立伦理治理框架,以推动数据驱动、公平的下一代疫苗开发。