《Expert Systems with Applications》:Expert-guided forecasting of epidemic ARI incidence based on physics-informed neural networks and large language models
编辑推荐:
基于大语言模型(LLM)的专家指导物理信息神经网络(PINN)交互式调整框架,通过结构化专家反馈动态优化PINN损失函数,实现流行病预测模型的实时校准。实验验证了LLM在专家知识形式化中的应用潜力,成功率达25-27%。
Dinara Gindullina|Mark Lazutov|Kirill Stolyarov|Daria Danilenko|Vasiliy Leonenko
ITMO大学,Kronverksky Pr. 49,圣彼得堡,197101,俄罗斯
摘要 本文介绍了一个基于智能体的AI系统,该系统利用大规模语言模型(LLMs)根据高质量的专家判断动态调整物理信息神经网络(PINNs)。我们的系统通过将非结构化的专家反馈转化为损失函数的结构化修改,实现了流行病学预测的交互式优化,从而无需事先进行数学形式化。实验结果证实了这种方法的基本可行性,最佳模型的成功率达到了25-27%,为将LLMs作为交互式决策支持系统的核心组件提供了有力的概念证明。这项工作为构建用于公共卫生问题的稳健专家驱动预测系统迈出了重要一步,同时也强调了开发更严格控制机制以确保系统完全稳健性的必要性。我们的系统代码可在以下链接获取:
https://github.com/blabla9111/PINN_LLM 。
引言 在计算和数学流行病学中,准确的预测对于流行病学监测、制定公共卫生政策以及减轻传染病的医疗和社会负担至关重要。在流行病学任务中,经常需要专家判断(Nagavci, Schwingshackl, Martin-Loeches, & Lakatos (2024)),因为专家判断可以显著提高预测质量,超越仅使用经验数据或单独的精心设计的模型所能达到的效果(Farrow et al. (2017); Martini (2021))。Hoyt, Bergren, String, & McAndrew (2025) 的研究指出,需要一个方法论框架将领域专业知识正式整合到计算预测模型中,以提高其预测准确性。科学论文中提出了将专家知识整合到各种模型中的尝试(Cooney & White (2023); Rodriguez, Adhikari, Ramakrishnan, & Prakash (2020))。这些方法通常通过将专家知识以损失函数约束的形式纳入模型来实现,但这仍然要求将知识表达为精确的数学函数。也有一些方法利用领域特定知识来推测政策变化的可能性(Vega, Flores, & Greiner (2022))。这种方法的主要系统性缺点是其以专家为导向的静态架构。还有一些开发旨在创建Web界面,使流行病学家能够根据需要独立调整预测模型(Sahatova, Kharlunin, & Leonenko (2023))。这种方法的主要限制是专家需要具备配置数学模型的专业知识。
为应对这些挑战,我们提出了一种方法,该方法在整合专家知识的同时避免了现有方法的主要缺点。我们的解决方案消除了对严格先验数学形式化和静态架构的需求,为流行病学家提供了一种无需深入理解模型内部参数化即可校准预测的适应性工具。
我们介绍了Expert-Guided PINN,这是一个用于交互式调整物理信息神经网络(PINN)损失函数的新软件框架,由大型语言模型(LLM)提供支持。我们认为LLMs可以将专家知识形式化到PINN优化目标中,从而生成与专家预期直接一致的预测。
本研究的一个关键贡献是实现了专家参与其中的优化循环的交互式框架。该过程从专家对预测的定性评估开始,评估结果被转化为损失函数修改的结构化规范。LLM将这些规范合成可执行代码,经过合理性检查后,指导PINN的训练。通过将优化后的预测呈现给专家,循环得以闭合,实现了模型与领域知识的持续对齐。我们的数值实验表明,LLMs确实可以将专家知识形式化到PINN优化目标中,生成符合专家预期的预测。
本文的结构如下:方法论部分介绍了我们的交互式框架及其核心组件:对话式智能体、分层文本分类器和PINN定制器。评估方法部分详细说明了我们的实验设置。结果与讨论部分评估了系统的性能,随后分析了局限性及未来工作方向。最后总结了我们的贡献。
方法论 有多种方法用于预测流行病的传播。隔室模型是一种标准且广泛采用的方法(Brinks & Hoyer (2024); Saldana & Velasco-Hernandez (2022))。这些模型将人群分为不同的组(易感者、感染者、康复者等),并使用常微分方程系统描述组间转换的动态。隔室模型可以估计流行病传播的动态。
分层文本分类器 为了自动构建专家输入评论的结构,我们实现并训练了一个基于BERT+ML架构的分层分类器(Zangari et al. (2024); Zhang et al. (2021))。测试结果表明,该分类器在80%以上的案例中正确识别了评论的类别和子类别(表1)。
系统的一个重要方面是两阶段分类验证流程。在自动定义类别后,专家会确认分配的类别。
局限性与未来工作 研究指出了几个需要进一步研究的方法论和实际限制:
• 物理信息神经网络的使用继承了其系统性的局限性(Cuomo et al. (2022); Krishnapriyan et al. (2021); Wuwu et al. (2025)),包括优化复杂性、对超参数的敏感性以及无法保证最终解决方案满足物理约束等问题。
• 分层分类器是在合成数据上训练和评估的,
结论 预测与急性呼吸道病毒感染(ARVI)相关的流行病学情况是流行病学监测的关键组成部分,这在很大程度上依赖于数学建模。运营预测的经验表明,需要定期校准和调整模型行为,而这需要具备建模和流行病学领域专业知识的高素质专家的持续参与。然而,这样的专家非常稀缺。
CRediT作者贡献声明 Dinara Gindullina: 概念构思、数据整理、方法论设计、软件开发、初稿撰写。Mark Lazutov: 软件开发、验证。Kirill Stolyarov: 数据整理、撰写——审阅与编辑。Daria Danilenko: 验证、撰写——审阅与编辑。Vasiliy Leonenko: 概念构思、资金获取、方法论设计、项目管理、监督、初稿撰写、审阅与编辑。
利益冲突声明 作者声明他们没有已知的可能会影响本文报告工作的财务利益或个人关系。