《Water Research》:EPANET-Agentic: A multi-agent system for natural language-controlled simulations of water distribution networks
编辑推荐:
本研究针对给水管网(WDN)建模需要复杂工作流程和专业知识的难题,开发了EPANET-Agentic多智能体系统。该系统采用以协调器为中心、工具驱动的嵌套架构,集成三个专用智能体,通过自然语言提示自主协调任务并控制EPANET仿真。在三个基准网络上的评估表明,系统实现了100%的成功率和工具调用准确率,DataAnalyzer智能体能有效解读仿真结果。该平台为复杂给水管网规划管理提供了工程级可靠性的自然语言控制解决方案,标志着传统WDN建模方法的重大变革。
在城市基础设施中,给水管网(Water Distribution Networks, WDN)作为保障居民用水安全的关键系统,其有效规划和管理通常需要大量模型仿真。然而,传统的WDN建模方法依赖复杂的工作流程和专业技能,使得EPANET这一广泛应用的水力与水质量模拟工具的操作复杂性限制了其可及性,延缓了及时决策。随着大型语言模型(Large Language Models, LLMs)的快速发展,智能体人工智能(Agentic AI)系统应运而生,能够通过自然语言提示自主协调任务并控制复杂工程仿真,为给水管网管理带来了新的机遇。
当前给水管网管理面临日益严峻的挑战,包括基础设施老化、人口增长以及提升系统韧性应对未来不确定性的需求。尽管EPANET及其基于Python的水网络韧性工具库(Water Network Tool for Resilience, WNTR)支持高级建模和韧性分析,但这些计算工具的广泛应用仍受限于模型构建、校准和维护的时间成本,以及其固有的复杂性和对专业知识的依赖。这些限制制约了非专业操作人员的实际使用,并减缓了现实应用中的决策速度。
近年来,LLMs在理解生成类人文本方面展现出前所未有的能力,使得用户与复杂分析系统之间的无缝通信成为可能。智能体AI系统将LLM从被动文本生成器转变为自主推理-行动工作流程的核心规划者,通过规划、记忆、工具使用和行动模块增强LLM能力,使其能够解释用户任务、生成计划、调用注册工具与环境交互、评估返回结果并迭代优化步骤直至任务完成。
尽管在其他领域已有类似系统应用,如OpenFOAMGPT通过对话驱动交互自动化计算流体动力学仿真,Paper2Code通过结构化多智能体系统将机器学习论文转换为可执行代码,但LLMs在WDN管理中的应用仍较为有限。现有研究大多将LLMs作为单任务的对话助手,而水务部门需要能够支持多样化模型决策的集成多智能体系统,而非孤立操作。
为此,埃克塞特大学水务系统中心的研究团队开发了EPANET-Agentic,这是一个早期阶段的基于LLM的多智能体系统,主要面向执行常规EPANET分析的系统操作员、现场技术人员和实践工程师,通过降低建模和操作学习曲线,取代传统的EPANET界面和临时脚本。该系统采用自然语言驱动控制层,将基于LLM的推理规划与EPANET的稳健仿真环境相结合。
关键技术方法
EPANET-Agentic采用以协调器(Orchestrator)为中心的架构,三个子智能体作为函数调用工具嵌套其中。协调器由DeepSeek-V3驱动,负责解释用户查询、生成分步执行计划并协调子智能体行动。TaskExecutor子智能体调用外部工具验证.inp文件、应用控制和运行场景仿真;CodeRunner子智能体生成执行Python代码运行水力或水质仿真;DataAnalyzer子智能体分析仿真输出并提供自然语言洞察。系统采用工具驱动的嵌套设计,各子智能体通过预定义函数调用接口被调用,确保工作流程透明可控。人机协同机制允许用户在任意阶段审批、中断或修改任务,保留对工作流程的控制权。
系统性能验证结果
研究团队在三个基准网络(L-Town、C-Town和Net3)上对EPANET-Agentic进行了全面评估,涵盖四类任务:系统特征、系统动力学、系统运维和场景模拟。
系统特征分析
系统特征查询是WDN分析的基础,这些属性定义了网络结构并支撑水力建模和运营决策。EPANET-Agentic成功实现了三类复杂性递增的任务:基本结构查询、基于属性的过滤和拓扑度量计算。系统准确检索了网络组件数量,识别了最长的管道及其ID和长度,并计算了节点'n1'的拓扑度量(度=1,偏心度=76,介数中心性和接近中心性均为0),表明该节点位于网络边缘,对连接性影响最小。所有结果与参考数据完全一致,证实了系统从自然语言查询中准确提取、计算和推理结构属性的能力。
系统动力学模拟
在静态结构查询基础上,系统展示了模拟动态水力和水质行为的能力,特别是在参数变化响应方面。通过改变管道直径参数,系统成功模拟了压力分布变化,多模态DataAnalyzer智能体通过图像推理识别了颜色尺度、压力范围和空间分布模式的差异,得出结论:直径变化改善了均匀性并减少了压力不平衡。压力变异系数从0.18093降至0.18073,证实了均匀性的轻微改善,展示了代理在检测细微水力变化方面优于人工检查的敏感性。
系统运维控制
系统运维实验检验了系统模拟运营控制的能力,如基于时间和条件驱动的阀门动作,并评估其对水力行为的影响。系统成功处理了三类复杂任务:时间控制、多条件阈值控制以及多规则控制。结果显示,在任务(a)中,节点'n111'处的压力在24小时前保持稳定,之后出现周期性波动,证实了阀门'PRV-2'的关闭;任务(b)显示27小时后压力显著变化,表明多条件控制成功激活;任务(c)中,多条规则诱导循环压力变化,DataAnalyzer将其解释为水箱'T1'压力触发阀门'PRV-2'操作的结果。系统准确识别了峰值压力(约75米)和谷值(约42米),展示了其解释控制逻辑如何动态影响系统行为的能力。
场景模拟应用
场景模拟实验评估了系统在模拟特殊场景方面的性能,包括泄漏、污染、增压器注入、停电、火灾和地震,利用了WNTR库的多功能建模能力。所有场景均产生了水力和质量上合理的结果:管道'p1'和'p2'在24至48小时间因泄漏引起的流量增加;注入节点'n2'下游节点'n352'处的余氯浓度峰值;污染期间节点'T1'处的明显示踪剂峰值;由于停电控制与现有运营规则间的相互作用,泵'PUMP_1'在24至48小时间频繁开关循环;节点'n1'处因火灾需求导致的流量增加;以及地震模拟中空间变化的峰值地面加速度。这些结果证实EPANET-Agentic有效自动化了多样化应急场景的配置、执行和解释。
可靠性验证与性能评估
为严格评估系统可靠性,研究团队在所有测试案例上进行了广泛验证实验。系统在39项任务中实现了100%的成功率和工具调用准确率,无需人工干预。平均代码生成尝试次数保持在2次以下,CodeRunner通常在一次修正后即能产生有效结果。系统特征任务所需尝试次数最少(低至C-Town的0.9次),而系统动力学任务需要更多迭代编码,C-Town峰值达1.7次。操作和场景模拟任务中,辅助工具管理控制插入或场景配置,降低了编码需求,保持了较低的尝试次数。
语义压力测试表明,系统对任务描述变化具有强健性。在标点缺失、句子遗漏和语序变化三种变异条件下,系统均保持100%任务成功率和工具调用准确率,无人工干预需求。仅代码生成尝试次数略有变化,不完全指令引入轻微解释模糊性,但不影响任务完成。
讨论与展望
EPANET-Agentic采用工具驱动的嵌套智能体设计,将复杂任务分解为具有明确参数的结构化工具调用,减少对扩展对话上下文的依赖,缓解LLM基于推理中的上下文溢出和幻觉问题。预定义关键参数结合集成验证机制确保工具输出符合用户意图,防止意外行为。模块化、稳健和可组合架构支持新工具或智能体的无缝集成,无需模型重新训练,促进跨领域可扩展性。
人机协同机制集成确保每个工具或子智能体调用需要显式用户审批,防止意外仿真操作,确保无物理无效水力计算可在无人工验证下进行。该系统进一步通过严格系统消息减少幻觉风险,明确禁止LLM编造数字,并限制LLM生成任何数值结果。所有水力值必须由WNTR库实现的预定义Python函数产生,确保完全符合EPANET的物理和建模约束。
然而,作为早期原型,系统功能仍限于常规EPANET操作,无法从异构数据自主构建网络模型,性能仍受人工提示设计影响,在大型WDN上的性能未经验证,且系统离线运行,无实时数据集成或在线决策能力。未来研究需沿多个方向推进:集成SCADA和GIS系统,结合实时传感器数据流和在线学习机制;纳入RAG和图基知识表示增强上下文推理;用蒸馏的领域专用小型语言模型替代通用LLMs;结合演化智能体系统研究,通过与环境交互持续改进性能;扩展多智能体系统至其他仿真领域。
研究结论
EPANET-Agentic成功将LLMs的先进推理和规划能力与EPANET的稳健仿真环境相结合,在自然语言控制下提供准确、可重复的仿真。系统在包括系统特征、系统动力学、系统运维和场景模拟的一系列39项测试任务中均表现优异,证实其在实现自然语言操作的同时保持了EPANET的计算可靠性。凭借最小化幻觉风险和提供模块化可扩展性的工具驱动设计支持,该系统为更广泛集成和应用(如WDN管理中的数字孪生使用)奠定了基础,为实时数据驱动部署规划了实用路径。
总体而言,EPANET-Agentic展现了LLM驱动的多智能体系统通过自然语言交互替代软件特定操作步骤来简化水力建模工作流程的潜力,同时不损害数值正确性。随着SCADA/GIS系统集成、实时自适应学习、检索增强推理以及专用安全层的未来发展,EPANET-Agentic有望成为自主、智能和韧性WDN管理的下一代解决方案。