《Data & Knowledge Engineering》:Ontology-enhanced RAG for a personalised and sustainable food advisory system
编辑推荐:
本文推荐一项研究:为解决大语言模型在提供个性化、可持续食品建议时存在的幻觉、知识断层和事实信息处理不足等问题,研究人员提出并实现了一种本体增强的检索增强生成(Ontology-enhanced RAG) 框架。该框架集成了一个名为Food Consumer-Oriented Sustainability-Aware (FoCOSA)的模块化本体,在RAG管线的多个阶段引入结构化领域知识,以增强LLM的推理能力。实验评估表明,该方法在提高回答准确性、减少幻觉以及提供情境感知的可持续食品建议方面具有显著效果,为融合结构化知识与大语言模型的对话式咨询系统设计提供了新的范例。
在当今技术驱动的社会,帮助消费者做出既符合个人健康需求(如食物不耐受、特定疾病如糖尿病、高蛋白饮食)又兼顾可持续性目标(如减少环境影响和食品浪费)的自主食品选择,正变得越来越复杂。虽然以ChatGPT、Claude和Gemini为代表的大语言模型(LLM)因其自然语言处理能力在此领域展现出潜力,但它们也存在明显的局限性,包括产生幻觉(Hallucinations)、知识缺口、对事实信息处理不足以及知识可能过时。与此同时,现有的食品推荐系统要么提供过于泛泛的建议(例如仅建议无乳糖产品而不考虑用户的蛋白质摄入需求),要么基于用户历史数据过度个性化,形成“推荐泡沫”,限制了用户接触新的、更健康选项的机会。
为了应对这些挑战,检索增强生成(RAG) 技术通过从外部知识源检索相关信息来增强大语言模型的能力,已在许多领域证明了其有效性。然而,传统的RAG方法通常作用于缺乏复杂领域知识符号化表示的非结构化文本,这使得系统难以理解和汇总大规模数据集中的语义概念。为此,本文的研究团队提出并开发了一个本体增强的对话式食品咨询系统。该系统将名为FoCOSA(面向消费者的可持续性感知食品)的模块化本体,整合到基于RAG的系统的多个关键任务中,利用领域知识增强LLM的推理能力,同时让LLM提升对用户请求的解读,从而改善检索效果和交互流畅性。
为了开展这项研究,作者们构建了一个创新的技术架构。他们首先开发了模块化的FoCOSA本体,该本体整合了健康状况、体育活动、与工作相关的生活方式限制以及食品生产可持续性(环境、社会、经济和废弃物可持续性)等概念。在方法学上,他们设计并实现了一个三阶段的RAG管线:索引阶段,利用本体为文本块生成语义描述以优化向量存储组织;检索阶段,使用本体引导的查询重写和路由代理来提升信息检索的准确性;生成阶段,将检索到的信息与本体片段结合,指导LLM生成与领域语义一致的对话式建议。整个系统基于LlamaIndex框架和Milvus向量数据库实现,前端采用Chainlit构建对话界面。实验评估则创新性地采用了LLM-as-a-Judge策略,使用GPT-4o作为评估器,对GPT-4o-mini生成的回答在相关性、清晰度、完整性、流畅性、一致性、可操作性(Actionability)、幻觉最小化(MoH)和数据利用有效性(DUE)等多个维度进行量化评分,以验证方法的有效性。
研究的主要成果体现在以下几个方面。首先,在系统设计层面,论文通过两位代表性消费者(萨拉和伊丽莎白)的用例,具体阐述了系统如何应对多方面的食品选择挑战,如个性化营养指导、可持续性透明度和消费者赋权与意识。其次,在架构实现上,研究提出的本体增强的RAG架构如图4所示,清晰地展示了FoCOSA本体如何贯穿索引、检索和生成三个阶段,发挥“图作为主题专家”的作用,而非作为内容中心或可查询数据库。这区别于传统的GraphRAG模式,形成了所谓的“本体增强的GraphRAG”模式。此外,论文详细描述了FoCOSA本体的三大模块——消费者模块、营养模块和可持续性模块(其核心概念和关系分别见图1、图2和图3),以及它们如何支撑系统的语义推理。最后,在实验评估部分,研究团队在多个公开数据集和生成数据集(见表2)上进行了系统测试。结果表明,与未使用本体增强的基线RAG系统相比,该本体增强系统在多个评估指标上均表现出更优的性能。特别是在减少幻觉和提升数据利用有效性方面效果显著,证明了本体在约束LLM生成、确保领域知识一致性方面的价值。
研究得出结论,这种将模块化本体深度集成到RAG管线中的方法,有效结合了结构化本体知识的确定性与LLM在自然语言理解和生成上的灵活性。它为解决大语言模型在专业领域应用中的幻觉和知识不准确问题提供了一种可行的技术路径。该工作不仅为个性化、可持续的食品咨询系统提供了具体的实现方案和评估框架,其方法论(如LLM-as-a-Judge评估策略、基于本体的查询重写和语义块描述生成)也为其他需要结合深度领域知识与生成式人工智能的对话系统(如医疗健康、教育咨询、工业维护等)提供了有益的参考和设计指南。该研究成果发表在《Data & Knowledge Engineering》期刊上,标志着在利用符号人工智能(本体)与子符号人工智能(大语言模型)协同提升领域智能系统性能方面迈出了坚实的一步。