综述:知识图谱与大型语言模型的协同作用在食品安全领域:方法与展望

《Trends in Food Science & Technology》:Knowledge Graph and Large Language Model Synergy for Food Safety: Approaches and Perspectives

【字体: 时间:2026年01月30日 来源:Trends in Food Science & Technology 15.4

编辑推荐:

  知识图谱与大型语言模型在食品安全领域的协同应用研究进展,提出基于KG-LLM框架的跨模态数据融合方法,突破传统静态数据库局限,实现动态风险预测与智能决策支持。典型应用包括食品溯源系统、消费者安全信息平台和跨部门知识共享机制,推动从被动检测向主动风险评估转型。关键技术挑战涉及多源异构数据对齐、模型可解释性提升及监管合规性设计。

  
郝欣安|青丽东|阿加皮·杜尔格拉基|乔治-约翰·尼查斯|周子文|刘阳泰
上海科技大学,200098,上海,中国

摘要:

食品供应链的全球化以及异构、多模态数据流的激增增加了食品安全管理的复杂性。有限的语义推理能力、数据互操作性的不足以及危险检测的延迟或不及时,正在逐渐制约传统的治理框架,这些框架依赖于静态数据库和碎片化的信息流。知识图谱(KG)提供了多源数据的结构化、语义关联的表示,实现了跨领域集成和因果推断。另一方面,大型语言模型(LLM)在处理和生成自然语言方面表现出色,能够从非结构化来源中自动提取关键的安全实体和关系。本综述介绍了KG-LLM在食品安全领域的最新进展,强调了它们在多模态知识表示、动态知识融合、可信推理和自动化构建中的互补作用。同时,还回顾了在专家知识挖掘、智能决策支持系统和消费者服务中的典型应用,展示了从被动的数据驱动响应向主动的风险评估的转变。可以预见,跨模态对齐、法规遵从性和伦理治理将为构建智能、高效且可解释的食品安全监管框架提供理论支持。

引言

食品安全作为全球公共卫生系统的核心组成部分,与人类健康、公平贸易和社会稳定密切相关。世界卫生组织(WHO)估计,每年有近10%的世界人口受到不安全食品的影响,导致约42万人死亡,并在低收入和中等收入国家造成超过1100亿美元的经济损失(WHO,2024年)。与食品安全相关的数据贯穿了从农场到餐桌的整个过程,从初级生产到加工、储存、分销、零售,最终到消费(Han等人,2022年;Nychas等人,2021年)。然而,全球化和数字化转型加剧了系统性挑战,包括多模态数据集的快速增长、数据孤岛的形成以及机构间知识共享的障碍(Aung & Chang,2014年)。尽管大数据分析和机器学习在某些领域改善了检测和可追溯性(Hao等人,2022年;Patelli & Mandrioli,2020年),但在语义理解、多模态推理和快速危险响应方面的局限性仍未解决。
2012年,谷歌首次提出了知识图谱(KG)的概念,通过构建实体之间的关系网络,将搜索范式从“字符串(关键词)”转变为“事物(实体)”,以理解用户查询的真正意图(Amit,2012年)。如今,KG是一种以图结构形式表示和存储知识的语义网络,旨在描述现实世界中的实体、概念及其语义关联。它将数据组织为相互连接的三元组,即“实体–关系–实体”或“实体–属性–值”,支持语义推理和复杂查询。随着技术的不断进步,KG逐渐成为人工智能(AI)领域中的一个关键基础设施,用于整合多源异构数据并增强推理能力(Hogan等人,2022年;Peng等人,2023年;Huang & Vidal,2024年)。与传统数据库相比,KG更强调明确的语义关系,如因果依赖性和层次分类,使其非常适合整合异构和跨领域的数据集。
大型语言模型(LLM)是在大量文本数据上训练的深度学习系统(Shanahan,2024年)。如今,LLM可以被视为基于Transformer的生成模型,利用大规模预训练来估计下一个标记的概率,从而表现出强大的上下文理解能力、在上下文中的学习行为以及一系列新兴能力,这些能力正在重塑多模态处理、自然语言理解和数据驱动发现等研究领域。在文本挖掘应用中,它们强大的自然语言理解能力进一步支持从非结构化文献中自动提取实体–关系对,并生成人类可读的风险摘要(Brown等人,2020年;Zhao等人,2023年)。最近的同行评审工作还表明,经过微调的LLM可以在科学文本上可靠地执行联合命名实体识别(NER)和关系提取(Dagdelen等人,2024年)。LLM通过提高生产力并重塑科学研究方法,正在改变科学研究(Zhang等人,2025年)。
食品供应链的日益复杂,加上异构数据源的指数级增长,给及时和准确的食品安全风险评估带来了重大挑战(Donaghy等人,2021年;Nychas等人,2021年)。有效的风险分析需要整合结构化和非结构化信息,推理因果关系(Talari等人,2022年),并生成可操作的见解以支持生产、加工和分销阶段的决策。传统的分析方法往往难以处理这种大规模的多维和/或异构数据以及快速变化的危险。在这种情况下,KG和LLM的结合提供了一个有前景的途径。通过利用这两种技术的互补优势,可以增强食品安全管理中的风险预测、可追溯性和决策支持。目前,LLM已广泛应用于食品科学的各个领域,包括食谱开发、营养分析、食品安全预测、供应链管理和法规遵从性。Ma等人(2024年)系统总结了LLM在食品科学中的创新和应用趋势,强调这些模型不仅改变了数据分析方法,还推动了从被动检测向主动预测的转变。
因此,本综述系统地概述了KG和LLM在食品安全中的集成框架、最新应用和未来展望,旨在为智能治理工具和基于证据的政策制定提供理论支持。

部分摘录

食品安全中的传统知识图谱

如图1所示,构建KG始于知识建模,通过定义所需的实体、关系及其属性来建立图的基本结构框架。随后从各种来源获取数据,包括公开可用的数据集。收集到的结构化和半结构化原始数据经过数据集成过程,进行清洗、对齐并合并成统一格式(Zhong等人,2024年)。

食品安全中的独立LLM应用

LLM是基于大规模神经网络的AI系统,旨在理解和生成类似人类的文本。它们通常采用Transformer架构,利用自注意力机制处理长距离依赖关系,并通过自我监督学习在庞大的文本语料库上进行训练(Raza等人,2025年;Xu等人,2025年)。现代LLM通常包含数十亿个参数,通过迁移学习捕获复杂的语言模式,实现最先进的功能

用于食品安全的大型语言模型驱动的知识图谱

LLM与KG的集成受到了越来越多的关注,因为这两种方法是互补且相互强化的(Gilbert等人,2024年;Ibrahim等人,2024年;Wang,2024年)。如图2所示,KG提供了可靠、可解释且特定于领域的结构化知识库,但覆盖范围有限且自然语言理解能力较弱。相比之下,LLM提供了广泛的常识知识、强大的语言能力和泛化能力,但面临

当前挑战和实际限制

尽管在食品安全应用中整合KG和LLM方面取得了有希望的进展,但仍存在多个特定于领域的技术和实际挑战。这些限制阻碍了在现实世界食品安全治理、风险评估和智能决策支持中的可靠和负责任的部署,因此值得专门讨论。

未来展望

随着技术的不断发展,知识图谱和大型语言模型的协同集成预计将超越概念上的协同作用,发展成可部署、可审计且领域稳健的食品安全治理智能系统。在现有进展的基础上,几个研究方向具有特别的前景。
首先,在资源匮乏条件下进行跨领域迁移和少量样本适应仍然是一个关键挑战和机遇。

结论

本文系统回顾了KG和LLM在食品安全领域协同应用的最新研究进展。随着食品系统的变化,确保在从农场到餐桌的复杂多阶段供应链中保持安全和质量面临许多紧迫问题。这些问题包括面对环境挑战的食品安全、消费者对新鲜和可持续产品的需求增长,以及旧测试程序的不足,这些程序既缓慢又有害。
最近

未引用参考文献

Chen等人,2023年;Liu等人,2023年;JJ-Author等人,2025年;世界卫生组织,2024年;Xu等人,2025年;Yang等人,2024年。

CRediT作者声明

郝欣安:概念化、撰写——初稿、可视化;青丽东:撰写——审阅和编辑;阿加皮·杜尔格拉基:项目管理、撰写——审阅和编辑;乔治-约翰·尼查斯:撰写——初稿、撰写——审阅和编辑;周子文:概念化;刘阳泰:概念化、资金获取、项目管理、监督、可视化、撰写——初稿、撰写——审阅和编辑

利益冲突声明

作者声明,本研究是在没有任何可能被视为潜在利益冲突的商业或财务关系的情况下进行的。

致谢

本研究得到了国家自然科学基金(32102095)和欧盟的Horizon(2023)(101184578)的资助。同时,我们向Kostantinos Koutsoumanis教授表示最诚挚的感谢和怀念。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号