FabricSpec-RAG:一个基于知识图谱的Seq2Seq框架,通过近红外光谱对复杂纺织混合物进行定量分析

《Analytica Chimica Acta》:FabricSpec-RAG: A knowledge graph-augmented Seq2Seq framework for quantitative analysis of complex textile blends from NIR spectra

【字体: 时间:2026年06月03日 来源:Analytica Chimica Acta 6

编辑推荐:

  邱迅|孙凤强|刘友龙|孙恒达|王刚|张杰中国上海市东华大学信息与智能科学学院人工智能研究所,邮编201620摘要通过近红外(NIR)光谱对复杂纺织混合物进行定量分析对于工业回收至关重要,但这一过程受到光谱重叠严重和成分变化多端的阻碍。传统的深度学习模型在处理罕见成分时常常表现不佳

  
邱迅|孙凤强|刘友龙|孙恒达|王刚|张杰
中国上海市东华大学信息与智能科学学院人工智能研究所,邮编201620

摘要

通过近红外(NIR)光谱对复杂纺织混合物进行定量分析对于工业回收至关重要,但这一过程受到光谱重叠严重和成分变化多端的阻碍。传统的深度学习模型在处理罕见成分时常常表现不佳,且缺乏足够的透明度。为了解决这些问题,我们提出了FabricSpec-RAG,这是一个序列到序列(Sequence-to-Sequence)框架,它将多尺度卷积编码器与检索增强生成(Retrieval-Augmented Generation, RAG)机制相结合,使预测结果基于一个分层且不断发展的知识图谱。广泛的实验表明,该框架在成分识别方面的Micro-F1分数达到了0.9880,在比例预测方面的平均绝对误差(Mean Absolute Error, MAE)为0.0026。可解释性分析证实,该模型能够捕捉到化学上有效的光谱特征。此外,该系统设计为可连续适应新材料的出现,无需昂贵的重新训练即可更新知识库。

引言

全球纺织行业通常采用不可持续的“获取-制造-废弃”线性模式[1],[2],[3],[4],[5],这对地球资源造成了巨大压力,并使该行业成为气候变化的主要贡献者之一[6],[7],[8]。该行业主要受“快时尚”的驱动,产生了大量的二氧化碳排放和污染[6],[7],[9],[10]。随着纺织废料量的预计大幅增加[11],[12],[13],向循环经济的转型已成为环境和经济上的迫切需求[1],[11],[14]。虽然高价值的纤维到纤维回收是这一转型的核心,但现有基础设施仍然不足:尽管回收率很高,但绝大多数消费后废料并未被重新用于生产新的纺织品[3],[12],[13]。
这一流程中的主要瓶颈是分类。人工分类劳动密集且容易出错,尤其是考虑到现代纺织品的复杂性[9],[15],[16],[17],它无法应对大量废弃服装的处理。现代纺织品通常包含复杂的混合物(例如棉-聚酯-弹性纤维[13],[16],[17]),而大多数回收技术需要纯净、定义明确的原料[5],[13],[18]。因此,纺织循环经济的核心挑战已经从简单的材料识别转变为快速、可扩展且准确的定量分析复杂成分混合物。
近红外(NIR)光谱技术已成为自动化分类的领先技术[15],[16],[17]。通过探测780–2500纳米范围内的分子振动[19],NIR提供了一种快速、非破坏性的化学成分分析方法,利用特征光谱指纹[20],[21],[22]。然而,记录的光谱很少仅仅是化学成分的简单函数;它还受到物理变化(如织物结构、纱线厚度)和化学添加剂(如染料和整理剂[16],[20],[23])的强烈影响。这些现实世界中的变化显著降低了在原始实验室样本上训练的模型在多样化消费后流中的泛化能力[24],[25],[26],[27]。
NIR分析传统上依赖于线性化学计量方法,如偏最小二乘(Partial Least Squares, PLS)回归[28],[29]。这些方法对于简单的二元混合物有效,但在处理废弃纺织品的强非线性和光谱干扰时效果不佳[24],[30]。最近向深度学习的转变,特别是1D卷积神经网络(1D Convolutional Neural Networks, CNNs)的采用,通过直接从原始光谱中学习层次化特征提高了性能[30]。然而,这些标准的深度学习方法往往像“黑箱”一样缺乏透明度,并且在处理未知成分数量的样本时遇到困难——这在废料流中是普遍现象[31],[32]。这种纯数据驱动的模型也难以适应新的涂层或染料等不可控变化,并且没有内置的机制来适应工业环境中的持续变化。
为了解决光谱分析与结构化领域知识之间的脱节,我们提出了从静态分类向生成推理的范式转变。人工智能的最新进展展示了整合知识图谱(Knowledge Graphs, KGs)来捕捉复杂关系[33],[34],[35],[36],以及检索增强生成(Retrieval-Augmented Generation, RAG)来为生成模型提供可验证信息[37],[38],[39],[40]的价值。这些技术的结合——通常称为GraphRAG——实现了多跳推理,并推动了知识密集型应用的发展[36],[41],[42],[43]。然而,其在定量光谱学中的应用仍然很大程度上未被探索。
在本文中,我们介绍了FabricSpec-RAG,这是一个将稳健的定量分析与知识整合相结合的新框架。与传统方法不同,我们的方法将定量分析重新定义为基于序列到序列(Sequence-to-Sequence, Seq2Seq)架构的动态生成任务,将原始光谱映射到成分和百分比的结构化输出。FabricSpec-RAG将这种生成模型与GraphRAG机制相结合,通过将预测结果基于动态发展的知识图谱来克服静态数据驱动模型的局限性。该框架不仅在多组分混合物上实现了具有竞争力的准确性,还提供了一种可解释的、人类参与的过程,能够持续适应新材料,为循环纺织经济提供了强大的工具。

章节片段

材料与方法

我们评估了FabricSpec-RAG在废弃纺织品混合物定量分析中的准确性和稳健性。本节描述了数据集和光谱采集协议、所提出框架的三个阶段,以及实验中使用的评估指标、基准和实现细节。

结果与讨论

本节详细评估了FabricSpec-RAG框架,结合了实验结果和对潜在化学和计算原理的讨论。我们将该模型与竞争基准进行了比较,验证了其架构组件的必要性,并检验了其可解释性和工业适用性。

结论

本文介绍了FabricSpec-RAG,这是一个通过结合生成式深度学习模型和动态知识图谱来应对复杂纺织品定量NIR分析挑战的新框架。该框架展示了如何将基于图的RAG机制应用于分析化学,从而在识别和量化纺织成分方面实现了具有竞争力的性能,特别是对于复杂混合物。
其核心贡献不在于原始准确性,而在于...

CRediT作者贡献声明

邱迅:撰写——原始草稿、可视化、验证、监督、软件、资源、项目管理、方法论、研究、资金获取、正式分析、数据管理、概念化。孙凤强:数据管理。刘友龙:概念化。孙恒达:概念化。王刚:概念化。张杰:概念化。

代码可用性

资助

得到中央高校基本科研业务费(编号:2232025A-06)的支持。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号