《Sensors and Actuators B: Chemical》:MVSP-SACFormer: A mixed gas identification method under low- resource conditions
编辑推荐:
电子鼻混合气体识别面临传感器交叉敏感和低资源样本两大挑战。本文提出MVSP-SACFormer框架,通过多视图子空间投影(MVSP)增强特征表达,结合跨光谱注意的卷积Transformer(SACFormer)融合时空谱特征,在仅40%训练数据下实现甲烷-乙烯98.03%、乙烯-一氧化碳97.06%的识别准确率。
关仁伟|张凯琳|刘汉哲|李建波|王子文|孙新欣|冯敬丽|李艳|朱旭阳|张炬
天津工业大学生命与健康智能研究院,天津生命与健康检测重点实验室,中国天津300384
摘要
受哺乳动物嗅觉系统的启发,电子鼻(e-nose)技术已广泛应用于环境监测、食品安全和医疗诊断领域。然而,混合气体识别仍面临两个挑战。首先,气体传感器阵列存在显著的交叉敏感性和低选择性,导致不同气体之间的响应高度重叠,冗余特征掩盖了关键的区分信息,从而形成了一个稀疏且定义不清的决策空间。其次,在实际应用中,电子鼻系统常常面临训练样本有限的问题,使得现有方法在资源匮乏的情况下表现不稳定。为了解决这些问题,本文提出了一种适用于资源匮乏环境的混合气体识别框架MVSP-SACFormer。在特征提取阶段,我们设计了一种多视图子空间投影编码(MVSP)机制,通过独立的随机观测矩阵将原始传感器响应映射到多个低维子空间中,生成结构多样且信息互补的压缩特征,从而在资源有限的情况下提升特征表达能力。在建模阶段,我们构建了一种光谱感知卷积变换器(SACFormer),融合了光谱、动态时间和空间结构特征,以深入挖掘复杂混合气体响应中的关键模式。在两个公开的混合气体数据集上的实验表明,即使仅使用40%的训练数据,MVSP-SACFormer也能取得出色的识别性能:在甲烷-乙烯混合气体数据集上达到98.03%的准确率,在乙烯-一氧化碳混合气体数据集上达到97.06%的准确率。这些结果验证了所提出方法作为资源匮乏环境下电子鼻系统通用模式识别框架的有效性。
引言
哺乳动物的嗅觉系统(图1(a))是一种高度复杂和精确的感觉机制,它通过嵌入鼻上皮的嗅觉受体检测空气中的化学物质,并将这些信号传递到大脑的嗅觉皮层进行解读[1]。尽管人类鼻子大约有323种嗅觉受体类型,而大鼠则有高达1223种,但人类的嗅觉在将气味与意义联系起来、分类以及与过去经验关联方面具有明显优势,这得益于高级认知过程的参与[2]。受这一生物机制的启发,人工嗅觉系统(即电子鼻,图1(b))被开发出来,利用气体传感器阵列和微电子技术模拟感知过程,并依靠模式识别算法来模拟大脑的决策功能[3]。电子鼻技术在环境监测[4]、[5]、[6]、食品质量评估[7]、[8]、[9]以及医疗诊断[10]、[11]、[12]等领域得到了广泛应用,展现了其重要的工程价值。
近年来,电子鼻模式识别研究从专家驱动的方法转向了数据驱动的方法。基于深度学习的电子鼻系统架构[13]、[14]、[15]、[16]相比传统的机器学习方法[17]、[18]、[19]、[20]受到了更多关注,大多数研究集中在架构创新上。这些方法主要分为三类:第一类关注通过建模整个传感器阵列响应模式来提取空间结构特征。例如,王等人[21]开发了一种多任务卷积神经网络(CNN)架构,通过大型数据集训练来预测12种挥发性有机化合物(VOCs)的多个指标。第二类关注动态时间特征。倪等人[22]用他们的高斯时间卷积网络(TCN)模型展示了这种方法在预测不同条件下二氧化碳浓度方面的应用。第三类强调融合空间和时间特征,其性能优于依赖单一维度特征建模的方法[23]。杨等人[24]通过他们的级联CNN-长短期记忆网络(LSTM)架构展示了这一点,该架构同时提取时间和空间属性,实现了对12种VOC类型的准确识别。这些方法利用结构设计从气体响应过程中提取具有区分性的特征,显著提高了电子鼻系统的识别能力。
对于混合气体识别任务,越来越多的研究从端到端模型转向了结合特征提取和深度学习的混合方法。例如,楚等人[25]应用变分模式分解(VMD)对混合气体信号进行预处理以预测浓度;李等人[26]通过仅选择前10秒钟的数据作为CNN输入来进行严格的时间下采样;刘等人[27]提出了一种结合时间校正和多间隔采样的渐进式预测算法(PPA)用于实时混合气体识别。
尽管取得了这些进展,但在混合气体识别的实际应用中仍存在两个挑战:
(1)气体传感器阵列存在交叉敏感性和低选择性,导致不同气体成分之间的响应特征高度纠缠。冗余特征掩盖了关键的区分信息,导致决策空间稀疏且定义不清,使得模式识别变得复杂。Sung等人[28]强调,充分利用光谱特征对于深度学习模型解决由交叉敏感性引起的响应歧义至关重要。然而,现有方法通常缺乏对电子鼻数据中的光谱、时间和空间结构特征的有效联合建模,也无法有效抑制冗余并增强区分结构。
(2)其次,在实际应用场景中,电子鼻系统经常面临训练样本有限的挑战,例如基于呼出气体的肺癌检测[29]和使用环境气体监测的灾难救援[30]。然而,现有方法通常依赖于大规模的数据驱动方法,这使得它们不适合资源匮乏条件下的混合气体识别任务(“资源匮乏”特指标记训练样本的可用性有限的情况)。
为了解决上述两个问题,本文提出了一种适用于资源匮乏环境的混合气体识别框架。该框架包括两个部分:
(1)在特征提取部分,设计了一种多视图子空间投影编码(MVSP)机制。它通过多组独立的随机观测矩阵将原始传感器响应数据映射到多个低维子空间中,生成结构多样且信息互补的特征,从而在资源有限的情况下增强特征表达能力并丰富训练数据分布。
(2)在模型设计部分,提出了一种光谱感知卷积变换器(SACFormer)架构。它融合了光谱、动态时间和空间结构特征,以在资源匮乏条件下从混合气体响应数据中提取关键区分模式。
多视图子空间投影编码
如图2(a)所示,设原始传感器响应数据为,其中C表示传感器通道的数量,表示采样长度。
对于每个视图,构建相应的观测矩阵,其中每个元素都独立来自标准正态分布,并按如下方式归一化:
这里,S表示观测矩阵组(即视图)的数量,这是一个可调的超参数,用于控制
数据集描述
本研究使用了Fonollosa等人在UCI机器学习仓库发布的甲烷-乙烯-一氧化碳混合气体传感器数据集[37]。由于该数据集具有长期、连续和多组分动态扰动的特点,已在电子鼻和模式识别研究中得到广泛应用[38]、[39]。图4展示了实验中的气体制备和传感器信号采集全过程。
MVSP-SACFormer的组件组成和性能影响分析
为了全面评估MVSP-SACFormer框架核心组件在减轻传感器交叉敏感性、增强特征表达能力以及提高资源匮乏条件下模型泛化能力方面的有效性,我们从三个角度进行了实验分析和讨论:投影矩阵分布策略、网络特征建模模块的设计以及SAM的内部机制。
首先,为了评估不同
结论
为了解决资源匮乏条件下的混合气体识别问题,本文提出了MVSP-SACFormer框架。通过多视图子空间投影编码(MVSP)生成结构多样且信息互补的多视图子空间特征,并通过基于光谱感知卷积变换器(SACFormer)的深度建模机制整合光谱、动态时间和空间结构特征,所提出的方法有效提取了更多
CRediT作者贡献声明
张炬:撰写——审稿与编辑、方法论、数据管理、概念化。关仁伟:撰写——初稿、验证、软件开发、方法论。张凯琳:撰写——审稿与编辑、监督、方法论、资金筹集。刘汉哲:撰写——初稿、可视化、验证、数据管理。李建波:撰写——审稿与编辑、概念化。王子文:撰写——审稿与编辑、数据管理。孙新欣:撰写——审稿与编辑。冯敬丽:
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。
致谢
本工作得到了国家自然科学基金(22304130)、国家重点研发计划(2023YFB3210100)和天津工业大学青年教师跨学科研究项目的资助。
关仁伟目前正在天津工业大学攻读硕士学位,他的研究方向包括电子鼻和智能信号处理。