利用空间依赖性实现多变量时间序列传感器数据的领域泛化

【字体: 时间:2026年02月28日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对多变量时间序列(MTS)数据因传感器配置差异导致的领域分布偏移问题,提出两阶段自适应空间依赖对齐框架。首阶段学习传感器位置嵌入与图结构,结合两视正则化提升鲁棒性;次阶段通过可学习查询嵌入动态对齐不同域的空间依赖,理论证明其等价于信息瓶颈优化。在四个真实数据集上的实验表明,方法在域泛化任务中优于13种基准模型。

  
作者:Bae Jaehyun | Jung Heesoo | Park Hogun
韩国成均馆大学人工智能系

摘要

来自多个传感器的多变量时间序列(MTS)数据由于传感器错位、重新连接或个体差异等因素,往往在不同领域之间存在差异,这对领域泛化(DG)构成了重大挑战。现有方法通常假设一个统一不变的时空结构,忽略了由不同传感器关系引起的分布差异。为了解决这一限制,我们提出了“MTS数据中的自适应空间依赖对齐方法用于领域泛化”(Adaptive Spatial Dependency Alignment in MTS Data for Domain Generalization),这是一个新颖的两阶段框架,可以自适应地对齐不同领域之间的空间依赖关系。具体来说,该框架包括一个感知输入的图生成模块和一个基于图神经网络(GNN)的领域泛化层,以及一个领域泛化损失函数,这些组件将第二阶段学习到的空间依赖关系与第一阶段建立的关系对齐,从而实现更精确和一致的跨领域对齐。此外,我们还采用了双视图正则化策略来确保传感器的独立性和时间一致性。我们的理论分析表明,这种方法有助于提高模型在多样化分布下的鲁棒性。通过对四个真实世界数据集的广泛评估,我们发现该方法的性能优于现有的十三个基线方法。据我们所知,这项工作是首批专注于广泛空间依赖对齐的研究之一,为MTS数据的领域泛化开辟了新的方向。我们的代码可在以下链接获取:https://anonymous.4open.science/r/ASAM_IF

引言

在分析多变量时间序列(MTS)数据相关的人类行为时,识别多传感器结构与同时发生的时间序列特征之间的复杂相互作用至关重要(Cai, Liang, Liu, Feng, Wu, 2024; Liu, Yao, Cheng, Chen, 2025; Qiu, Zhang, Wang, Liu, Cheng, Wu, 2025; Yi, Zhang, Fan, He, Hu, Wang, An, Cao, Niu, 2024)。这种固有的复杂性可能导致MTS数据在不同领域之间的分布差异,其中“领域”被定义为数据收集条件,例如不同的受试者或同一受试者的不同记录重复次数(Farina, Jiang, Rehbaum, Holobar, Graimann, Dietl, Aszmann, 2014; He, Queen, Koker, Cuevas, Tsiligkaridis, Zitnik, 2023)。图1展示了两种不同传感器配置的情况:(a) 传感器错位;(b) 传感器排列。图1-(a)通常发生在同一受试者多次重新连接传感器的情况下(重复测量)。例如,表面肌电图(sEMG)信号由于多次重新连接而表现出显著的变化,导致传感器在空间上错位(Farina et al., 2014)。图1-(b)中所示的传感器排列情况在MTS数据中也很常见,因为传感器顺序的变化可能源于数据采集流程或传感器部署条件的差异(Emiya, Bonnefoy, Daudet, & Gribonval, 2014)。这两种情况都可能导致MTS数据在不同领域之间存在特定的空间分布偏移,每个领域都有不同的空间依赖关系。 领域泛化(DG)方法最近受到了广泛关注,旨在减轻不同领域之间的分布偏移。在这里,我们将训练时使用的领域称为源领域,而在测试时遇到的未见领域称为目标领域。与无监督领域适应(UDA)不同,后者在训练过程中结合目标领域特征以减轻领域偏移,DG严格禁止在训练期间访问目标领域数据。这种限制在医疗保健等领域尤为重要(Deng, Sprangers, Li, Schelter, de Rijke, 2024; Zhang, Dullerud, Seyyed-Kalantari, Morris, Joshi, Ghassemi, 2021a)。除了MTS传感器数据外,一些研究还提出了基于图的DG方法(Miao, Liu, Li, 2022; Sui, Wang, Wu, Lin, He, Chua, 2022),这些方法通过提取不变的图结构来纳入领域的空间依赖关系。然而,基于图的领域泛化方法在处理实际中遇到的MTS特定分布偏移方面仍然存在局限性,因为它们主要依赖于提取一个固定的、跨领域共享的空间结构,这可能不足以捕捉复杂的跨领域传感器对齐问题,包括传感器错位或排列(Zhang, Zeman, Tsiligkaridis, & Zitnik, 2022)。据我们所知,专门针对MTS数据设计的DG方法,考虑到不同领域之间空间配置的差异,目前研究还较少。 在本文中,我们提出了“MTS数据中的自适应空间依赖对齐方法用于领域泛化”,这是一个新颖的两阶段框架,明确解决了由传感器引起的错位和排列问题。我们的关键见解是结合了以下两个方面:(1) **传感器位置嵌入**:我们嵌入每个传感器的身份和潜在的空间角色,以便即使在重新排序或移动后,通道仍然可区分;(2) **领域泛化层**:一个可学习的领域泛化层,用于查询新领域,并将其传感器嵌入转换为从训练领域学到的共享空间配置。因此,我们将每个新领域的表示与之前的传感器关系对齐,而不是假设一个固定的邻接关系或通道顺序。 技术上,该过程分为两个阶段。**第一阶段**使用传感器位置嵌入和基于图的层来学习传感器之间的领域不变关系。我们通过双视图正则化来防止过拟合目标领域,包括:通道去相关损失,强制每个传感器的嵌入捕获独特且不冗余的信息;以及高斯核损失,促进平滑的局部时间结构,以强化重要的信号模式。**第二阶段**引入了一个领域泛化层,用于自适应地将未见领域与学习到的空间表示对齐。这个DG层通过一个可学习的查询嵌入进行参数化,以生成一个输入驱动的邻接矩阵,从而适应传感器排列或重新连接的情况。我们定义了一个领域泛化损失函数,以保持转换后的表示与第一阶段学到的原始的、领域不变的特征接近,确保跨领域的鲁棒对齐。 我们进一步从理论上证明了优化第二阶段的损失等同于实现一个MTS驱动的信息瓶颈,保留与任务相关的传感器信息,同时丢弃领域特定的噪声。我们证明了这一目标能够最大化领域对齐表示与学习到的传感器角色之间的互信息,同时最小化对领域特性的依赖。 我们的模型在四个真实的MTS传感器数据集上进行了严格评估,包括表面肌电图(sEMG)和人类活动识别(HAR)数据集,这些数据集由于传感器错位而自然具有不同的分布。实证分析证实了该方法比现有的十三个基线方法更有效。此外,通过对不同领域配置进行传感器排列实验的进一步分析,突显了该方法在解决MTS特定领域偏移方面的显著优势。

领域泛化

领域泛化(DG)旨在减轻不同领域之间的分布偏移。由于分布偏移问题可能出现在各种领域,包括计算机视觉(Thota & Leontidis, 2021)、自然语言处理(Glorot, Bordes, & Bengio, 2011)和图论(Fan, Wang, Mo, Shi, Tang, 2022, Miao, Liu, Li, 2022),因此DG受到了越来越多的关注。大多数DG方法试图识别不变信息,并大致分为两类:

问题定义

为了清晰起见,本文中使用的主要符号在表2中进行了总结。MTS数据集中的每个实例可以表示为XRN×T,其中N表示传感器的数量(通道数),T表示时间戳的数量。数据集可以形式化为D={(X(i), Y(i))i=1DOM,其中DOM表示领域的数量,X(i)Y(i)分别是第个领域的数据和标签集。D被划分为D(源领域集合)和D(目标领域集合)。

数据集

我们使用四个数据集来验证我们的方法:两个用于手势识别的表面肌电图(sEMG)传感器数据集和两个用于人类活动识别(HAR)的数据集。 Ninapro 2是一个广泛用于手势识别的sEMG数据集(Pizzolato et al., 2017)。它包含10个大型数据库;我们使用了Ninapro DB 5,其中包含来自两个MYO臂带传感器的数据(总共16个通道)。

讨论

在本节中,我们讨论了实际考虑因素、局限性以及未来的研究方向。我们涵盖了(5.1)时间依赖效应,如传感器漂移及其与MTS中传感器结构变化的相互作用;(5.2)随着传感器数量增加而产生的二次图构建的可扩展性问题;以及(5.3)建模层次化空间依赖关系的潜在好处。

结论

本文提出了一个针对MTS数据的领域泛化框架,该框架明确解决了MTS特定的分布偏移问题。通过学习传感器位置嵌入,捕捉传感器角色,并通过专用的DG层对齐不同领域之间的空间依赖关系。我们还提供了理论见解,支持所提出的对齐目标在未见领域下的鲁棒性。据我们所知,这是首批研究MTS领域泛化方法的工作之一。

CRediT作者贡献声明

Bae Jaehyun:概念化、数据整理、形式分析、方法论、软件开发、可视化、初稿撰写及审稿编辑。 Jung Heesoo:概念化、数据整理、形式分析、方法论、软件开发、可视化、初稿撰写。 Park Hogun:概念化、研究设计、资金获取、项目管理、监督、审稿编辑。

利益冲突声明

作者声明以下可能的财务利益/个人关系:Hogun Park报告称获得了韩国创意内容机构(Korea Creative Content Agency)的财务支持;Hogun Park报告称获得了信息与通信技术规划与评估研究所(Institute of Information & Communications Technology Planning & Evaluation)的财务支持;Hogun Park报告称获得了韩国国家研究基金会(National Research Foundation of Korea)的财务支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号