基于L2范数排序的多层态势感知架构在工业物联网中的应用——以多机器人系统为例

《Internet of Things》：Multi-Level Situation Awareness Architecture with L2-Norm Ranking of States for Industrial Internet of Things: Case Study of Multi-Robot Systems

【字体：大中小】 时间：2026年05月10日 来源：Internet of Things 7.6

编辑推荐：

　　穆罕默德·纳西尔|阿南达·梅蒂|徐淑香|索拉布·加格塔斯马尼亚大学信息通信技术学院，朗塞斯顿，塔斯马尼亚州，7250，澳大利亚摘要工业物联网（IIoT）依赖于情境感知（SA）通过传感器数据来监测运行状态并检测异常。然而，现有的SA框架依赖于集中式处理，并且在层

　　穆罕默德·纳西尔|阿南达·梅蒂|徐淑香|索拉布·加格
塔斯马尼亚大学信息通信技术学院，朗塞斯顿，塔斯马尼亚州，7250，澳大利亚

摘要
工业物联网（IIoT）依赖于情境感知（SA）通过传感器数据来监测运行状态并检测异常。然而，现有的SA框架依赖于集中式处理，并且在层次聚合过程中缺乏对异常信息的保留，这使得定位异常条件的来源变得困难。为了解决这些挑战，提出了一个可扩展的多层情境感知（MLSA）框架，该框架支持自下而上的聚合和自上而下的追踪，并具有适应性重新校准功能，以在分层IIoT应用中定位异常条件。在这项工作中，首先开发了一个结合LSTM和1D CNN的混合模型，利用边缘级别的时间序列数据来识别运行状态。然后，提出了一种基于度量的聚合机制，在更高级别上使用L2范数整合异常描述符并计算综合情境分数。所提出的方法通过传播紧凑的状态描述符来避免传输原始数据，从而减少了通信开销。最后，提出了一种自适应阈值策略，用于选择性追踪和异常分支的局部重新校准。这使得IIoT应用能够在聚合过程中保留并揭示分支级别的异常信息，从而形成一种异常条件可区分的严重性传播模式。在多个数据集上的实验结果表明，该框架能够在层次间保持异常的可分离性，并且比集中式SA方法更有效地定位故障。

1. 引言
物联网应用（如微电网、多机器人系统（MRS）、工业4.0和工业5.0）因其在最小化停机时间和提高运营效率方面的潜力而受到业界和研究人员的广泛关注。这些系统通过互联网或专用网络交换数据并协调执行单独或共享的任务。然而，IIoT应用面临诸多挑战，例如节点间的通信延迟、异常情况、机械故障、定位异常条件的来源以及层次聚合等问题。为了解决这些问题，我们提出了一种情境感知（SA）框架，该框架不仅可以评估单个边缘节点的运行状态，还可以捕捉系统更高层次的总体状态。SA可以分为边缘级别的SA或多层SA（MLSA）。边缘SA专注于边缘级别的监控和决策，无需依赖云或中央系统即可实现局部响应；相比之下，MLSA则在IIoT网络的层次层面上聚合和分析数据，以提供系统行为的全局理解并促进协调决策。

现有文献提出了多种利用AI算法预测系统状态以及使用L2范数估计故障或错误的技术，但这些技术仍存在显著的限制。例如，基于L2范数和随机森林模型的故障检测方法能够识别机器人子系统中的故障，但在不同层次的IIoT应用中提供层次SA的能力有限。同样，为MRS提出的上下文感知框架也展示了良好的结果，但其支持在更高级别上对MRS总体状态进行排序的能力有限，且仅限于上下文感知而非SA。另一种为钻井机械设计的1D-CNN框架在复杂条件下实现了准确的故障检测，但忽略了多智能体系统的视角，这对于全面的IIoT应用至关重要。还有基于1D-CNN的分层SA方法用于在边缘和云级别检测入侵事件。然而，这些技术依赖于云指令来响应异常，这可能会延迟决策过程。一些研究使用时间序列指标（包括异常比例、影响范围、紧急性和趋势）来预测IIoT应用的状态，但仍然缺乏一个统一的框架，能够系统地将这些性能指标与边缘级别预测结合起来，以确定多层IIoT应用的总体运行状态。此外，现有方法通常依赖于静态决策阈值或孤立的异常检测模型，这限制了它们适应动态工业环境的能力。当前的层次监控解决方案很少解决在系统多个层次检测到异常情况时的通信开销和诊断复杂性问题。因此，需要一种能够自上而下解释系统状态并在分层组织的IIoT系统中分配情境类别的MLSA框架，通过整合时间序列指标和边缘预测来实现这一点。

本文提出的MLSA框架解决了这些问题，通过引入自下而上的聚合和自上而下的追踪机制以及适应性重新校准功能，在保持可扩展性和分布式监控的同时，能够在分层IIoT应用中定位异常条件。该框架通过分层聚合和追踪机制实现分布式决策，将边缘级别的状态感知与系统级别的上下文相结合，保留了各层次间的异常信息，减少了通信开销，并保持了数据的局部性。它还支持在复杂层次环境中进行全面的系统监控和适应性异常检测。本文的主要贡献总结如下：
1. 开发了一种高效的边缘级别状态预测框架，使用基于LSTM的1D CNN模型在IIoT应用中实现局部SA。该模型直接从边缘的多变量时间序列数据预测运行状态（如 picking、processing、idle、drop、机械故障和异常），通过生成紧凑的状态表示，无需传输原始数据，为更高层次的聚合、追踪和MLSA框架内的适应性重新校准提供了基础输入。
2. 提出了一种可扩展的分层状态聚合框架，该框架整合了时间序列异常描述符（包括异常比例、影响范围、紧急性和趋势）与边缘级别预测，使用L2范数计算综合情境分数。在这种框架中，每个内部节点对其下层节点的输出进行排名，以聚合并确定IIoT应用的总体状态（如正常、警告或危险）。这种层次聚合机制在保持网络层次间分散计算的同时，实现了系统级别的一致解释。所提出的状态排名系统在所有内部层次上都具有可扩展性，超越了仅限于边缘级别SA的现有方法。
3. 开发了一种自适应阈值策略，将自上而下的追踪与动态阈值重新校准结合，以实现分层IIoT应用中异常条件的精确定位。在运行过程中，追踪机制根据相对情境分数识别可疑分支，而适应性重新校准机制调整基准阈值参数σ以在该分支内提高检测灵敏度。与现有方法不同，该框架在聚合过程中保留了分支级别的异常信息，并支持有效的故障定位，而无需在每个层次进行显式状态分类。此外，通过传播紧凑的状态描述符而非原始数据，该框架保持了可扩展性并减少了诊断过程中的通信开销。

本文的其余部分组织如下：第2节回顾相关工作；第3节描述了所提出的MLSA架构；第4节介绍了基于MLSA的节点级情况检测；第5节讨论了情况追踪和重新校准；第6节概述了实验设置；第7节展示了模拟结果；第8节提出了未来工作的方向；第9节总结了本文。

2. 文献回顾
2.1. 从边缘到多层的情境感知
2.1.1. IIoT中的情境感知
SA是指IIoT应用感知、处理和分析情境数据，理解其含义，并预测未来状态的能力，以便及时做出响应异常或不确定性的决策。SA框架的设计包括三个核心方面：
- 情境获取：使用传感器收集基本情境数据。
- 情境处理：实施逻辑技术将原始数据转换为有意义和复杂的情境信息。
- 情境行动：根据识别的情境自动执行相应的行动。
SA是一种高效的框架，用于跟踪IIoT应用的当前运行状态，并利用传感器数据启动必要的决策。SA框架可以在边缘SA或IIoT环境中的MLSA中实现。在第一种类型的SA中，IIoT应用的当前运行状态在边缘级别或本地节点级别进行评估，无需依赖云指令；在第二种类型中，通过聚合边缘SA和来自从节点的时间序列指标，在IIoT应用的各个层次上部署MLSA。

已有研究探讨了多种基于边缘SA确保IIoT应用可靠高效运行的方法。例如，为智能电网环境提出了一个弹性SA框架，以减轻通信延迟和网络攻击等不确定性。引入了一种基于估计理论的边缘计算技术，将计算任务从资源受限的设备卸载到边缘服务器，以确保系统性能的一致性。还开发了一种基于边缘和云的混合SA方法，用于使用分布式预测模型检测性能指标。尽管这些模型展示了良好的结果，但它们在将MLSA架构集成到现代工业系统中的能力仍然有限。

2.1.2. 多层情境感知（MLSA）
分层MLSA从边缘层开始，逐步向上层进行分析，以更好地理解系统的整体行为。每个节点仅检查自己的时间序列数据，以确定状态是picking、processing、idle、drop还是遇到机械故障或异常。每个节点仅将预测的状态传递给领导节点，而无需发送所有原始传感器读数。这降低了网络中的数据流量，促进了IIoT应用的管理。之后，将本地预测的状态与领导节点上的时间序列指标结合，以提供每个节点功能的更全面视图。领导节点使用L2范数聚合并计算综合情境分数。综合情境分数决定了系统的总体状态（如正常、警告或危险）。MLSA框架部署在边缘，以实现机器人快速检测异常，并在系统级别支持数据驱动的动作。

文献中还报道了一些MLSA框架，旨在提供比边缘级别SA更好的性能。例如，一种分层空中计算技术将无人机计算任务从边缘卸载到高空平台；一种多尺度交通感知的网络安全模型用于检测智能变电站的异常；以及一种空气污染监测机制，用于在多个聚合层中实现快速决策。同样，还提出了一种基于1D-CNN的分层SA方法，用于在边缘和云级别检测入侵事件。然而，这些技术依赖于云指令来响应异常，这可能会延迟决策过程。

一些研究使用时间序列指标（包括异常比例、影响范围、紧急性和趋势）来预测IIoT应用的状态，但仍然缺乏一个统一的框架，能够系统地将这些性能指标与边缘级别预测结合起来，以确定多层IIoT应用的总体运行状态。此外，现有方法通常依赖于静态决策阈值或孤立的异常检测模型，这限制了它们适应动态工业环境的能力。当前的层次监控解决方案很少解决在系统多个层次检测到异常情况时的通信开销和诊断复杂性问题。因此，现有方法缺乏适应性灵敏度调整和通信高效的分层状态稳定机制。这些挑战促使了MLSA框架的使用，该框架能够在分层组织的IIoT系统中实现自上而下的系统状态解释和情境分类。

2.2. 多机器人系统和IIoT
2.2.1. MRS的组件和目标
MRS由多个机械臂组成，它们通过共享通信媒介进行通信和协作以执行工业任务。每个机械臂能够感知、分析并与其他机械臂通信，从而实现分布式智能并支持共享或专用任务的执行。尼克尔Sense ME模块以及其他传感器（如蓝牙低功耗、陀螺仪、磁力计和加速度计）被安装在每个机械臂上，以收集时间序列数据。这些时间序列数据由每个机械臂本地处理，以确保边缘安全（SA），并及时响应任何异常情况，而无需等待主导机械臂或云端的指令。根据机械臂的活动，每个机械臂在边缘的操作状态可以被分类为以下几种之一：拾取、加工、空闲、放置、机械故障或异常。例如，当机械臂从目标位置拾取并放置物体并返回到初始位置时，可以认为它处于正常状态。然而，由于机械故障或异常导致的任何意外或随机行为会被预测为异常状态[12]。

2.2.2. IIoT中的同步
本地SA可以是解决IIoT应用中同步问题的有效方案[28]。在本地SA中，每个节点独立运行，以确保正常操作，无需依赖全局同步，从而减少了系统范围内的更新频率。分层聚合通过在不同层级收集更新来实现可扩展性，从本地到现场，然后再到全局。因此，这种分层方法降低了通信开销。基于情况的更新通过优先处理关键性的同步来进一步提高效率。只有异常、机械故障或重大事件才会被向上传递，而常规的本地状态则保持在本地，以确保系统的一致性而不会过载。

2.2.3. MRS和IIoT中的隐私
隐私问题通过本地控制敏感数据来管理，节点仅共享高级抽象信息，如预测的当前操作状态、匿名指标或模式，而不是原始数据[29]。选择性披露允许某些数据保持本地化，而某些数据则共享到更高级别。例如，在MRS这样的IIoT应用中，单个节点可以保持操作时间序列数据的私密性，同时将预测或当前操作状态共享给更高级别的MLSA。此外，诸如联邦学习或差分隐私等隐私保护技术可以自然地集成到这个MLSA框架中，使每个级别都能贡献知识，而不会暴露敏感的原始数据。

2.3. L2范数
L2范数（欧几里得范数）用于衡量向量的大小，广泛用于时间序列管道中，将多变量信息聚合成一个单一、可解释的分数[11]。形式上，对于一个度量向量x=[x1,x2,…,xn]，L2范数可以表示为∥x∥2=∑i=1nxi2。在我们的框架中，内部节点计算时间序列指标的L2范数，包括异常、异常比率、影响范围、紧急性和预测状态，以获得一个综合的情境评分，然后将其映射为正常、警告或critical。在L2范数技术中，残差的欧几里得范数作为从时间序列数据计算出的标准异常评分。较大的异常分数表示与正常状态的显著偏差，而较小的分数则表示正常的系统状态。最近的研究利用L2范数在机器人技术和视觉物联网系统中设计了鲁棒的故障检测和数据感知技术，以便在不确定性下提高故障隔离和分类的准确性，从而确保整体可靠性[30]。

2.4. 基于时间序列的深度学习
深度学习方法通过结合基于LSTM的1D-CNN来有效评估IIoT应用的状态，预测和排序系统条件为正常、警告或critical。例如，一个碳智能框架使用1D-CNN在复杂操作条件下对钻井机械进行可靠的故障诊断[13]。同样，基于1D-CNN的迁移学习方法被引入到5G支持的IIoT环境中，以提高性能和适应性[31]。开发了一种带有多传感器数据融合的改进CNN，以实现工业系统中快速准确的异常检测[32]。类似地，选择了LSTM–1D CNN混合架构，因为它能够捕捉短期局部时间模式和较长的序列依赖性，同时保持计算上适合边缘部署。与基于Transformer的模型相比，所选架构引入了显著更低的计算和内存开销，这在分布式IIoT设置中非常重要。与仅使用GRU的模型相比，加入1D-CNN组件可以从多变量时间序列信号中提取更详细的模式，从而区分出细粒度的操作状态[33]。

根据上述讨论，可以得出结论：需要一个状态排名系统，该系统能够在从边缘到多层的IIoT应用中确保SA，通过使用边缘的AI算法准确预测当前操作状态，并在复杂条件下通过L2范数可靠地估计故障或错误。

3. 提出的MLSA架构
3.1. 多层次SA架构的组成部分
本节介绍了一种新颖的状态排名系统架构，其中层次结构中的每个节点都有特定的作用，将本地或派生数据转换为更高级别的情境知识。虽然边缘节点直接处理原始传感器数据，但所有内部节点都遵循一致的设计模式。所提出的统一设计确保了整个MLSA树的灵活性、可扩展性和模块化，如图1所示。如图1所示，提出的框架包括两个主要组件。第一个组件是边缘节点架构，其中每个节点的当前操作状态使用基于LSTM的1D-CNN在边缘进行预测。同时，第二个组件是内部节点架构，它在更高层级将边缘预测与时间序列指标结合，使用L2范数来确定整个系统的状态（正常、警告或critical）。

下载：下载高分辨率图片（464KB）
下载：下载全尺寸图片
图1. SA的边缘架构和内部节点架构

3.1.1. 边缘节点架构
边缘节点处理主要感知和局部智能。边缘包含生成反映本地系统状态的执行器，如机械臂。它们主要执行两个功能：
1. 实时积累原始数据。为了实现有效的SA应用，需要实时记录信息。
2. 它们使用深度学习模型（如基于LSTM的1D-CNN）处理原始传感器数据，以预测本地操作状态（Ω）。这些预测识别当前条件是否属于Ω。操作状态ω ∈ Ω是基于振动、温度和其他传感器信号等指标来预测的。正常状态对应于小的或零的干扰幅度，代表典型的操作模式，如空闲、拾取、加工和放置。然而，当干扰发生并导致偏离预期轨迹时，系统会转变为异常状态，如机械故障或异常。
边缘节点的处理在预测阶段结束，不应用任何转换，如L2范数转换。相反，它将预测的操作状态传输给其父内部节点。这种传输不必是实时的，可以由SA系统操作员配置。这种架构如图1所示。

3.1.2. 内部节点架构
每个内部节点从多个子节点接收预测的状态信息。它不是处理原始数据，而是在摄入阶段收集时间序列指标（如异常比率、影响范围、紧急性和趋势）以及边缘级别的预测。然后，它应用L2范数进行数学融合规则，以便根据重要性、可靠性和关键性对输入进行整合和归一化。聚合后的输出决定了整个系统的状态，如α = {正常、警告和Critical}，并传输到下一个层次，如图2所示。这种通用节点提供了一个可扩展、可重用的架构，其中每个内部节点无论在其层次结构中的位置如何，都执行相同的概念任务。该设计保持灵活性，在当前实现中使用L2范数，因其简单性、平滑性和计算效率。

下载：下载高分辨率图片（369KB）
下载：下载全尺寸图片
图2. MLSA：情境聚合
尽管聚合的L2范数分数提供了一个连续的严重性值，但MLSA框架通过层次结构传播离散的情境级别，以简化优先级排序，降低通信复杂性，并支持一致的追溯决策，如图2所示。为此，可以设置一个固定的一组状态标签α。这将允许每个监控节点以标准化形式解释传入的子系统状态，同时相应的数值分数仍可保留在本地用于阈值检查和细化。这种设计减少了决策的模糊性，并使追溯机制更加高效，因为可以立即优先考虑关键分支而不是警告或正常分支。在本文中，我们使用α = {正常、警告和Critical}。同样，通过分配备份监督机制，增强了层次结构中每个内部节点（和边缘节点）的鲁棒性，如图2所示。备份监督节点可以在节点故障或通信中断时临时承担聚合责任，以确保SA的连续性。这种冗余机制防止了单点故障，并保持了层次一致性，这对于大规模分布式IIoT部署至关重要。

3.1.3. 根节点
根节点是MLSA框架的最高层，确保在整个MRS中实现全面的全球SA。在这一层，从子节点（例如S和T，如图2所示）接收聚合的输出，形式为nodeid、时间戳、状态和时间序列指标，而不是原始传感器数据。使用MLSA机制，根节点在全球级别确定MRS的总体操作状态，如正常、警告或critical，并根据它们的关键性生成节点的排名列表。然后它实时向人类操作员发出系统级别通知。除了全局SA之外，根节点还通过追溯机制促进故障定位，该机制采用两种互补的方法：
1. 将前k个子标识符向上传播以保持层次故障路径，
2. 启动下游诊断查询，将异常或机械故障追溯到其起源的边缘节点。这个过程确保了可解释性和快速识别受影响的组件，而无需传输原始时间序列数据。
在本文中，我们专注于从边缘到内部节点，再到根节点的三层实现，以演示所提出架构的端到端操作。尽管如此，该设计本质上仍然是可扩展的，并且可以通过最小化修改扩展到多层层次结构，同时在所有级别保持数据聚合、转换和通知逻辑的一致性。

3.2. 问题阐述
假设一个MRS由n个协调的机械臂组成，这些机械臂在工业环境中进行通信和协作，以执行共享或单独的任务。所有机械臂通过网络连接，并将每个机械臂的原始传感器测量数据传输到中央控制器，这效率低下并且引入了大量的通信开销。即使采用二叉树结构，一旦树的深度增加，系统中的节点总数也可能呈指数级增长。系统的分布式特性意味着每个节点可以根据其子节点的状态输入参数或来自父节点的容忍阈值σ来确定自己的状态。然而，系统的瞬态特性意味着，当在根节点确定边缘节点的关键性时，由于根节点和上层节点的通信和处理开销造成的延迟，信息可能已经过时。为了避免这些延迟，需要一种机制：
1. 在向根节点传播时不会丢失较低层次的节点状态信息；
2. 能够快速识别问题的来源和深度以及其广度。
因此，MLSA框架必须支持分层监控，其中在边缘总结局部观察结果，并在系统的多层中逐步聚合。MLSA框架应该解决这里描述的层次化IIoT中的两个相关问题。

3.2.1. 自下而上的情境聚合
框架必须支持自下而上的情境聚合，如图2所示，其中边缘节点识别本地操作状态，内部节点逐步聚合这些信息以确定更高级别的系统状况，而无需将所有原始传感器数据传输到上层。这个过程需要永久运行，并且几乎是实时的，这取决于来自较低层级节点的数据的及时性。使用正向运动学来描述关节空间和笛卡尔空间之间的关系，表示为：(1) ri(t) = hi(θi(t))，对于所有的 i=1,2,…,n。这里，θi(t)∈Rq 和 ri(t)∈Rp 分别表示机器人臂 i 的关节角度和末端执行器的位置，而 hi:Rq→Rp 表示非线性的正向运动学映射。为了在离散时间内表示系统演化，关节动力学被近似为：(2) θi(k+1) = θi(k) + δui(k)，其中 δ 是采样间隔，ui(k) 表示控制输入。在出现故障或异常情况下，系统会受到干扰的影响，这些干扰可以表示为：(3) xˉi = Ai*xuˉi + Ei,yˉi = Bi*yuˉi + Ei,ydi，其中 xˉi 和 yˉi 表示有限时间范围内的状态和输出向量，uˉi 表示相应的输入序列，di 表示与机械故障或异常相关的干扰输入。矩阵 Ai,x 和 Bi,y 描述了系统的标称动力学，而 Ei,x 和 Ei,y 则捕捉了干扰对状态和输出的影响。这些干扰会在系统行为中引入偏差，这些偏差在边缘层被分析以确定每个机器人臂的操作状态。然后，提取的状态信息在 MLSA 框架内层次化地传播，以支持自下而上的聚合和自上而下的回溯以及自适应重新校准。

3.2.2. 自上而下的回溯和情况重新校准
该框架还必须支持自上而下的回溯和重新校准，其中根节点以及随后的上层节点能够识别可疑的分支，并细化决策敏感性，以最小化额外的消息传递来定位异常条件的来源。如 (3) 所述，干扰 di 会在系统状态和输出中引入偏差，这些偏差反映在用于分层决策的聚合情况分数中。图 3 展示了回溯机制。一旦根节点在给定的时间窗口内积累了足够的信息，它就会从传播的状态表示中计算出基于 L2 的聚合情况分数，并据此对它的直接子节点进行排序。根据这个排序，根节点会识别出偏差水平相对较高的分支，并沿着这些分支进行回溯。回溯过程是递归的。每个内部节点使用相同的聚合分数比较来评估其子节点，并将分析向下传递，直到识别出受影响的子树或边缘节点。重要的是，此过程不需要在每个层级都进行严格的状态分类；相反，节点是根据它们与正常行为的相对偏差来优先排序的。

为了应对由于聚合导致的异常信号减弱问题，该框架引入了一种自适应重新校准机制。具体来说，定义了一个基础阈值参数 σ，从中派生出决策阈值。在回溯过程中，σ 会在识别出的分支内被局部调整以提高灵敏度，从而能够检测到在原始阈值下可能不可见的潜在异常。这种精细化处理是迭代应用的，允许系统探索可能的回溯路径（PTP），在这些路径中，节点在阈值 (σ) 变化范围内表现出更高的状态转换概率（α 内）。因此，结合使用 (3) 中的偏差建模、层次化分数聚合和自适应阈值细化，使 MLSA 框架能够跨层级保留异常信息，并通过回溯准确定位异常条件。

4. MLSA - 节点的状态检测
4.1. 方法论
本节概述了预测每个机器人边缘层状态以及确定 MRS 整体状态的方法。在我们的应用中，我们考虑了 Ω={idle, pick, process, drop, mechanicalfault, anomaly}。这里，每个状态都是从实时信号行为中提取的。例如，正常状态对应于零或小的干扰、基线行为的幅度、瞬态峰值、稳定操作和负载释放。根据 (3)，所有机器人臂都遵循由 Ai,x 和 Bi,y 定义的确定性动力学，这些对应于正常操作状态，如闲置、抓取、处理和释放。这些状态定义如下：
- 闲置状态表示所有执行器都通电但不活跃的时期。这仅显示加速度和关节位置的基线波动。
- 抓取状态反映了机器人抓取物体时的主动运动，其特征是扭矩、关节速度和加速度的瞬态峰值。
- 处理状态代表了任务执行或物体放置期间的稳定操作，其中信号围绕非基线平均值保持稳定，变化很小。
- 释放状态反映了负载释放或运动的终止，表现为扭矩和电流曲线的快速下降。

然而，当发生干扰时，即 di ≠ 0，Ei,xdi 和 Ei,ydi 会导致偏离预期轨迹，从而导致：
- 机械故障是持续的、可解释的偏差，如持续振动、异常的关节温度或由于执行器或组件退化而产生的持续位置误差。
- 相比之下，异常是不规则的、非确定性的波动，跨传感器通道出现（例如，扭矩的突然峰值或随机加速度爆发），这些无法通过正常或故障状态来解释。

MRS 的操作状态还可以包括带有异常的闲置状态、带有异常的释放状态、带有异常的抓取状态以及带有异常的处理状态，具体取决于传感器值。然而，在这项工作中，我们只考虑闲置、抓取、处理、释放、机械故障和异常作为操作状态。

4.1.1. 基于 LSTM 的 1D-CNN 边缘分类
在 MRS 中准确检测异常状态（如机械故障或异常）对于确保安全和可靠的运行至关重要。这些异常表现为系统动力学中的偏差（如 (3) 所示）。为了自动检测这些偏差，基于 LSTM 的混合 1D-CNN 模型在 MRS 的历史输入/输出序列上进行训练。使用 (3)，生成由关节控制输入和观察输出组成的时间序列数据。使用长度为 T 的滑动窗口来构建模型输入：(4) Zi=[zi(t?T+1)?zi(t)]∈RT×q，其中 zi=[uˉi(t),yˉi(t)]∈Rq，T 表示时间窗口大小。1D-CNN 层从输入序列中提取局部时间特征，捕捉诸如传感器信号的峰值和转换等短期变化。然后这些特征被传递给 LSTM 层，该层建模了时间上的长期时间依赖性和系统动力学。最后，使用具有 softmax 输出的全连接层将学习到的时间表示映射到操作状态：(5) s=Wht+b，(6) y^i=softmax(s)。这里，y^i∈R6 表示六个操作状态（闲置、抓取、处理、释放、机械故障、异常）的预测概率分布。

4.1.2. 基于 L2 范数的内部排名框架
本节讨论了基于 L2 范数的状态排名框架的实现，用于确定 MRS 的边缘到 MLSA。为了支持分层情况解释，该框架定义了更高级的状态集 α={Normal, Warning, Critical}。其中 α 代表在内部和根节点间传播的离散情况类别。在这项工作中，采用了三级集合作为分层优先级的最低实际配置。然而，该框架不限于三级，如果在特定领域需要更细化的情况粒度，则可以引入更精细的状态划分。可以通过使用基于 LSTM 的 1D-CNN 对每个机器人臂的预测和每个机器人臂的时间序列特征来评估 MRS 的整体状态，为每个机器人臂定义一个多指标向量。设任何机器人臂 i 的标准化指标可以表示为：(7) mi=[Di,Ri,Ii,Ui,Ti]。这里，Di, Ri, Ii, Ui 和 Ti 分别代表异常的持续时间、异常比率、影响范围、紧急性和趋势。向量中的每个指标都有助于确定更高层次上每个节点的操作状态。例如：
- 异常的持续时间反映了异常条件（机械故障或异常）持续的时间长度，并区分了瞬态干扰和持续故障。
- 异常比率量化了不规则行为的频率，以指示随时间的可靠性。
- 影响范围衡量了扭矩、电流和关节位置等关键特征上的偏差的严重性和范围，以突出故障的操作重要性。
- 紧急性评估了异常发展的速度，并优先处理迅速恶化的情况以立即关注。
- 趋势跟踪了这些指标的时间演变，揭示了系统是在恶化、稳定还是恢复。

这些时间序列指标为评估和排名 MRS 中每个节点的整体状态提供了平衡和可解释的基础。基于指标的聚合异常分数的 L2 范数可以如下公式化：(8) L2=(∑i=1n∑k=15 wi,k.mi,k2)1/2。这里，wi,k 定义了任何机器人臂 i 的第 k 个指标。根据 (6)，任何机器人臂的预测 y^i 可以表示为 (9) y^i=[y^1,y^2,?,y^n]T。基于预测和指标的整个 MRS 状态的 L2 范数表示为 (10) L2=(∑i=1ny^i.∑k=15 wi,k.mi,k2)1/2。(10) 返回了 MRS 的整体状态 s(t)，表示为 (11) s(t)={Normal if L2<σ1, warning if><σ2, critical if l2≥σ2}。

4.2. 状态排名框架
本节介绍了从边缘到多层的 mrs 的状态排名（sa），使用状态排名框架。所有机器人臂通过网络连接在一起，在工业中协作完成常规任务。所有的机器人臂都配备了边缘级的 sa，以便在边缘解决问题，而不是等待云端的指令。同样，这些机器人臂包括一个状态排名框架，该框架使用边缘级的 sa 和时间序列指标来确保 mlsa，如前一节所讨论的，并实现明智的、及时的决策。所有机器人臂都包含 nicle sense me 模块，该模块集成了多个传感器，包括陀螺仪、磁力计、蓝牙低功耗设备和加速度计，以在边缘收集和处理数据。这种边缘级的 sa 使所有机器人臂能够独立操作，并立即响应动态条件，而无需等待领导者机器人或云端的指令。在边缘级别预测的状态可以是抓取、处理、闲置、释放、机械故障或异常。例如，如果一个机器人臂拿起一个物体，移动到另一个位置释放它，然后返回到原来的位置，这被认为是机器人臂的正常状态。然而，如果一个机器人臂因机械故障或异常而出现抖动或偏离其实际位置，则认为它处于异常状态。这些预测状态以及上述其他指标一起用于使用 l2 范数对 mrs 的整体状态进行排名。

5. 情况回溯和重新校准
5.1. 阈值函数 f(σ)
在提出的 mlsa 框架中，决策阈值不被视为独立的固定参数，而是从单个基础参数 σ 导出的，以确保在不同层次上的一致性。这种公式允许阈值机制保持可扩展性和适应性，以适应不同的系统配置。设 σ 表示系统的基础灵敏度参数。 critical if l2≥σ2}。 4.2. 状态排名框架本节介绍了从边缘到多层的 mrs 的状态排名（sa），使用状态排名框架。所有机器人臂通过网络连接在一起，在工业中协作完成常规任务。所有的机器人臂都配备了边缘级的 sa，以便在边缘解决问题，而不是等待云端的指令。同样，这些机器人臂包括一个状态排名框架，该框架使用边缘级的 sa 和时间序列指标来确保 mlsa，如前一节所讨论的，并实现明智的、及时的决策。所有机器人臂都包含 nicle sense me 模块，该模块集成了多个传感器，包括陀螺仪、磁力计、蓝牙低功耗设备和加速度计，以在边缘收集和处理数据。这种边缘级的 sa 使所有机器人臂能够独立操作，并立即响应动态条件，而无需等待领导者机器人或云端的指令。在边缘级别预测的状态可以是抓取、处理、闲置、释放、机械故障或异常。例如，如果一个机器人臂拿起一个物体，移动到另一个位置释放它，然后返回到原来的位置，这被认为是机器人臂的正常状态。然而，如果一个机器人臂因机械故障或异常而出现抖动或偏离其实际位置，则认为它处于异常状态。这些预测状态以及上述其他指标一起用于使用 l2 范数对 mrs 的整体状态进行排名。 5. 情况回溯和重新校准 5.1. 阈值函数 f(σ) 在提出的 mlsa 框架中，决策阈值不被视为独立的固定参数，而是从单个基础参数 σ 导出的，以确保在不同层次上的一致性。这种公式允许阈值机制保持可扩展性和适应性，以适应不同的系统配置。设 σ>
4.2. 状态排名框架
本节介绍了从边缘到多层的 mrs 的状态排名（sa），使用状态排名框架。所有机器人臂通过网络连接在一起，在工业中协作完成常规任务。所有的机器人臂都配备了边缘级的 sa，以便在边缘解决问题，而不是等待云端的指令。同样，这些机器人臂包括一个状态排名框架，该框架使用边缘级的 sa 和时间序列指标来确保 mlsa，如前一节所讨论的，并实现明智的、及时的决策。所有机器人臂都包含 nicle sense me 模块，该模块集成了多个传感器，包括陀螺仪、磁力计、蓝牙低功耗设备和加速度计，以在边缘收集和处理数据。这种边缘级的 sa 使所有机器人臂能够独立操作，并立即响应动态条件，而无需等待领导者机器人或云端的指令。在边缘级别预测的状态可以是抓取、处理、闲置、释放、机械故障或异常。例如，如果一个机器人臂拿起一个物体，移动到另一个位置释放它，然后返回到原来的位置，这被认为是机器人臂的正常状态。然而，如果一个机器人臂因机械故障或异常而出现抖动或偏离其实际位置，则认为它处于异常状态。这些预测状态以及上述其他指标一起用于使用 l2 范数对 mrs 的整体状态进行排名。

5. 情况回溯和重新校准
5.1. 阈值函数 f(σ)
在提出的 mlsa 框架中，决策阈值不被视为独立的固定参数，而是从单个基础参数 σ 导出的，以确保在不同层次上的一致性。这种公式允许阈值机制保持可扩展性和适应性，以适应不同的系统配置。设 σ 表示系统的基础灵敏度参数。>决策阈值定义为σ的函数，表示为：(12) σ_i = f(σ, i)，其中i代表状态空间Ω内的阈值级别。对于本研究中考虑的三状态分类，阈值具体表示为：(13) σ_1 = σ, σ_2 = κσ，其中κ > 1，σ_1区分正常状态和警告状态，σ_2定义了紧急状态的边界。这种形式允许通过定义额外的σ_i值作为基础参数σ的函数来扩展到多级分类。在回溯过程中，基础参数σ会自适应地细化，以提高可疑分支中的检测灵敏度。因此，所有派生的阈值{σ_i}通过函数f(σ)一致地更新，而不是独立修改。这确保了细化过程在保持决策边界相对结构的同时，能够检测到潜在的异常。因此，函数f(σ)提供了一个原理性的阈值生成机制，支持MLSA框架内的可扩展性和自适应重新校准。

5.2. 自适应阈值细化
根据(10)中定义的层次聚合过程，MLSA框架通过在每个内部节点结合来自边缘节点的多指标异常描述符来计算综合情境得分L2。这些描述符代表了从时间序列监控数据中得出的异常行为的情境特征，包括异常持续时间、异常比率、紧急程度、影响范围和异常趋势。因此，聚合得分L2提供了相应子系统操作严重性的定量表示。然后根据方程(11)中定义的决策规则确定每个节点的操作状态，该规则将聚合得分划分为状态空间Ω内的阈值级别。

5.2.1. 选择过剩参数 - Δ
MLSA框架中的自适应重新校准机制通过在回溯过程中调整基础阈值参数σ来细化决策灵敏度。它不是独立修改各个阈值，而是对σ进行细化，所有决策阈值都是通过函数f(σ)派生出来的。为了控制细化过程，引入了一个过剩参数Δ > 0，它定义了灵敏度调整的步长。在回溯过程中，基础阈值迭代更新为：(14) σ(t+1) = σ(t) - Δ，其中σ(t)表示第t次迭代的阈值。这种减少提高了决策边界的灵敏度，使得能够检测到被识别出的可疑分支中的潜在异常。在每次迭代中，使用从f(σ(t))派生的更新后的阈值重新计算节点状态。设S(t)表示第t次迭代的节点状态向量。细化过程持续进行，直到分类稳定，即：(15) S(t+1) = S(t)。因此，参数Δ控制了灵敏度和稳定性之间的权衡：较小的值可以更细致地探索异常条件，而较大的值则加速收敛。由于细化是在回溯过程中局部应用的，因此整体计算和通信开销保持在最小。

5.2.2. 重新校准算法
通过动态细化σ，MLSA框架在检测灵敏度和决策稳定性之间实现了平衡。细化过程允许层次模型在诊断调查中发现潜在异常，同时确保整个系统的解释收敛到一个稳定且可解释的状态分布。此外，因为细化仅在决策级别进行，并不引入额外的学习模型或训练程序，所以计算开销保持在最小。这一特性保持了所提出的MLSA架构在大规模工业物联网环境中的可扩展性和实时适用性。

5.3. 通信开销分析
自适应重新校准机制的通信开销主要由回溯过程控制。在细化过程中，更新后的基础阈值σ沿着被识别的分支向下传播，允许节点重新计算其本地状态。然后，更新后的状态被传向上方进行聚合和一致性验证。对于深度为H的层次结构，每次细化迭代最多涉及沿着分支的2H次消息交换：H次消息用于向下传播阈值，H次消息用于向上更新状态。如果在T次迭代后达到收敛，则总通信成本可以近似为：(16) M_total ≈ 2^H * T，其中T通常很小，因为节点状态迅速稳定。由于重新校准是在回溯过程中选择性执行的，并且仅限于可疑分支，因此额外的通信开销保持在可控范围内。这种局部细化策略在保持可扩展性的同时，有效地识别和隔离了大规模IIoT应用中的异常条件。

5.4. 算法的复杂性
所提出的MLSA框架的计算复杂性分布在层次结构中。在边缘级别，每个节点对长度为T的时间序列表进行本地推理，导致每窗口的模型执行成本与其成正比。在内部层，如果一个监控节点接收k个子节点输入，计算基于L2的情境得分的聚合成本为O(k)。由于这种计算是在每个节点本地执行的，因此聚合工作负载保持分散而非集中。回溯机制选择性地操作优先级分支，其计算复杂性与层次深度成线性关系。对于高度为H的层次结构，回溯最多需要O(H)次操作。这确保了在不遍历整个树的情况下有效定位异常条件。从通信角度来看，该框架避免了传输原始时间序列数据，而是传播紧凑的状态描述符和异常指标。因此，通信开销与层次深度H成正比，与以云为中心的方法相比显著降低了带宽需求。在延迟方面，整体响应时间由层次结构中的最大通信延迟决定，而不是累积延迟。由于MLSA的分布式结构，聚合和回溯可以在独立分支上同时进行，实现近乎实时的性能。较高层次节点的内存需求也保持在可控范围内，因为每个节点仅存储来自其子节点的摘要描述符，而不是完整的历史数据。

6. 使用MRS的实验设置
6.1. 数据结构和数据集
每个机械臂的移动使用Nicla传感器ME记录，该传感器包括一个6轴IMU以及一些其他传感器值，如时间戳、关节位置、速度、电流和电压。在重复的拾放操作期间，还记录了其他参数，包括几何位置、广义力、关节温度、执行时间、安全指标、机器人和工具电流、工具加速度、环境温度、肘部位置、TCP力和异常状态。输入数据的类型极大地影响了适合的深度学习模型的选择。如前所述，本研究的MRS数据集是多变量的。由于MRS内的运动模式是预先确定的，因此目前不需要立即对训练数据进行标准化。此外，数据集中没有缺失值。因此，可以直接用于模型测试和训练。

6.2. 故障注入
由于设备损坏的风险很高，很难在MRS中引入故障。本研究通过在MRS中诱导随机异常行为来引入人工故障，以促进安全、经济的实验。例如，松动了机械臂的关节螺丝以模拟机械故障，然后机械臂以增加的振动执行常规任务。这些故障操作导致了明显的数据模式，即由于振动增加而偏离正常数据模式。这个故障数据集用于测试所提出模型在预测机械故障或异常以及通过受控故障注入减少实际硬件损坏风险方面的有效性。

6.3. 执行
实验使用配备GPU、32 GB RAM和硬盘驱动器的个人计算机进行。计算机运行Windows操作系统来安装和执行实验。Python 3.12（64位）和Jupyter Notebook被用作集成开发环境，用于开发和运行模型以及可视化结果。PyTorch、PyTorch Lightning、TensorBoard、Scikit-learn、Pandas、NumPy和Matplotlib是实现该模型所需的关键库和框架。此外，还使用了具有T4 GPU的Google Colab作为替代平台，为模型训练和评估提供了足够的计算资源。

6.4. 数据集特征
所提出的MLSA模型使用Casper数据集[12]进行训练和评估，该数据集捕获了来自两个Universal Robots的协作运动数据，并符合基于IIoT的MRS的操作要求。该数据集包括来自磁力计、陀螺仪和加速度计的多变量时间序列数据，这些数据是在重复的拾放任务期间记录的。此外，它还包括20个机械臂参数，如前所述，这些参数对于确定每个机器人的操作状态（左侧或右侧）至关重要。

6.5. 评估指标
为了评估所提出的基于LSTM的1D-CNN的状态排名框架的性能，采用了标准评估指标——准确性、精确度、召回率和F1分数。准确性衡量状态排名模型预测的总体正确性，即正确分类实例占所有样本的比例。精确度通过计算真正例与所有正面预测（真正例和假正例）的总数之比来衡量状态被准确识别的能力。召回率，也称为灵敏度，通过计算真正例与真正例和假负例之和之比来评估状态排名模型检测实际状态的能力。F1分数是精确度和召回率的调和平均值，在处理类别不平衡时提供了平衡的评估。这些指标共同提供了对状态排名框架检测能力的全面评估。

7. 仿真和结果
本节展示了所提出的状态排名框架的实验结果。使用通过MRS SSM获得的时间序列数据集来训练基于LSTM的1D-CNN。基于LSTM的1D-CNN可以预测每个机械臂i在边缘级别的当前状态。所有机械臂都可以处理时间序列数据以确定它们的操作状态，如拾取、处理、空闲、掉落、机械故障或异常。然后，每个机械臂将其预测的状态传输到指定的领导节点或中央节点，而不是传输原始传感器值。这种方法显著减少了带宽使用，并提高了IIoT应用程序的可扩展性。这些预测的操作状态与时间序列指标相结合，提供了对系统范围内操作的全面视图。此外，在领导节点处，使用时间序列指标计算预测状态的L2范数，以评估IIoT应用程序的整体状态，如正常、警告或紧急。这些整体状态沿着层次结构向上传播，即从领导节点到更高级别的领导节点，直到到达根节点。这种层次通信框架确保了全局状态感知（SA），并能够在IIoT应用程序层中检测和识别故障或异常。

7.1. 边缘处的情况分类
使用Casper数据集[12]评估了所提出的状态排名框架的鲁棒性和泛化能力，并使用其他三个数据集进行了验证：Voaus-AD [34]、故障类型检测[35]和表面检测[36]。选择这些数据集是为了验证框架，因为它们在系统的边缘或本地级别展示了多变量状态。在从左侧和右侧机械臂收集的时间序列数据上进行了5折交叉验证，以确保边缘SA。所提出模型的性能在图6和图7中展示。如图6所示，左侧机械臂的训练准确率在0.9941到0.9956之间，相应的测试准确率在0.9938到0.9953之间。图7显示了训练和测试损失值，在各种折叠中保持一致较低，分别在0.0044到0.0059和0.0047到0.0062之间。相比之下，温度特征表现出较弱或独立的相关性，这反映了操作条件而非运动行为。同样，图10展示了所提出框架在右侧机器人手臂上的性能，其中训练准确率在0.9812到0.989之间，测试准确率在0.980到0.986之间。相关的训练损失在0.0188到0.011之间，而测试损失保持在0.014以下，如图11所示。这些结果证实，所提出的框架能够可靠地区分边缘处的操作状态（即拾取、处理、空闲和放下（视为正常）以及故障或异常状态（视为异常），并且具有高精度和稳定性，即使经过多次折叠测试也是如此，以确保边缘状态感知（SA）。此外，所有性能指标，包括精度、F1分数和召回率，都为0.99，表明所提出的框架有潜力捕捉和分类多变量操作状态。在层次结构中，位于σ1之上的节点表明随着深度的增加，异常现象持续存在且可以被追踪。图21量化了异常分支与正常分支之间的可分离性，该图显示了最大L2分数与平均L2分数之间的差异。尽管这种差距随着深度的增加而逐渐减小，但在所有层次上仍然不为零，这确保了在回溯过程中异常分支仍然可以被排序和优先处理。下载：下载高分辨率图像（343KB）；下载全尺寸图像。图21显示了在不同层次上最大-L2分数与平均-L2分数之间的差距，表明随着深度的增加，分支的可分离性得以保持。这些观察结果表明，所提出的框架通过维护节点条件的相对顺序和可分离性来实现可扩展性，而不是通过保持绝对的异常幅度。这一属性对于回溯机制的有效性至关重要，因为它允许根节点使用自适应阈值可靠地识别和细化可疑分支。

此外，由于阈值是从基准参数σ派生出来的，因此不同层次上异常模式的一致性确保了在不同层次配置下调整灵敏度仍然是有意义的。因此，MLSA框架支持可扩展且可靠的异常检测（SA），无需进行穷尽性的数据传播或集中式处理即可高效地定位异常。

8. 未来工作
所提出的MLSA架构展示了如何通过分层数据处理来提高分布式工业物联网（IIoT）应用的可靠性、可扩展性和可解释性。通过分离边缘节点和内部节点的职责，该框架减少了通信开销并保护了数据隐私，因为只有派生出的指标（而非原始数据）被向上传输。在内部节点使用L2范数融合提供了一种高效且数学上稳定的方法来组合各种异构指标，如异常比率、影响分数和重复率。

8.1. 融合机制
然而，随着层次结构的加深，上层节点可能会因为来自多个下层节点的信息积累而面临更大的计算负担。这一挑战可以通过间隔性数据传输和上层节点更高的处理能力来缓解。未来的工作可以探索自适应融合机制、基于学习的排序策略以及在MLSA树中动态平衡工作负载，以进一步优化性能和鲁棒性。总体而言，该框架为IIoT应用中的可扩展MLSA提供了一个通用且可扩展的基础。

8.2. α分类
α状态内的分类被认为是一个静态过程。α的大小和值在整个树中被视为有限且静态的。这可能并非最终情况，因为可以使用K近邻（k-Nearest Neighbors）或类似方法进行更稳健的分类。这种方法仍然会使用本文提出的基本谱系，即从正常到临界范围内的分类。需要注意的是，虽然这种方法可以使系统比使用剩余变量（surplus variable）的方法更加稳健，但它仍然需要操作员设置系统参数，例如K近邻中的k值。

8.3. 树结构与图结构
使用树结构而不是图结构作为MLSA的基础，为分层系统提供了一个可扩展、无循环且计算效率高的基础。它保证了信息流清晰、融合更加容易，并且在边缘节点和内部节点之间有强大的协调能力。在树结构中，信息主要从边缘节点流向内部节点，然后进一步深入层次结构，确保了一个结构化且一致的聚合过程。当前的MLSA框架采用这种基于树的聚合和回溯机制，因为它简单且计算效率高。然而，在未来的实际IIoT部署中，可以将框架扩展为包含连接特定分支的专用路径，从而创建类似图的拓扑结构。在某些情况下，这可以加快信息流动的速度。需要正确维护这些路径以避免回溯过程中出现无限循环。此外，探索这种混合通信结构是未来工作的一个重要方向，可以在不引入完全基于图的聚合机制复杂性的情况下提高容错性。

8.4. 安全性
虽然本研究的主要焦点是检测操作干扰（如异常和机械故障），但在IIoT环境中的对抗性威胁也是一个重要的研究方向。当前的MLSA框架假设节点经过认证，并使用了工业基础设施中常用的安全通信协议。未来的框架扩展可能会结合安全意识机制，以应对诸如被污染的时间序列输入或来自受损节点的虚假状态报告等挑战。MLSA的分层架构和回溯能力为在分布式IIoT监控系统中集成此类对抗性检测和信任验证机制提供了有前景的基础。

9. 结论
本研究提出了一个通用的、可扩展的状态排名框架，用于预测边缘处IIoT应用的当前状态，并确定其在更高级别系统的整体运行状态。所提出的框架实现了0.9944的高准确率，并通过多个数据集进行了进一步验证，以确保边缘级别的异常检测（SA）的稳健性。在更高级别，引入了一种基于L2范数的排名方法，该方法结合了边缘级别的预测和关键时间序列指标来评估整个系统状态。所提出的框架在识别多变量运行状态、降低带宽消耗、提高数据隐私以及减少对集中式云基础设施的依赖方面展示了有效的结果。通过多个数据集对设计进行验证表明，该框架具有很强的潜力，可以适应其他超出MRS（Multivariate Reporting System）的IIoT应用。未来的计划是将该框架应用于更复杂的多变量时间序列数据，并加入更强的安全或信任管理功能，使其能够在更广泛的工业环境中更自信地使用。

CRediT作者贡献声明：
Muhammad Nasir：撰写 - 审查与编辑、原始草稿的撰写、方法论、调查、形式分析、概念化。
Ananda Maiti：撰写 - 审查与编辑、监督、概念化。
Shuxiang Xu：撰写 - 审查与编辑、监督。
Saurabh Garg：撰写 - 审查与编辑、监督。

热点排行