工业物联网(IIoT)代表了物联网(IoT)技术在工业和制造领域的融合,为工业4.0和智能制造奠定了基础[1,2]。通过集成人工智能(AI)、虚拟现实(VR)、云计算、边缘计算和数字孪生等先进技术,IIoT彻底改变了传统的制造流程。这些技术使IIoT能够在传统制造设备之间实现自动化和远程连接,促进了传感器、机器人、物流车辆以及高级控制系统(包括控制器和分析器)之间的无缝通信。这种连接性有助于进行强大的数据收集和分析,这对于质量控制、故障检测和流程优化至关重要[3]。利用工业大数据,IIoT系统可以训练AI模型,用于智能物流和预测性维护应用,从而显著提升运营效率。
然而,IIoT系统中异构设备的连接性带来了重大的安全风险,包括网络入侵、拒绝服务攻击、恶意软件威胁、数据注入和漏洞利用[4]。IIoT设备生成的大量数据既带来了机会,也带来了挑战。这种持续的数据生成推动了诸如预测性维护和供应链优化等智能应用的发展[5],但由于收集到的信息具有敏感性,同时也加剧了隐私和安全问题。IIoT传感器经常收集包含产品设计、制造过程和运营指标等机密信息,如果保护不当,这些信息容易遭到泄露[5]。因此,保护IIoT网络对于维护数据完整性、防止制造中断以及确保互联设备的安全至关重要。
由于IIoT设备的计算能力、内存和能源容量有限,传统的安全机制往往不足以应对这些挑战[6]。此外,传统的IIoT系统容易发生故障,并且容易受到未经授权的访问和网络入侵,这对它们的可靠性和弹性构成了重大威胁[7]。越来越多地利用基于机器学习(ML)的入侵检测系统(IDS)来减轻IIoT中的网络攻击。然而,集中式的ML模型存在隐私和安全风险,因为它们需要将来自多个来源的数据汇总到一个位置进行训练。数据的集中化增加了数据泄露和未经授权访问的风险,因为敏感信息存储在单一的存储库中,成为攻击者的目标[8]。此外,集中式模型还可能通过模型反转攻击无意中暴露私人信息,攻击者可以从训练好的模型中推断出敏感数据。
已经提出了多种去中心化和保护隐私的方法,包括联邦学习(FL),以解决这些问题。联邦学习(FL)允许在本地设备上直接进行模型更新,从而无需将敏感数据传输到中央服务器[9]。这种方法通过确保训练数据集保留在本地设备上,并且只有模型更新(如梯度或参数)与中央服务器共享以进行汇总,从而增强了隐私保护[10]。FL在IIoT安全场景中有很多应用,包括减轻分布式拒绝服务(DDoS)攻击[11]、防止数据泄露[12]、防御对抗性攻击[13]、检测恶意软件[13]以及防止IIoT应用中的后门攻击[15]。
尽管FL保护了数据隐私,但它面临一些限制其在IIoT环境中部署的关键挑战。频繁的参数交换带来的通信开销会给资源受限的设备带来负担[16],而客户端数据的异质性导致数据分布非独立且不相同(非独立同分布,non-IID),从而影响模型收敛[17]。此外,FL仍然容易受到拜占庭攻击的影响,恶意节点可能会注入被篡改的参数和标签翻转攻击,破坏模型完整性[18]。威胁向量,如中间人(MITM)攻击和参数欺骗,允许攻击者注入篡改后的更新,从而降低模型性能并暴露新的漏洞。
区块链技术(BCT)通过提供去中心化、透明性、防篡改性和多方共识机制,提供了一个强大的解决方案[19,20]。智能合约确保了可编程逻辑,并在参与节点之间强制执行预定义规则,增强了系统安全性和可靠性。通过将区块链(BC)与FL结合,这两种技术相互补充,解决了各自的技术局限性。区块链确保了防篡改的审计轨迹、对恶意行为者的问责制以及聚合过程的透明度[21]。
本研究提出了一种结合了数字孪生(DT)技术的异步FL架构,以解决已识别的挑战。我们将网络数字孪生(CDT)技术纳入所提出的架构中,以应对FL的运营挑战。与传统的静态参考模型不同,我们的CDT采用基于LSTM的行为预测机制,从网关活动中学习时间模式。CDT监控六个行为特征:梯度范数、损失减少、异常分数、梯度方差、训练延迟和更新陈旧度。通过预测每个网关的拜占庭概率、更新质量和预期延迟,CDT通过自适应参与控制(APC)实现智能客户端选择。这种方法通过优先选择高质量、低延迟的网关并在聚合前过滤掉拜占庭节点,从而减少了通信开销,同时提高了效率和安全性。
异步FL、区块链审计轨迹和CDT驱动的智能FL客户端选择之间的协作,为IIoT入侵检测奠定了坚实的基础。我们提出的Block-FDT框架在保持实际效率的同时,解决了关键的安全漏洞。我们的主要贡献如下:
•我们提出了Block-FDT,这是一种基于区块链的入侵检测框架,通过考虑陈旧度的异步聚合,保护IIoT网络中的联邦学习免受拜占庭攻击。
•我们实现了一个区块链审计层,使用SHA-256哈希技术和异步写入方式,提供模型聚合、客户端选择和拜占庭拒绝的防篡改日志记录,仅增加了0.357%的开销,同时确保了完全的透明度。
•我们开发了一种基于LSTM的网络数字孪生技术,可以预测六个时间特征下的网关行为,从而通过自适应参与控制智能地选择高质量网关并过滤掉拜占庭节点。
•我们实现了结合基于损失和基于梯度的过滤的双重拜占庭检测机制
•以及考虑陈旧度的异步聚合,有效抵御标签翻转和梯度投毒攻击。
•我们使用Edge-IIoTset数据集在20个分布式网关上验证了Block-FDT的性能,在20%的拜占庭节点情况下,实现了91.15%的检测准确率,并在500轮联邦训练中保持了模型的完整性。
我们手稿的其余部分组织如下:第2节回顾了该领域的最新文献。第3节详细介绍了系统的架构设计和算法实现方法。第4节讨论了数据集和实验设置。第5节提供了实验结果和讨论。第6节总结了研究的发现、贡献、局限性和未来的研究方向。