质量至关重要:对物联网环境中数据质量进行的十年系统性研究

《Data & Knowledge Engineering》:Quality matters: A decadal systematic exploration of data quality in IoT environment

【字体: 时间:2026年02月11日 来源:Data & Knowledge Engineering 2.6

编辑推荐:

  本研究通过系统文献综述,分析了过去十年物联网数据质量相关研究,揭示了现有框架和方法论的多方面挑战,并提出了未来研究方向,为数据驱动的智能决策提供理论支持。

  
Tarandeep Kaur | Pankaj Deep Kaur
古鲁·纳纳克·德夫大学区域校区,贾兰达尔,旁遮普邦,印度

摘要

物联网(IoT)的普及导致了数据生成的前所未有的增长,因此提高数据质量对于释放物联网的全部潜力以及实现智能、数据驱动的决策至关重要。本系统文献综述回顾了过去十年的学术研究,以揭示物联网中数据质量的复杂性。提出了七个研究问题,对相关学术数据库进行了广泛搜索,并定义了纳入和排除的标准。这些选定研究的关键见解回答了研究问题,分析了物联网数据及其质量的多个方面。本研究探讨了在评估整体数据质量中起关键作用的各种数据质量维度,识别了关键差距和局限性,并为未来的研究提供了路线图。这一全面的概述提供了对影响数据质量因素的细致理解,同时强调了在管理物联网数据时安全和隐私的极端重要性。本系统文献综述的发现将为研究人员和实践者提供宝贵的见解,有助于维护整个物联网生态系统中的数据质量。

引言

物联网(IoT)是一项变革性技术,体现了智能计算的未来。随着经济实惠的传感器、广泛的连接性和海量数据的出现,“物联网”将彻底改变世界[1]。在快速发展的物联网项目中解决数据质量问题需要关注数据标准化,确保来自各种来源的信息能够传达一致且连贯的见解。物联网允许连接多个带有嵌入式传感器(如温度传感器、压力传感器、接近传感器等)的设备,从而持续生成大量数据。这些前所未有的数据量是开发实时洞察力的关键,各种应用程序可以利用这些数据为最终用户提供无处不在的服务。Statista报告指出,全球物联网设备的数量预计将从2020年的151亿台增加到2030年的290多亿台(图1)。从智慧城市到农业再到医疗保健等各种应用的有效性都取决于所产生数据的质量。确保从不同来源收集的数据的正确性和质量是全面开放物联网服务的基石。
数据质量是一个多方面的概念,从数据消费者的角度来看,它被定义为“适用性”[2]。数据质量的提高意味着可以参与更多雄心勃勃且范围更广的商业机会,并且可以预先降低组织风险。“垃圾进,垃圾出”这一术语用于描述数字系统:如果系统接收到的输入数据质量较差(垃圾进),那么系统产生的输出也将不准确(垃圾出)[3]。
基本上,物联网数据的生命周期包括四个阶段:数据收集、数据预处理、数据存储和数据分析[4,5]。普遍环境的动态特性也可能导致数据质量的变化。通过在整个生命周期的每个阶段不断努力应对挑战,可以产出高质量的数据。
许多研究人员对物联网背景下的“数据质量”这一术语进行了定义,并确定了各种数据质量维度、框架和技术来确保数据质量。然而,在探索数据质量这一广阔领域时,现有的研究似乎分散且不一致。迫切需要标准化方法,以全面解决不断发展的物联网领域中的数据质量概念。图2展示了本文的研究议程。
本综述为更精确地理解数据质量这一术语以及其在物联网背景下的重要性做出了宝贵贡献。研究范围如下:
  • 回顾过去十年(2013-2023年)关于在不同领域生成和收集的数据质量的文献。
  • 对选定的研究进行系统文献综述和元分析,以识别现有研究中的关键差距。
  • 分析有关数据和数据质量的文献,强调其在物联网系统中的相关性。
  • 评估和总结为管理和改进物联网应用中的数据质量而设计的现有框架、方法论和工具。
  • 识别研究挑战和问题,并为未来的研究方向提供指导。
  • 以下部分概述了本文的结构:第二节讨论了相关工作及其研究的动机。第三节介绍了研究方法并制定了研究问题。第四节通过对比分析各种出版物提供了研究问题所需的数据。第五节指出了物联网数据质量面临的挑战和问题,这些问题可以为未来的研究提供指导。第六节讨论并总结了研究结果。最后,第七节提出了物联网数据质量的结论和未来方向。图3展示了各部分的主要内容。

    部分摘录

    动机和相关工作

    关于物联网背景下的数据质量的论文数量有限。作为系统文献综述(SLR)的一部分,对这些论文进行了审查并进行了比较分析。
    [6]中的作者进行了系统文献综述,以探讨不同领域中数据质量的重要性。他们提出了四个研究问题,涉及数据质量领域、数据质量模型以及评估数据质量的方法论。为了解决这些问题,他们选择了100篇论文。

    研究方法

    每年都有大量的研究人员进行科学研究。科学研究涉及系统综述,旨在收集信息以便研究人员得出结论。物联网领域的数据质量研究遵循本节中示意性的研究方法。“系统文献综述(SLR)采用了一种明确的方法论,其中收集了与特定研究问题相关的所有可用证据

    研究问题的讨论

    本研究旨在强调物联网中数据质量的重要性。本文介绍了第二节A部分中讨论的研究问题。

    物联网数据质量的研究挑战和问题(RQ7)

    需要解决许多与物联网数据质量相关的问题[87]。许多研究人员已经对该领域进行了广泛研究,但还需要更多的研究努力来应对所面临的挑战:
  • i) 数据准确性直接关系到数据质量:
  • 物联网不仅仅是关于设备,更重要的是数据本身。数据的高精度意味着高质量的数据。如果数据准确性得不到保证,数据质量就会下降。不准确的数据会导致决策模糊和服务不佳

    结果与讨论

    本文进行了系统综述,全面分析了物联网(IoT)背景下的数据和数据质量。由于数据是物联网运作的核心,确保其准确性和高质量对于实现可靠且有意义的结果至关重要。物联网应用于多个领域,包括家庭、农业和医疗保健。低质量的数据会降低物联网应用的有效性,导致结果不可靠。

    结论与未来方向

    在这项研究中,进行了系统文献综述(SLR),以探讨过去十年关于数据质量的研究,既包括一般数据质量,也包括物联网(IoT)背景下的数据质量。在初步搜索学术数据库后,共找到了2036篇论文,然后应用了纳入和排除标准,最终筛选出48篇与我们的研究重点相关的论文。该综述的发现表明,物联网中的数据质量仍然是一个未充分探索的领域。只有有限数量的

    作者声明

    我们签署者声明,这份手稿《质量至关重要:十年系统探索物联网环境中的数据质量》是原创的,此前未发表过,也没有在其他地方考虑发表。
    我们确认该手稿已由所有列出的作者阅读并批准,且没有其他符合作者资格标准但未列入名单的人。我们进一步确认手稿中列出的作者顺序是

    CRediT作者贡献声明

    Tarandeep Kaur:撰写——审阅与编辑、撰写——初稿、可视化、方法论、概念化。Pankaj Deep Kaur:监督、正式分析。
    Tarandeep Kaur是印度贾兰达尔古鲁·纳纳克·德夫大学工程与技术系的研究学者。她获得了印度贾兰达尔古鲁·纳纳克·德夫大学的计算机科学与工程硕士学位(M.Tech)。她目前正在攻读博士学位,她的研究兴趣包括物联网(IoT)及其支持技术。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号