AdapBlinker:一种稳健的自适应中值滤波方法,用于检测细微的眼球眨动

《Journal of Computer and System Sciences》:AdapBlinker: Robust adaptive median filter approach to detect subtle eye blinks

【字体: 时间:2026年02月03日 来源:Journal of Computer and System Sciences 0.9

编辑推荐:

  声学信号眼眨检测系统通过自适应中值滤波器有效消除环境噪声干扰,利用18-22kHz不可听声波反射实现非接触式眼眨识别,在实验室、卧室和客厅三种场景下对34名用户进行五个月测试,平均识别准确率达97.2%。

  
哈夫萨·西达克(Hafsa Sidaq)|王磊(Lei Wang)|迟建成(Jiancheng Chi)|侯赛因·海德尔(Hussain Haider)
中国辽宁省大连市大连工业大学软件学院普适网络与服务软件重点实验室,邮编116024

摘要

如今,在人机交互系统中,眨眼检测受到了越来越多的关注。用户越来越倾向于通过非手动方式与手机和计算机进行交互,这凸显了传统触摸界面的局限性。基于眼电图(EOG)的方法和红外传感器(IR)等可穿戴技术可以准确检测眨眼动作;然而,长时间使用后可能会带来不便。尽管如此,基于摄像头的眨眼识别技术仍存在盲点和光照效应等缺点。因此,本研究提出了一种基于声学信号的眨眼检测系统来克服这些限制。由于声波在空气中的衰减特性,声学信号能够在有限范围内实现精细检测。与传统方法相比,声学传感的主要优势在于它可以直接感知信号,用户无需佩戴任何传感器。设备中扬声器和麦克风的普遍存在也为声学传感提供了支持。在本研究中,我们展示了AdapBlinker系统,该系统利用HP ProBook 440 G5笔记本电脑生成声学信号,获取数据,处理采集到的信号,并通过快速傅里叶变换(FFT)提取眨眼信号。AdapBlinker采用自适应中值滤波器来适应环境,消除干扰,并能检测到微弱的眨眼动作。我们对34名参与者在三种不同环境下的表现进行了五个月的测试,平均眨眼检测准确率为97.2%。

引言

在当今的技术时代,与计算机和智能手机等设备的非接触式交互变得越来越重要。与传统基于触摸的界面不同,非接触式方法提供了更自然、更便捷、更安全的交互方式。特别是眨眼动作,在这方面具有巨大潜力。例如,监测眨眼模式可以帮助患有计算机视觉综合症(CVS)的人[1],通过及时反馈减少眼睛疲劳。同样,在驾驶员安全应用[2]中,检测异常眨眼行为被广泛用于预防与疲劳相关的事故,世界卫生组织(WHO)[3]指出,全球每年有约130万人死于道路事故。除了健康和安全方面,眨眼检测还可以作为人机交互(HCI)系统中的有效输入方法[4],实现免提控制。这对于身体残疾的人来说尤其有价值,因为他们可能难以使用键盘、鼠标或触摸屏等传统设备。这些多样化的应用突显了准确可靠的眨眼检测的重要性。
文献综述提到了几种检测眨眼的关键技术,包括EOG传感器[5]、基于摄像头的方法[6]以及嵌入眼镜中的红外传感器[7]。在EOG过程中,电极被设置在眼睛附近以分析眨眼和上下左右等眼球运动。另一种可穿戴设备使用固定在眼镜上的红外传感器来直接检测眨眼动作。这两种方法成本较高,用户在使用EOG电极和佩戴眼镜中的传感器时会感到不适。在基于摄像头的方法中,受试者坐在摄像头前,摄像头频繁记录其面部图像,并将图像传输给计算机。计算机使用眨眼识别算法[8]来处理这些图像。与红外传感器和EOG方法相比,这种方法成本更低,用户无需用传感器遮盖面部,且可以长时间使用而不会感到疲劳。然而,摄像头存在局限性,如果摄像头与受试者之间有障碍物,则无法捕捉到眨眼动作。因此,我们在本研究中提出了AdapBlinker,这是一种成本效益高且适用于摄像头遮挡情况的解决方案,它利用声学信号的特性来识别眨眼动作,如图1所示。
在这项研究中,我们提出了一种名为AdapBlinker的眨眼识别机制,该机制利用设备中已安装的扬声器和麦克风。无需使用昂贵、可穿戴或特殊的传感器来检测眨眼动作。AdapBlinker系统由四个部分组成:生成声学信号、数据获取、信号处理以及通过FFT提取眨眼信号。该系统的特点在于它采用了自适应中值滤波器方法,可以减少背景噪声和干扰,清晰显示微弱的眨眼动作,并能根据不同环境不断调整,而无需像传统方法那样使用静态阈值。最初,它利用笔记本电脑的扬声器生成18–22 KHz频率范围内的不可听声学信号;随后,麦克风捕捉从参与者眼睛反射回来的信号。在校准采集到的信号后,系统可以检测到眨眼动作。我们在三种不同环境(实验室(L)、卧室(B)和电视休息室(T)中对34名参与者进行了五个月的测试,AdapBlinker的平均眨眼检测准确率为97.2%。

可穿戴传感技术

可穿戴传感技术因专注于精确的人体运动检测而受到广泛关注。研究人员建议使用身体传感器记录生理数据,如脑电图(EEG)、心率、心电图(ECG)、血压[9]和皮肤电导[10]。已经提出了带有EOG传感器的可穿戴模型[11],并且常见的眼镜框架中安装了红外传感器[12]来追踪用户的眼球运动和注意力变化。

AdapBlinker模型演示

我们介绍了一种利用声学传感确定眨眼动作的新技术,该方法通过评估眼睛的眨眼模式来实现。具体来说,HP ProBook 440 G5笔记本电脑的扬声器和麦克风发出不可听的声学信号,该信号的频率范围为18 KHz至22 KHz。这里
E(t) = α\cos(2\pi f_t)
表示信号的频率,φ为0。
该技术能够在信号中精确表示微弱的眼球运动,并可用于各种行业。

环境干扰

由于相位偏移信号,眨眼检测面临的一个关键问题是处理来自刚性物体(如墙壁、家具和天花板)的信号反射,这些反射会直接影响检测过程。相位偏移信号的准确性与采集信号中静态成分的比例成反比,即静态成分比例越高,准确性越低,误差越大。

提出的方法

本研究提出的眨眼检测方法不依赖于传统方法的假设。该方法对微小的眼球运动具有高度敏感性,能够精确追踪非周期性眼球运动模式,并利用相位变化的信息。此外,它提供了一种与其他传统方法不同的相位分析策略,后者通常使用FMCW和啁啾信号来区分眨眼和非眨眼动作。此外,该方法还能减轻

AdapBlinker实验设置

AdapBlinker使用18–22 KHz频率范围内的不可听声学信号进行工作,不会记录可听音频。该系统仅处理超声波反射,不存储数据。
该方法利用HP ProBook 440 G5笔记本电脑的扬声器和麦克风来监测眨眼动作。扬声器位于屏幕铰链旁边的键盘上方。

性能评估与比较

我们将AdapBlinker的结果与基于局部极值检测(LEVD)[35]的系统进行了比较,后者使用LEVD技术来识别眨眼动作。当我们将真实眨眼和假眨眼的总数除以评估的眨眼总数时,AdapBlinker的识别准确率为97.2%。在下一节7.1中,我们将我们的系统与最先进的技术[35]进行了比较。每种情况都被视为CDF图中的一个数据点。

讨论

在下一节中,我们将讨论我们系统的缺点以及未来研究的方向。为了减轻声学信号的显著衰减,我们进行了实验,要求参与者与系统的距离不超过55厘米。此外,我们的技术能够有效检测单个人的眨眼动作,但不适合同时检测多个人的眨眼动作。未来的研究将集中在

结论

非接触式界面为人们提供了方便且高效的方式与设备进行交互。在这项研究中,我们提出了AdapBlinker,这是一种成本效益高且适用于摄像头遮挡情况的解决方案。AdapBlinker利用设备内置的扬声器和麦克风通过相位方法来追踪眨眼动作。首先,我们进行了详细的声学信号分析,并证明了该技术可以显示眨眼信号。我们还解决了一些技术问题。

CRediT作者贡献声明

哈夫萨·西达克(Hafsa Sidaq):撰写 – 原稿、方法论、研究。 王磊(Lei Wang):监督。 迟建成(Jiancheng Chi):撰写 – 审稿与编辑。 侯赛因·海德尔(Hussain Haider):验证、概念化。

资助

本工作得到了中央高校基本科研业务费(编号:DUT25RC(3)044)、国家自然科学基金青年科学基金C类(编号:6250071032)以及辽宁省自然科学基金(编号:2025-BS-0003)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号