
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种基于轻量级深度学习模型的多类别框架,用于检测口罩佩戴情况
《Scientific Reports》:A multi-class framework for face mask compliance detection using lightweight deep learning models
【字体: 大 中 小 】 时间:2026年05月20日 来源:Scientific Reports 3.9
编辑推荐:
摘要在健康敏感和依赖监控的环境中,口罩佩戴合规性的监测非常重要。本文介绍了一种基于深度卷积神经网络(DCNN)和先进的MobileNetV3模型的多类别口罩佩戴合规性检测系统。该系统针对的是一个更为复杂的三类别问题(正确佩戴口罩、错误佩戴口罩以及不佩戴口罩),而非传统的二分类口罩
在健康敏感和依赖监控的环境中,口罩佩戴合规性的监测非常重要。本文介绍了一种基于深度卷积神经网络(DCNN)和先进的MobileNetV3模型的多类别口罩佩戴合规性检测系统。该系统针对的是一个更为复杂的三类别问题(正确佩戴口罩、错误佩戴口罩以及不佩戴口罩),而非传统的二分类口罩检测方法。实验使用了来自KAGGLE的2,079张图像构成的平衡定制数据集,这些图像经过人工审核,确保其质量高、一致性良好,并能充分代表所有类别,包括在以往研究中通常被忽视的错误佩戴口罩的情况。在三类别任务中,通过将原有的MobileNetV3架构中的最终分类层替换为一个包含256个神经元的全连接层以及一个三神经元softmax输出层来重新设计模型。同时添加了Squeeze-and-Excitation(SE)模块,以实现特征在通道层面的重新校准和视觉相关类别之间的更好区分。采用分层保留验证策略(训练集:验证集:测试集 = 70:15:15)来确保评估结果具有可靠的泛化能力。我们通过准确率、精确度、召回率、F1分数、特异性、Cohen Kappa系数和混淆矩阵等指标对模型进行了性能评估。除了与DCNN进行比较外,该模型还与包括MobileNetV2、VGG16和基于YOLO的模型在内的代表性轻量级及最先进框架进行了对比。MobileNetV3模型的准确率达到98.90%,F1分数为0.989,在更具挑战性的多类别合规性检测环境中表现出竞争力甚至更优。未来,研究将重点关注跨数据集验证、实时视频监控以及可解释人工智能技术的整合,以提升模型的实际应用效果。