安全帽佩戴检测算法

燧机科技 2024-06-26 509

描述

安全帽佩戴监控是铁路工程施工人员安全管理中的重点和难点，它对检测算法的准确率与检测速度都有较高的要求。本文提出一种基于神经网络架构搜索的安全帽佩戴检测算法 NAS-YOLO。该神经网络架构由上、下行操作单元组成，采用二进制门策略对网络架构进行更新，通过数据驱动的方式自动确定合适的神经网络体系结构。实验结果表明，NAS-YOLO算法在准确率、召回率及平均检测速度方面均优于实时目标检测算法 YOLOv3，可以在工程施工中对施工人员安全帽佩戴情况进行实时监控。
关键词安全帽佩戴；神经网络架构搜索；自动检测；检测算法；实时监控

引言
施工现场环境复杂多变，人群密集，频繁出现工人不遵守规章所引发的伤亡事故，安全帽作为一种常见的防护用具，能够有效减轻外来危险源对头部的伤害，因此，实时监控施工场所工人安全帽佩戴情况至关重要。然而人工监管费时费力，无法满足安全生产要求。以计算机视觉为技术支撑的智能监控系统有人力成本低、检测效率高等优势，为自动监测施工现场工人佩戴安全帽情况的方案落地提供了技术方向

1. 安全帽监控系统逻辑架构
安全帽监控系统的逻辑结构主要分为视频采集、智能视频分析和监控中心3个模块，如图1所示。视频采集模块负责通过摄像机进行视频采集；智能视频分析模块是通过算法实现目标检测、分类，并进行行为和事件检测，同时还负责对违规行为发出报警信息，是安全帽监控系统的核心模块；监控中心与监控人员直接交互，起到对整个监控系统进行监视和管理的作用。
安全帽监控系统首先由视频采集模块获取视频数据；再由智能视频分析模块利用目标检测技术提取出视频中的动态目标，同时进行分类；然后，将分类得到的目标信息与预先设定好的报警准则进行逻辑判断，如符合预定准则，则智能视频分析模块向监控中心发送预警或报警信息；如不符合预定准则，则继续进行目标检测［8］。目标检测与分类是通过人工智能技术（即深度神经网络）来完成的。与常用的深度神经网络算法不同，这里介绍通过 NAS算法自动搜索合适的神经网络架构。

2.YOLOv3检测模型
YOLOv3 的主干网络为 Darkent-53，其中，包含53个卷积层和5个残差块，整体网络结构如图 2 所示。每个残差块包含残差单元，而残差单元由DBL组件组成，DBL 组件中包括卷积、批量归一化和 Leaky reiu激活函数。残差单元由DBL通过相加而成，残差块由DBL和残差单元构成，其中，残差块借鉴ResNet的思想，增强了特征融合能力。 YOLOv3 通过改变卷积核的步长来实现张量的尺度变换，输出 3 个不同大小的尺度。

YOLOv3网络结构

3. NAS算法
NAS 算法是自动机器学习领域的热点算法之一，可通过数据特征自动找到合适的神经网络架构［9］。该算法的原理是光定义搜索空间；然后，通过搜索策略找出候选网络架构，对候选网络进行评估；最后，根据评估结果进行下一轮的搜索。由于 NAS 的根本思想是探索各种潜在的解决方案，搜索空间越大，需要训练与评估的架构就越多，消耗的资源与时间就越多。因此，搜索空间的设定将直接影响计算开销。目前 NAS 的主流设计方法为先基于单元（cell）的架构进行设计，再将单元堆叠在主干网络上，构成整体网络架构，并由此限制搜索空间大小。换言之，大型网络是由多个单元组成的，而单元的结构是由整个网络共享的［10］，因此主干网络的选择也十分重要。
目前主流的目标检测算法是 Fast r-cnn［11］系列算法，首先使用神经网络生成待检测预选定位框，再对预选定位框进行调整和分类，属于两阶段算法，虽然精度高，但实时性不强。而YOLO （You Only Look Once）［12］系列的一阶段算法采用了回归的思想，直接在图像上回归出预选定位框，同时预测预选定位框所属类别。YOLO 系列算法的检测精度虽然略低于 Fast r-cnn 系列，但是运行速度快，能够很好地完成实时目标检测任务。另外，还有 SSD （Single Shot MultiBox Detector）［13］算法，结合了回归思想和预选定位框机制，使得检测速度和准确率都得到提升。YOLO 系列算法经过不断更新，其中 YOLOv3［14］结合了多种网络设计技巧，包括了SSD算法中的多尺度特征融合策略［15］，进一步提高了网络的检测性能。因此，本文以 YOLOv3 为基础框架，设计了基于神经网络架构搜索的 YOLO 网络，即 NAS-YOLO。 NASYOLO由2种单元架构组成，分别是下行单元和上行单元，并通过基于单元的搜索方式，确定其最终网络拓扑结构。

3.1 架构搜索方式
对二值化的路径更新使用了 Cai H 等［20］提出的二进制门方法。这是一种数据驱动的方式，具体操作如下。 1）在训练网络权重参数时，先冻结架构参数，并为每批输入的数据随机选取二进制门，根据二进制门得到存活路径。 2）在训练数据集中，通过标准梯度下降，更新存活路径的权值参数。 3）在训练架构参数时，先冻结权重参数，后重置二进制门，更新并验证数据集中的架构参数。这2个更新步骤以替代方式执行，一旦完成架构参数的训练，就可以通过修剪冗余路径来导出紧凑的架构。每次架构参数的更新只涉及2条路径，从而将内存需求降低到训练紧凑模型的相同水平。

3.2 模型训练
使用安全帽佩戴检测数据集对 NAS-YOLO 算法进行训练。该数据集共有 7 581 张图像，包含 9 044 个佩戴了安全帽的人像（正样本），以及 111 514 个普通人像（没有佩戴安全帽，即负样本）。随机选取数据集中一半的图像作为训练集，另一半作为验证集，使用二进制门搜索策略对神经网络架构进行搜索。其中，批量的大小设置为 8，共进行了200期的架构搜索优化。网络权重训练中，选用随机梯度下降（Stochastic Gradient Descent，SGD）优化器，动量设置为 0. 95，余弦学习率从 0. 025 衰减到 0. 01，权重衰减为 0. 0003。架构参数 α 的训练使用 Adam 优化器［21］，学习率设置为 0. 0003，重量衰减设置为 0. 0001。使用 1 块 GeForce RTX 2080ti GPU 对整个架构搜索，大约需要 2 天时间

4. 结果验证与分析
4.1 算法训练
YOLOv3和NAS-YOLO训练过程中的损失函数曲线（Loss Curve）分别见图2和图3。图中，损失值越小，表示训练出的模型与数据集的真实模型越接近；在2次训练过程中，网络损失均保持稳定下降趋势，YOLOv3在迭代 10 000次左右收敛， NAS-YOLO在迭代 40 000次左右收敛，说明训练基本顺利；与图2的曲线相比，图3的曲线收敛于一个更小的值，说明改进后的模型更接近数据集的真实模型。

4.2 算法测试
将完成模型训练NAS-YOLO网络与现有的目标检测网络进行对比，并将几种算法分别应用于安全帽监控系统中，进行安全帽佩戴状态的自动识别。随机选取2名工地管理人员，对视频中施工人员是否佩戴安全帽进行识别与判断。一名管理人员先做出判断，另一名再对其判断结果进行审查与修正。将2名管理人员的识别判断结果作为真值，评估 NAS-YOLO 与 SSD、 Fast r-CNN、 YOLOv3 算法的实际应用准确度和运行速度。与其他方法相比，NASYOLO的平均准确率（mean Average Precision，mAP）最高，达 96. 72%；处理速度也最快，检测速度可达59. 6FPS （Frames Per Second）；但召回率略低于 Fast r-CNN，而 Fast r-CNN 运行速度慢，无法应用于实时的目标检测任务。

打开APP阅读更多精彩内容