3.2.2对象检测
图3-5 对象检测
对象检测中的识别对象这一任务,通常会涉及为各个对象输出边界框和标签。这不同于分类/定位任务——对很多对象进行分类和定位,不仅仅是对个主体对象进行分类和定位。在对象检测中,只有两个对象分类类别,即对象边界框和非对象边界框。例如,在汽车检测中,必须使用边界框检测所给定图像中的所有汽车。
如果使用视觉技术中图像分类和定位图像这样的滑动窗口技术,需要将卷积神经网络应用于图像上的很多不同物体上。由于卷积神经网络会将图像中的每个物体识别为对象或背景,因此,需要在大量的位置和规模上使用卷积神经网络,这需要很大的计算量。
为了解决这一问题,计算机视觉技术研究人员建议使用区域(Region)这一概念,这样就会找到可能包含对象的“斑点”图像区域,运行速度就会大大提高。这是一种基于区域的卷积神经网络(R-CNN),并在此基础上提升算法收敛速度,提出了二次增强的Fast R-CNN,大大提升了对象检测速度。
近年来,主要的目标检测算法已经转向更快、更高效的检测系统。这种趋势在YouOnly Look Once(YOLO)、Single Shot MultiBox Detector(SSD)和基于区域的全卷积网络(R-FCN)算法中尤为明显。
全部0条评论
快来发表一下你的评论吧 !