卷积神经网络物体检测SSD

电子说

1.4w人已加入

描述

2015年,YOLO之后,另外一个直接回归的方法SSD,以state-of-the-art的检测效果和检测效率横空出世;

SSD,single shot multibox detector

直接看下图吧,可以看出,YOLO是在卷积层后加了FC,然后预估2*7*7共49个位置98BBox;而SSD显著的不同就是多尺度:1) 多尺度的feature map上提取特征,通过3*3的卷积核,保证特征的细粒度和丰富性; 2) 多尺度feature map上抽取anchor,每张图共有7308个BBox,远大于YOLO的98;

上图中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷积核,后面的4是每个点的有4个anchor,所以这一层共有38*38*4个BBox,把7个卷积层加起来,一共就是7308个BBox;

另外,每个正例BBox学习的并不是绝对位置或者相对grid的位置,而是相对于ground truch的偏移,如下图:

因此,其loss function包括两部分,分类的confidence+回归相对ground truth的位置偏移,如下:

在VOC和COCO上的效果

1. 准确率上:VOC达到最高80%,COCO这个小物体也是最高26.8%;

2. 速度上,500尺寸下,SSD和YOLO基本持平,20帧,但是mAP高10点;

另外,16年的YOLOv2在检测效果和速度上更高一层,在效果保持state-of-the-art的基础上,FPS能达到50+,是SSD的2倍+,但是!小物体检测依然是YOLO的短板,COCO上的依然低于SSD5个百分点,如下:

SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 相关推荐
  • 热点推荐
  • SSD
  • voc

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分