高精度视觉识别与定位的算法

机器视觉

16人已加入

描述

机器视觉在生产制造中主要用在视觉引导,尺寸测量,产品检测,物体识别等几个领域。在这几个领域中,一个最基本的算法就是产品识别和定位,比如视觉引导机器人,要在图像中识别出要抓取的产品,并定位出坐标,才引导机器人到指定的产品位置。尺寸测量,产品检测等也是一样的,在测量和检测之前,首先要知道有没有产品,产品的位置在哪里,才可以应用后续的各种分析工具。因此,产品识别和定位是一个基本问题。

如果要设计一个可行的产品识别和定位的算法,需要克服几方面的困难:

快速的指定产品:工业产品千差万别。因此,对于每一个具体的应用,需要从几张,甚至一张图像上,快速指定需要查找的产品,比如当前产线需要定位铆钉的位置,拍一张照片并进行相应的学习,就可以在后续的图像中进行搜索定位

快速的搜索产品:对于一张200万像素的图片,通常要求在几十毫秒的时间可以识别和定位出产品的位置

高精度的定位:工业生产对精度和公差有严格的要求,因此产品的定位就要力求准确。现在普遍要求识别定位算法可以达到一个像素级别的定位精度,甚至可以达到亚像素级别。

可以适应产品缺失,遮挡,脏污等的影响:如果一个产品被遮挡,导致产品在图像中缺失一定比列,需要依然可以识别定位到物体。反之,如果产品表面发生脏污,导致表面的特征发生变化,需要依然可以识别定位

可以适应光照亮度不均匀的影响:如果产品的亮度发生变化,比如一半亮一半暗,需要依然可以识别定位

可以识别旋转的产品:产品通常可能在360度范围内旋转

可以识别多个产品:一张图像中可能有多个产品,需要分别识别定位

可以准确识别接近对称的物体:接近对称的物体很容易别识别成错误的方向,需要进行相应的设计

可以应对物体的极性翻转:比如学习的产品是白底黑字,但是实际上产品图像有可能是黑底白字,需要可以识别

深度学习可以解决这个问题吗?深度学习中目标检测算法(one-stage和two-stages的各种算法),在这个应用中有几方面的难点

数据量:如何在只有一张图像的情况下,学习到需要识别定位的物体?

速度:如何在一般配置的PC上达到ms级别的识别定位速度?传统算法在几千元的工控机上就可以发挥速度优势,然而深度学习需要配置昂贵的GPU,或者在2019年会有一些垂直细分领域的ASIC芯片开发出来

定位精度:考虑到深度学习输入的图像本身都是进行了缩放的图像,那么在原图上很难达到像素精度的匹配

识别准确性:在数据量很少的情况下,怎么提升识别的准确性?

考虑到此类问题面临的困难,一般还是用传统的机器视觉方法来实现。

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分