电子说
随着Halcon新版本的更新,截止2019年5月1号。Halcon的最新版本为halcon18.11.这次新版本最大的更新在于完整的加入了深度学习在视觉应用的三个重要部分,即目标分类分类、目标检测、语义分割这三个内容。与此同时超人视觉即将向大家简介Halcon软件这三个方向的应用示例,帮助大家进一步认识到机器视觉的魅力与当前的机器视觉技术的应用前沿。
在开始内容前我们先明确一下前面提到的三个重要概念即深度学习下的分类,目标检测、语义分割这三个方向具体的概念及其应用场景是什么?帮助大家理解其技术的产生背景以及形成自己的理解。
1图像分类
图像分类这一类问题常用与区分不同的物品,图像分类,顾名思义,是一个输入图像,输出对该图像内容分类的描述的问题。它是视觉方向的其中一个核心,实际应用广泛。许多同学在学习计算机视觉中有一个练习题是练习如何区分猫狗如图1所示:
我们观察一下这些图片的特点,这些图片各种各样,分辨率也各不相同。图片中的猫和狗形状、所处位置、体表颜色各不一样。它们的姿态不同,有的在坐着而有的则不是,它们的情绪可能是开心的也可能是伤心的,猫可能在睡觉,而狗可能在汪汪地叫着。照片可能以任一焦距从任意角度拍下。
总而言之这些图片有着无限种可能,对于我们人类来说在一系列不同种类的照片中识别出一个场景中的宠物自然是毫不费力的事情,然而这对于一台机器来说可不是一件小事。实际上,如果要机器实现自动分类,那么我们需要知道如何强有力地描绘出猫和狗的特征,也就是说为什么我们认为这张图片中的是猫,而那张图片中的却是狗。这个需要描绘每个动物的内在特征。
1. 在传统的分类方法下图像分类是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负。深度学习下的神经网络在图像分类任务上效果很好的原因是,它们有着能够自动学习多重抽象层的能力,神经网络可以识别极端变化的模式,在扭曲的图像和经过简单的几何变换的图像上也有着很好的鲁棒性。
2目标检测
图像分类是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体并且给出边界框。目标检测在很多场景有用,如无人驾驶和安防系统。
传统的目标检测的算法多用模板匹配完成,但是模板匹配针对复杂场景下下的识别并不良好,特别是在光照情况不稳定物体有遮挡的情况下算法的鲁棒性如何确保一直是传统视觉算法的一个难题。
由上图所示,我们可以总结出来目标检测要解决的核心问题是:1)目标可能出现在图像的任何位置,2)目标有各种不同的大小,3)目标可能有各种不同的形状。深度学习在这方面的处理已经部分超越了传统算法的上限,目前较为先进的深度卷积神经网络结构,通过其具有局部连接权,值共享及池化操作等功能,有效降低了网络的复杂度,减少了训练参数的数目。使模型对于平移、扭曲、缩放具有一定程度不变性并具有较强的鲁棒性和容错能力,且易于训练与优化的网络结构。
3.语义分割
语义分割方法在处理图像时,具体到像素级别,也就是说,该方法会将图像中每个像素分配到某个对象类别。语义分割是一种典型的计算机视觉问题,其涉及将一些原始数据(例如,平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。
许多人使用术语全像素语义分割,其中图像中的每个像素根据其所属的感兴趣对象被分配类别ID。 早期的计算机视觉问题只发现边缘(线条和曲线)或渐变等元素,但它们从未完全按照人类感知的方式提供像素级别的图像理解。语义分割将属于同一目标的图像部分聚集在一起来解决这个问题,从而扩展了其应用领域。如图所示。
语义分割问题也可以被认为是分类问题,其中每个像素被分类为来自一系列对象类中的某一个。因此一个使用案例是利用土地的卫星影像制图。土地覆盖信息是重要的各种应用,如监测地区的森林砍伐和城市化等。 为了识别卫星图像上每个像素的土地覆盖类型(例如,城市、农业、水等区域),土地覆盖分类可以被视为多级语义分割任务。道路和建筑物检测也是交通管理,城市规划和道路监测的重要研究课题。
以上介绍的三个方向是目前深度学习在计算机视觉领域非常火热的三个研究方。市面上许多网络教程通过使用开源的视觉开发软件OpenCV结合Caffe/Tensorflow进行发开,但是对于初学者,这一套开发与部署流程对于刚刚接触深度学习的同学非常不友好,学习周期漫长并且部署流程繁琐。德国著名视觉算法软件开发公司MVtec开发的Halcon算法工具包集成了开发环境。后期将会带大家了解如何通过Halcon软件开发包快速上手玩转当前最火的深度学习三大方向应用。
全部0条评论
快来发表一下你的评论吧 !