人工智能时代,为何说关键在机器视觉?

描述

智能视觉是一门研究如何使机器“看”的科学,更进一步的说,就是研究如何用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。

 

智能视觉通常用于通过对采集的图片或视频进行处理以获得相应场景的信息,更详细的说智能视觉主要有以下五种类型的任务:

物 体 检 测

物体检测是视觉感知的第一步,也是智能视觉的一个重要分支。物体检测的目标,就是用框去标出物体的位置,并给出物体的类别。

物体检测和图像分类不一样,检测侧重于物体的搜索,而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。

物 体 识 别

智能视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体、图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定,达到在任意环境中识别任意物体的水平。

但是,现有的技术能够很好地解决特定目标的识别,比如简单几何图形识别、人脸识别、印刷或手写文件识别,或者车辆识别,只是这些目标需要在特定的环境中,具有指定的光照、背景和姿态要求。

物 体 分 类

一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。

图像分类问题就是给输入图像分配标签的任务,这是智能视觉的核心问题之一。这个过程往往与机器学习和深度学习不可分割。

物 体 定 位

如果说图像识别解决的是what,那么物体定位解决的则是where的问题。利用智能视觉技术找到图像中某一目标物体在图像中的位置,即定位。

目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。

图 像 分 割

在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后续处理的部分,例如筛选特征点,或者分割一或多幅图片中含有特定目标的部分等。

图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。更精确地说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。

“图像分割”是一个像素级别的物体识别,即每个像素点都要判断它的类别。它和物体检测的区别是:检测是一个物体级别的,只需要一个框去框住物体的位置,而分割是比检测要更难的问题。

智能视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分