计算机视觉技术简介

jf_f8pIz0xS 2020-07-11 5646

人工智能

643人已加入

描述

计算机视觉技术的含义

由于“计算机视觉”反映了对视觉环境及其上下文的相对理解，因此，一些科学家认为，该领域为人工智能领域铺平了道路。那么什么是计算机视觉呢？

根据Ballard＆Brown（1982年）的说法，“从图像中构造出对物理对象的明确而有意义的描述。

根据Trucco＆Verri（1998年）的说法，计算机视觉是3D世界中一幅或多幅数字图像的计算属性的集合。

根据Sockman＆Shapiro的说法，2001年的计算机视觉是基于感知到的图像对实际物理对象和场景做出有用决策的过程。

计算机视觉技术的应用

从计算机视觉领域可以衍生出大量有用的应用程序。下面是计算机视觉应用程序的一些用途：

游戏和控制：在游戏领域使用立体视觉的一个有影响力的商业产品是微软的Kinect。

图像检索：谷歌图像利用基于内容的查询来搜索相关的图像。它们的算法分析查询图像中的内容，然后根据最匹配的内容返回结果。

生物特征识别：虹膜、指纹和人脸匹配是利用计算机视觉技术进行生物特征识别的常用方法。

监视：监控摄像头在许多公共场所，主要用于检测任何可疑行为。

人脸识别： Snapchat和Facebook等应用程序利用人脸检测算法来应用滤镜并识别照片中的人物。

智能汽车：视觉是这些汽车检测交通信号，灯光和其他视觉参数等多种元素的主要信息来源。

各种类型的计算机视觉技术

看到了计算机视觉技术的好处之后，现在让我们看一下在主要的互联网领域如何使用计算机视觉的一些技术。

对象检测

对象检测是定义图像中存在的对象，对其进行标记并输出边界框的过程。计算机在这里试图对多个对象进行分类，而不只是对一个进行分类。想象一个装满货物的仓库。如果仓库中有很多物品，那么手动计算所有物品将是非常耗时的工作。相反，如果有一台配备了摄像头的机器人或计算机可以检测所有物体并对其进行跟踪，则此过程将节省大量时间，从而提高工作效率。

图像分类

图像分类也许是最流行的计算机视觉技术之一。此处需要解决的最大问题之一是：假设中有许多图像，任务是预测一组测试图像的类别，以确定图像的准确性。预测。这里有许多问题需要克服，例如比如改变尺度和视角，光照条件，图像变形等等。

创建计算机视觉算法的过程将能够按照适当的类别对图像进行分割，这是一个数据驱动的过程。研究人员将确定特定图像类别的一些样本，以用于特定的计算机视觉机器学习，而不是确定每个图像类别在代码级别上的外观。计算机的任务是研究所提供的图像并了解与视觉外观有关的细节。

语义分割

语义分割被认为是计算机视觉的一个重要组成部分，它将整个图像分割成像素段，然后进行分类和标记。更具体地说，语义分割试图理解每个像素在给定图像中的重要作用。例如，仅仅检测一个人或一辆车是不够的。还必须能够确定边界在哪里。

对象追踪

对象跟踪是指跟踪给定场景中的一个或多个运动对象。传统上，此技术已应用于检测到初始对象后监视真实世界的交互。这是自动驾驶汽车的一个非常重要的方面，特斯拉和优步等公司计划发布这种产品。对象跟踪机制可以分为两个部分（generative和discriminative）。利用生成法来描述这些明显的特征，减少搜索对象时重建中的误差。判别方法被认为是相对更强大和准确的。此方法可以用来区分背景和主体。针对这一特点，该方法已成为最受欢迎的跟踪方法之一。它甚至被称为“Tracking-by-Detection”。这与深度学习类似。

影像重建

想象一下，有一张旧照片，它已经腐蚀了一段时间。这是一张很有价值的照片，人们想把它修复一下。这就是图像重建的过程。

实例分割

该方法对所有不同的实例类进行分类，比如使用10种不同的颜色标记10辆汽车。关于分类，通常有原始图像，其目标是确定图像的确切内容。但是，为了分割所有的实例，还需要其他几个复杂的过程。如果是一个复杂的场景，有多个重叠的物体和不同的背景，那么就需要对所有的物体进行分类，然后识别它们的边界，差异，以及它们之间的关系。

打开APP阅读更多精彩内容