3.2 视觉技术
视觉技术主要用计算机来模拟人的视觉功能,但并不仅是人眼的简单延伸,更重要的是具有大脑的一部分视觉分析功能,即从客观事物的图像中提取特征信息,对特征借息降维处理后加以分析、理解,最终用于实际检测、工业测量和控制。
计算机视觉作为视觉技术的关键代表和组成部分,诸如图像检测、分类、识别和定位等功能的实现均依赖计算机视觉技术。下面介绍几种基于计算机视觉技术的重要应用及其学习模型。
3.2.1 图像分类
图3-4 图像分类
对于给定一组被标记为单一类别的图像,对一组新的测试图像的类别进行预测,并测量预测的准确性结果,这就是图像分类向题。计算机视觉技术研究提出了一种基于数据驱动的方法。该方法并不是直接在算法程序中指定每个感兴趣的图像类别,而是为计算机的每个图像类别都提供许多示例,然后设计一个学习算法,查看这些示例并学习每个类别的视觉外观。也就是说,首先积累一个带有标记图像的训练集,然后将其输入计算机中,由计算机来处理这些数据。
可以按照下面的步骤来分解。
(1)输入是由N个图像组成的训练集,共有K个类别,每个图像都被标记为其中一个类别。
(2)使用该训练集训练一个分类器,来学习每个类别的外部特征。
(3)预测一组新图像的类标签,评估分类器的性能,用分类器预测的类别标签与其真实的类别标签进行比较。
目前较为流行的图像分类架构是卷积神经网络(Convolutional Neural Networks,CNN)-将图像送入网络,然后网络对图像数据进行分类。
全部0条评论
快来发表一下你的评论吧 !