机器视觉定位算法：二维图像模式定位系统算法

jf_f8pIz0xS 2018-01-23 13352

编程实验

72人已加入

描述

机器视觉（Machine Vision），又被称为计算机视觉或人工视觉，是用计算机模拟人眼的视觉功能，从图像或图像序列中提取信息，对客观世界的三维景物和物体进行形态和运动识别。机器视觉技术已广泛应用于工业自动化生产线，各类检验和监视，视觉导航，图像自动解释、人机交互及虚拟现实等领域。

二维图像模式定位系统算法

机器视觉中的二维图像模式定位系统算法整体流程图如图1所示，由RBF网络模式训练和模式定位两个部分组成。

径向基函数（RBF，Radial basis function） RBF网络为两层MLP（Multiple Layer Propagation）提供了一种前馈结构，具有最佳逼近（Best approximation）性质，无须学习系数，学习收敛速度极快，在样本数目多的情况下，正确率趋于稳定。故本算法中采用RBF网络对图像特征进行神经网络学习训练。

定位系统具体工作流程图如图2所示。先设定训练模式，对模板图像进行预处理，滤除干扰、噪声后再经特征提取得到训练样本，对样本进行学习，提供分类决策。在待识别模式中对待识别图像同样经过预处理、特征提取后，用训练模式中的分类器中提取的分类决策进行RBF网络识别，得到结果。若分类器不能提供目前的分类决策，则得到错误检测，需要更新训练模式，直到重新获得正确的分类决策。其中最重要的一个环节就是特征提取与选择，影响到最后的定位精度。

图像特征提取

小波变换具有多分辨率特性，对原始图像的分解呈Mallat塔式分解，具有集中信号能量的能力，小波变换后图像的信息仅仅集中在少数几个变换系数上，多数变换系数为零，有助于降低图像目标小波变换的时间复杂度和空间复杂度（如图3所示）。同时小波变换后代表图像顶点等特征点的模极大值的范数不随图像的旋转、平移和伸缩的变化而改变，故本文在小波变换的基础上对图像提取特征。