电子说
本文主要是关于机器视觉的相关介绍,并着重对机器视觉的应用场景进行了详尽的阐述。
机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。
机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、 I/O卡等)。一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。 [2] 机器视觉系统最基本的特点就是提高生产的灵活性和自动化程度。在一些不适于人工作业的危险工作环境或者人工视觉难以满足要求的场合,常用机器视觉来替代人工视觉。同时,在大批量重复性工业生产过程中,用机器视觉检测方法可以大大提高生产的效率和自动化程度。
一个典型的工业机器视觉系统包括:光源、镜头(定焦镜头、变倍镜头、远心镜头、显微镜头)、 相机(包括CCD相机和COMS相机)、图像处理单元(或图像捕获卡)、图像处理软件、监视器、通讯 / 输入输出单元等。
系统可再分为
一、采集和分析分开的系统。
主端电脑(Host Computer)
影像撷取卡(Frame Grabber)与影像处理器
影像摄影机
定焦镜头镜头
显微镜头
照明设备
Halogen光源LED光源
高周波萤光灯源
闪光灯源
其他特殊光源
影像显示器
LCD
机构及控制系统
PLC、PC-Base控制器
精密桌台
伺服运动机台
二、采集和分析一体的系统
智能相机(图像采集和分析一体)
其他配套外围设备:光源、显示、PLC控制系统等等。
工作原理
机器视觉检测系统采用CCD照相机将被检测的目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号,图像处理系统对这些信号进行各种运算来抽取目标的特征,如面积、数量、位置、长度,再根据预设的允许度和其他条件输出结果,包括尺寸、角度、个数、合格 / 不合格、有 / 无等,实现自动识别功能。
典型结构
一个典型的机器视觉系统包括以下五大块:
照明
照明是影响机器视觉系统输入的重要因素,它直接影响输入数据的质量和应用效果。由于没有通用的机器视觉照明设备,所以针对每个特定的应用实例,要选择相应的照明装置,以达到最佳效果。光源可分为可见光和不可见光。常用的几种可见光源是白炽灯、日光灯、水银灯和钠光灯。可见光的缺点是光能不能保持稳定。如何使光能在一定的程度上保持稳定,是实用化过程中急需要解决的问题。另一方面,环境光有可能影响图像的质量,所以可采用加防护屏的方法来减少环境光的影响。照明系统按其照射方法可分为:背向照明、前向照明、结构光和频闪光照明等。其中,背向照明是被测物放在光源和摄像机之间,它的优点是能获得高对比度的图像。前向照明是光源和摄像机位于被测物的同侧,这种方式便于安装。结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的三维信息。频闪光照明是将高频率的光脉冲照射到物体上,摄像机拍摄要求与光源同步。
镜头
FOV(Field of Vision)=所需分辨率*亚象素*相机尺寸/PRTM(零件测量公差比)
镜头选择应注意:
①焦距②目标高度 ③影像高度 ④放大倍数 ⑤影像至目标的距离 ⑥中心点 /节点⑦畸变
视觉检测中如何确定镜头的焦距
为特定的应用场合选择合适的工业镜头时必须考虑以下因素:
· 视野 - 被成像区域的大小。
· 工作距离 (WD) - 摄像机镜头与被观察物体或区域之间的距离。
· CCD - 摄像机成像传感器装置的尺寸。
· 这些因素必须采取一致的方式对待。如果在测量物体的宽度,则需要使用水平方向的 CCD 规格,等等。如果以英寸为单位进行测量,则以英尺进行计算,最后再转换为毫米。
参考如下例子:有一台 1/3” C 型安装的 CCD 摄像机(水平方向为 4.8 毫米)。物体到镜头前部的距离为 12”(305 毫米)。视野或物体的尺寸为2.5”(64 毫米)。换算系数为 1” = 25.4 毫米(经过圆整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米镜头的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米镜头的要求
注:勿将工作距离与物体到像的距离混淆。工作距离是从工业镜头前部到被观察物体之间的距离。而物体到像的距离是 CCD 传感器到物体之间的距离。计算要求的工业镜头焦距时,必须使用工作距离
高速相机
按照不同标准可分为:标准分辨率数字相机和模拟相机等
。要根据不同的实际应用场合选不同的相机和高分辨率相机:
按成像色彩划分,可分为彩色相机和黑白相机;
按分辨率划分,像素数在38万以下的为普通型,像素数在38万以上的高分辨率型;
按光敏面尺寸大小划分,可分为1/4、1/3、1/2、1英寸相机;
按扫描方式划分,可分为行扫描相机(线阵相机)和面扫描相机(面阵相机)两种方式;(面扫描相机又可分为隔行扫描相机和逐行扫描相机);
按同步方式划分,可分为普通相机(内同步)和具有外同步功能的相机等。
图像采集卡
图像采集卡只是完整的机器视觉系统的一个部件,但是
它扮演一个非常重要的角色。图像采集卡直接决定了摄像头的接口:黑白、彩色、模拟、数字等等。
比较典型的是PCI或AGP兼容的捕获卡,可以将图像迅速地传送到计算机存储器进行处理。有些采集卡有内置的多路开关。例如,可以连接8个不同的摄像机,然后告诉采集卡采用那一个相机抓拍到的信息。有些采集卡有内置的数字输入以触发采集卡进行捕捉,当采集卡抓拍图像时数字输出口就触发闸门。
视觉处理器
视觉处理器集采集卡与处理器于一体。以往计算机速度较慢时,采用视觉处理器加快视觉处理任务。采集卡传输图像到存储器,进而计算分析。当前主流配置的PLC,且配置较高,视觉处理器已经几乎退出市场。
TOP 1:人脸识别
人脸识别是人工智能视觉与图像领域中最热门的应用, 今年 2 月,《麻省理工科技评论》发布「2017 全球十大突破性技术」榜单,来自中国的技术「刷脸支付」位列其中。这是该榜单创建 16 年来首个来自中国的技术突破。
人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。
TOP 2:视频/监控分析
视频/监控分析是人工智能视觉与图像领域中第二大热门应用。
人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。
视频/监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。
TOP 3:图片识别分析
静态图片识别应用热度在视觉与图像领域中排名第三。将人工智能技术单纯用于图片识别分析的应用企业数量并不如预想的多,可能有一下几个方面原因:
1、目前视频监控方向的盈利空间大,众多企业的注意力都放在了视频监控领域;
2、人脸识别属于图片识别的一个应用场景,做人脸识别的大多数企业同时也在提供图片识别服务,但是销售效果不佳,主要赢利点还在于人脸识别;
3、图片识别大多商用场景还属于蓝海,潜力有待开发;
4、图片数据大多被大型互联网企业所掌握,创业公司数据资源稀少。
TOP 4:驾驶辅助/智能驾驶
随着汽车的普及,汽车已经成为人工智能技术非常大的应用投放方向,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。
不过利用人工智能技术,汽车的驾驶辅助的功能及应用越来越多,这些应用多半是基于计算机视觉和图像处理技术来实现。
TOP 5:三维图像视觉
三维图像视觉主要是对于三维物体的识别,应用于三维视觉建模,三维测绘等领域。
TOP 6:工业视觉检测
机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。
机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。
TOP 7:医疗影像诊断
医疗数据中有超过 90% 的数据来自医疗影像。医疗影像领域拥有孕育深度学习的海量数据,医疗影像诊断可以辅助医生,提升医生的诊断的效率。
2015 年 4 月,IBM 成立了 Watson Health 部门,开始进军医疗行业。2015 年 8 月 6 日,IBM 宣布以 10 亿美元的价格收购医疗影像公司 MergeHealthcare,并将其与新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥资 26 亿美元收购医疗数据公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大会上 Watson Health 公布了 IBM 的第
TOP 8:文字识别
计算机文字识别,俗称光学字符识别,它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。这是实现文字高速录入的一项关键技术。
TOP 9:图像及视频编辑
2016 年,Google 举行了一场人工智能作家的画展。通过一个名叫DeepDream的艺术生成器,谷歌可以将神经网络由内部传送到外部。不是识别图像,而是创作图像。有人称这些机器做的画为机器之梦。
目前市场上也出现了很多运用及机器学习算法对图像进行处理,可以实现对图片的自动修复、美化、变换效果等操作。并且越来越受到用户青睐。
机器视觉在应用场景上逐渐突破工业检测,其应用边界逐步向智能生活领域拓展。由于机器视觉在智能生活、智能制造两个领域具有不同的技术特点和应用进展,所以机器视觉于这两个领域的行业发展趋势也不尽相同。
一、机器视觉软件选型要点
1、定位器的准确性
目标或特征的准确定位是一个检测体系或由视觉引导的运动体系的重要功用。传统的物体定位选用的是灰度值有关来辨认物体。尽管这种技能得到了广泛的运用,可是,它在图象质量变差的状况,就缺少稳定性。图象质量变差可能是因为杂乱、亮度不一样和隐瞒等要素的影响。相反,几何目标定位法是一种最新的办法,它运用目标的概括来辨认目标及其特征。维视图像自主研发的图像处理软件多数采用几何目标定位法,且效率极高,可以有效的帮助用户解决定位问题。
2、工具库还是应用软件
机器视觉软件主要以两种典型的方式出售:一种是包含多种处理算法的工具库,另一种是专门实现某一类特殊工作的应用软件。这两种各有利弊,需要第一时间确认这一特性后再做选择。维视图像提供的图像处理软件包含这两种,既可以提供专业应用又满足客户变化多样的需求。
3、编程和操作方便
简练、直观的图形界面是简单运用和设置的要害。当今机器视觉商品之间的主要区别在于他们的图形接口。接口大概从“设置”和“操作”这两方面来评估。对一个工程师来讲,它大概十分复杂,而关于一个操作者来说应十分简单。
4、亚像素精度
视觉体系的分辩率是体系能分辩的最小特征。例如,1’’的视觉规模(FOV)运用一个640x480像素的计算机图象将得到1/640的分辩率或0.00156’’。实际上,机器视觉算法具有亚像素的才能。也就是说,这些算法可以丈量或得出比一个像素更小的单位。
5、易于升级
机器视觉体系可运用在各种场合,他们的运用规模可从时尚的摄像机到监督体系。当挑选一个体系时应思考体系将来的升级。依据通用目的的视觉软件体系十分好晋级。最终用户大概依据附加的摄像机、照明的改变、视觉东西的改变等来思考将来对体系的需要。
6、图象预处理算法
大部分的图像处理软件提供预处理算法,所以需要比较其提供的丰富程度,效率等。
7、体系集成
假如你对机器视觉技能不是很精通,那么针对你的项目就需要一个体系集成商,理想的视觉商品能被体系集成商广泛承受。
二、常用机器视觉软件介绍
1. OpenCV,开源免费的图像处理库
OpenCV是近年来推出的开源、免费的计算机视觉库,利用其所包含的函数可以很方便地实现数字图像和视频处理。同时利用面向对象的VC++ 6.0编程工具,用C++语言进行程序编写 OpenCV算法库为VC++编程处理数字图像提供了很大的方便,其必将成为图像视频处理领域的强有力的工具。
缺点:由于是开源软件,因此其版本繁多,函数库复杂,执行效率收到应用,比较适用于科研和学习,不适合工业应用。
2. Halcon,强大的图像处理库
HALCON是德国MVtec公司开发的一套完善的标准的机器视觉算法包,拥有应用广泛的机器视觉集成开发环境。它节约了产品成本,缩短了软件开发周期——HALCON灵活的架构便于机器视觉,医学图像和图像分析应用的快速开发。在欧洲以及日本的工业界已经是公认具有最佳效能的Machine Vision软件
缺点:价格比较贵,每次分发需要重新购买授权。
3. NI Vision,快速验证的图像处理库(含视觉助手、VBAI)
关于机器视觉的相关介绍就到这了,如有不足之处欢迎指正。
全部0条评论
快来发表一下你的评论吧 !