计算机视觉技术面临的挑战

描述

电子发烧友网报道(文/李弯弯)计算机视觉技术最早开始于20世纪60年代,其主要是模仿人类视觉,让计算机或机器人看到物体,到如今计算机视觉已经取得很大进展,不过就研究和开发来说,它还有很大的探索空间。
 
当今的计算机视觉的子领域大概可以包括:场景重建、目标检测、事件检测、视频跟踪、目标识别、3D姿态估计、运动估计、视觉伺服、3D场景建模、图像修复等。
 
比如目标检测,具有目标检测的设备可以找到目标,在其周围画出矩形边界框,并确定每个被检测目标的类别,目标检测可以应用于许多不同的行业,包括零售、体育、医疗保健、营销、室内设计、农业、建筑、公共安全、交通等。
 
目标检测是一个复杂的过程,其实现需要经历一定的挑战,比如视角的多样性、变形、遮挡、光照条件、杂乱或有纹理的背景、多样性、速度等。具体来看,比如视角的多样性,物体检测的最大困难之一是从不同的角度看一个物体,可能看起来完全不同;
 
再比如照明对物体的定义有很大的影响,相同的物体会因光照条件的不同而看起来不同,可能照亮的空间越少,物体就越不可见,这些都会影响检测器定义目标的能力;在视频方面,探测器需要经过训练,在不断变化的环境中进行分析,这意味着目标检测算法不仅必须准确地分类重要的目标,而且还必须在预测过程中具有好的速度,能够识别运动中的目标。
 
从某种意义说,这几年计算机视觉已经进入瓶颈期。以图像分类、目标检测、图像分割为代表的一些基础技术经过过去几年的发展,精确度已经达到产业落地水平,但剩下的一些问题比较难攻克,如非常细粒度的分类,非常小和模糊的目标检测和分割,以及如何保证在复杂光照变化下的分割结果的稳定性等。
 
可以说过去几年,计算机视觉技术一直在试图攻克一些老的难题,如跨年龄、大姿态、有遮挡的人脸识别,有一定的进展,却不能算是有很大的突破。
 
在落地应用方面,计算机视觉存在很大的同质化问题,很多公司扎堆在几个热门场景中,比如安防场景,智能安防是计算机视觉最主要的应用场景,而且已经持续很多年,目前来说,计算机视觉较为成熟的应用场景也是安防领域。
 
大家熟知的AI初创企业商汤、旷视、依图、云从等都在这个领域有重要布局,另外安防企业和互联网企业也在这个领域投入很大力度,包括海康威视、大华、宇视、百度等,此外还包括几百家中小计算机视觉企业。
 
不过除了安防,各企业也有在其他领域进行探索,并逐渐有所进展,比如金融、手机、汽车、工业、医疗、零售等领域,比如虹软科技,在手机领域、笔记本电脑、智能可穿戴设备等移动终端,以及智能驾驶领域都有布局,再比如格灵深瞳除了城市管理之外,在智慧金融、商业零售等方面都已经取得一定成绩。
 
整体而言,从上世纪60年代到现在计算机视觉技术已经取得很大的进展,不过其在实现上还存在一些难题,发展也遇到了一些瓶颈,而且在落地应用上大多数企业扎堆在少数场景中,不过从近年来的情况来看,计算机视觉企业在技术和应用上还在持续寻找突破,目前除了在安防领域应用比较成熟以外,在金融、医疗、工业、智能驾驶等领域进展明显。
 
 
 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分