支付宝是怎么识别“福”这个字的,给你原理大揭秘,你知道不!

科技金融

23人已加入

描述

  这几天,我想大家都在使用支付宝AR扫“福”字,玩五福红包,那么支付宝AR是怎么识别你扫描的“福”字的,这个科技含量可高多了,运用了最新技术,扫一扫识别,无论是窗花,手写,还是春联,只要是福就可以识别出来,但是问题来了,这么神奇的技术背后,到底是如何做到的呢?

  ?下面小编来说说,支付宝扫福识别的科技奥秘。对于了解电脑的朋友肯定都知道,计算机是根据2进制的原理运行的,也就是说,无论屏幕上显示的是什么,背后计算机接收的全部都是又0和1组成的一串数字,最后翻译解码后,形成对应的图像。所以要想让手机识别,你扫描的是一个福字,而非其他什么文字或者场景,这就需要完成以下几步才可以完成这个看似简单的识别过程。

  

  第一步就是要先对动态的手机照相机进行稳定的识别,所以这时就需要你稳定手机,对准所要识别的区域,支付宝软件后台开始执行,对焦、拍摄等一些简单初始的图像,并将图像进行简单的对齐,校正操作。

  第二步处理过的图像进行“二植化”处理,将复杂的颜色划分归类,并分为前景色和背景色,前景色定义为黑色,背景信息定义为白色。这样做的目的,一是为了方便计算机识别判断,二是为了节约带宽和资源。

  

  第三步是将处理好的图片,进行修复,去噪处理,是主题更加清晰,当一切准备就绪,程序就会开始执行“字符切割”处理,由于拍摄原因多种多样,所以难免对一些拍的不好的地方,精心智能的切割补位处理,同时福字在春联和窗花上的特殊性和多变性,也使得切割有一定局限,为了解决这个局限,就需要在进行下一步“字符识别”时,对数据的算法进行优化,bundling features算法、hash function(散列函数)等。

  

  第四步算法都是比较常用的算法,但是这里聪明的支付宝为了,规避不必要的人力浪费,最好的办法就是,基于一个“福”字来编写算法,所以完全不用考虑到适应所有汉字结构,同时,支付宝最终的目的是为了,让用户扫出福字,所以对算法要求并不是很严格。这也就是为什么,有时候你会发现,并不是一定要写一个正确的福字才会识别,只要是结构相近的就可以。

  

  第五步当识别的字符与数据库中的字符基本吻合时,就会向支付宝服务器发送反馈指令,同时在接受到指令时反馈到用户手机,说了这么多,感觉挺麻烦的事,其实,在手机应用程序执行起来,也就不到0.5秒的时间,就可以完成,随着你扫描的越多,系统也会自动学习,优化。

  

  所以,支付宝为了开启耍猴模式,也是煞费苦心,才想出来这么一招,但是出于对科技的敬畏,不得不承认,支付宝的确做到了高效的识别图片的能力,无论是对以后人工智能识别还是翻译文献都提供了新的方法和思路。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分