手写数字识别(Handwritten Numeral Recognition)是光学字符识别(Optical Character Recognition,简称OCR)的一个分支,主要研究利用计算机自动辨认人手写在纸张上或电子设备的10个阿拉伯数字。手写数字识别技术有很强的综合性,涉及到图像处理,模式识别,人工智能,模糊数学,统计决策理论,模糊数学,综合数学,信息论,计算机等学科,并且在数据统计、邮政系统、文献检索、票据处理、办公自动化等方面有着非常广阔的应用前景。
手写数字识别虽然只有0-9十个字符,书写和笔画结构都比较简单,但识别困难在于不同人的书写样式不同,而且数字的书写一般没有上下文的关联。脱机手写字符的识别一般从纸质载体上采集字符,因而图像预处理的结果将直接影响识别系统的识别率,本文主要研究手写数字识别的预处理过程。
字符识别系统一般分为图像预处理、特征提取、字符识别等模块。预处理技术是手写数字字符识别中非常重要的一步,原始的待识别图像在预处理时被转换成计算机所能接受的二进制形式。减少图像冗余信息、滤出图像中的噪声为图像预处理的主要目的,即在图像预处理时,不但与图像无关的信息要去捭,原图像的特征还要尽量保留完全。
图像预处理时得到的图像信息越好越完整,后期进行特征提取和字符识别时得到的结果越理想,如果图像预处理的结果不理想,不仅会降低系统的识别率,而且也会影响判别的速度,从而降低整个系统的性能。对一般手写体数字识别技术,预处理一般包括二值化、平滑去噪、细化等步骤。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部1条评论
快来发表一下你的评论吧 !