基于模板匹配的OCR盲人导读仪器（STM32+OV5640）

消耗积分:1 | 格式:docx | 大小:2145KB | 2017-12-09

一修法师

分享资料个

基于模板匹配的OCR盲人导读仪器（STM32F407+OV5640）

　　摘要

　　本论文详细介绍了一款低成本便携式的OCR文字识别，TTS语音播报系统的实现方案。本次研发的盲人导读仪系统，核心的软硬模块子子系统包括：500万高清摄像头JPEG图像采集子系统，大功率NRF2401图像传输子系统，MFC上位机图像解码子系统，OCR模式识别子系统， TTS文本语音子系统。本文将对设计的各个子系统详细阐述。

　　关键词：模式识别OCR; TTS语音播报系统; OV5640五百万像素采集系统；

　　OCR blind reading meter based on template matching

　　This paper introduces in detail a low-cost portable OCR character recognition， the implementation scheme of TTS speech broadcasting system. The research and development of the blind reading meter system， the core of hard and soft module a subsystem including： 5 million hd camera JPEG image acquisition subsystem， high-power NRF2401 image transmission subsystem， MFC PC image decoding subsystem， OCR pattern recognition subsystem， TTS text-to-speech subsystem. This article will be to the design of each subsystem in detail

　　Key words： OCR pattern recognition; TTS speech broadcasting system; OV5640 mega pixels acquisition system。

　　1绪论

　　书籍是人类进步的阶梯，视觉障碍的弱势群体如果想要阅读一些文献资料，传统的方法要依赖盲文，凭借手触觉去感知文字，由于盲文的发行量相对较少，加上他笨重，体积大，致使收到很大限制。随着计算机的领域的飞速发展，OCR （Optical Character Recognition，光学字符识别），TTS（Text To Speech，从文本到语音），OV5640（高清摄像头）日益成熟，这些新兴技术，将为视觉残障人士带来福音，将视觉文字变成听觉语音，自此弱势的残障人士可以打破视觉阅读障碍，享受文本书籍的知识殿堂。

　　1.1课题的背景与意义

　　我国的印刷体汉字识别是从70年代开始研究，大致可以分为如下3个阶段：

　　第一阶段：20世纪70年代末期到20时期，主要是算法和方案探索。

　　第二阶段：20世纪90年代，中文OCR技术从实验室走向市场。

　　第三阶段：21世纪初至今，主要是印刷体汉字识别技术和系统性能的提高，包括汉英混排识别率的提高和稳健性的增强。

　　1.2 OCR的研究现状及研究意义

　　现有的文字技术一般采用光学的方式将文本图像信息采集到计算机中，因此该技术被称为光学字符识别（Optical Character Recognition， OCR）技术，经过将近一个研究，OCR已经成为现如今模式是被领域里最活跃的研究方向之一。它综合了人工智能，计算机图像，数字图像处理等多方面的内容，并在计算机领域及其相关领域得到了广泛的应用。近些年来，我国的中文印刷体文档识别发展十分

　　随着社会的发展，科学文化的进步，越来越多的视觉障碍人式（包括先天性行残疾人士，或者因意外事故及其伤病视力下降乃至失去视觉的残疾人士）更加渴望阅读这个时代最前沿的书籍期刊，鉴于盲文的厚重，不便于携带，印刷量小，延迟性高等缺点，市场上主流的OCR识别器售价相对较高，一种低成本，高识别率的OCR盲人导读仪的研发有相当大的现实意义，其核心算法也有着极其广泛的社会应用：

　　1.使用OCR进行印刷体版文稿的自动识别录入，这类产品的缺点是对于表格，插图，公式需要手工进行干预。

　　2图形，图像，公式，文本，中英文交叠等混版复杂版面进行自动切分的印刷识别系统的算法研究提供解决思路。

　　3邮件自动分拣系统，邮件的自动分拣系统东是邮政系统提高心寒分拣速度和质量的极为有效手段之一国内外已经普遍使用，其核心算法是书写体的识别。

　　4 手写体表格数据自动录入系统，应用于政府，保险，医疗等个行业的申报表，调查表等表格数据的处理与录入【1】。。

　　1.3研究的主要内容和预期目标

　　该系统致力于实现一种低成本，便携式，易操作，高识别率的简易OCR中文识别系统。根据基于模板匹配的OCR的自身特点，以及现阶段研究水平，调研了中文OCR在各个行业的应用市场，如下对基于模板匹配的盲人导读仪的各个系统和实现原理及算法进行简要讲解。

　　1.3.1 核心子系统解决方案概述

　　1. 基于OV5640 500万像素的自动对焦的高清摄像头模组，实现JPEG，BMP高清图像采集存储。

　　2. 基于大功率NRF2401的无线传图子系统，可以实现一点对多点，单点对单点实时图像采集传输。

　　3基于VS2010 MFC上位机算法处理子系统，SerialPort串口接收模块，Cimage类进行数据流图像解码编码，微软公司开源MicroSoft Image documentOCR控件作为核心算法将采集解码得到图片文字解码出来，显示到Edit文本框，将文字编码串口发送科科大讯飞模块。

　　4基于科大讯飞模组XFS5512CE文字语音转码解码芯片将OCR识别的文字进行语音播报，实现文本到语音的转换。

　　1.3.2 预期目标

　　1. STM32F103RBT6能正常驱动500万OV5640高清模组，实现图形采集

　　2. NRF2401能实现无线传图，文字解码信息发送

　　3.MFC数据流解码JPEG，OCR文字识别，OCR解码发送

　　4.下位机驱动科大讯飞模块，实现文字解码发送。

　　2基于模板匹配中文OCR语音导读仪工作原理

　　2.1 OCR工作原理

　　与普通印刷体文档是被相比，中文印刷体文档识别在对文档所包含的文字字符识别过程中。一个完整的中文印刷体文档识别系统应包括如下诸多模块：

　　文档图像预处理。该部分完成对原始文档图像预处理，使得原始文档图像能够达到识别的要求。

　　文档图像版面分析，该部分实现文档图像中文本，表格和图像等不同区域的分离，并在识别出每个区域的类别后交由不同的处理模块进行进一步的分析和处理。

　　文档图像中的多字符识别，该部分处理通过文档版面分析得到的文本区域，包括汉字识别和公式识别的模块。汉字识别模块负责包括中文字符在内的所有字符的识别。

　　文档图像中图形图像暂存模块。该部分负责处理通过文档版面分析得带的图像图像区域。

　　版面分析过程中，分析得到的文字区域，图像区域和表格区域将被分别切割成单独的图像，其中文字图像区域将送至印刷体汉字识别模块进行处理。与其他的数字图像模式识别应用类似，印刷体的汉字识别的基本过程包括图像预处理。图像分割，图像分割，特征提取，图像分类等过程。图像的预处理通过图像增强，文字字符切割等步骤形成单个汉字字符图像，图像分割则在单个汉字图像中提起汉字轮廓，特征提取则是是依据汉字轮廓提取代表的各个汉字模式的本质的表达形式，即各种特性，形成汉字模板库（可以理解为字典）并存储在计算机中。识别时，图像分类过程将汉字的模式特性和汉字的模板库元素逐一匹配，在用一定的匹配准则进行判别。最后在模板库中找出最接近的位置汉字的模板元素，该模版元素的汉字就是识别的结果。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

矩形科技 CANopen 远程IO模块产品手册
2026-06-26 2次下载

下载
OC5721欧创芯开关降压型LED恒流驱动器
2026-07-03 2次下载

下载
灵动 ATE 自动测试系统用户使用说明
2026-07-13 2次下载

下载
高性能非隔离交直流转换芯片 PC9403A数据手册
2026-07-02 2次下载

下载
复旦微 FMQL100TAI 智能开发套件手册 AI 实时图像处理开发板资料
2026-07-16 1次下载

下载
GL65P06A8产品光磊 60V 65A P沟道功率 MOSFET
2026-07-03 1次下载

下载

基于模板匹配的OCR盲人导读仪器（STM32+OV5640）

模板匹配算法的改进及在自动发牌机中的应用

OV5640图像传感器数据手册

OV5640资料包分享

ATK OV5640 AF V1.1图下载

STM32驱动摄像头ov5640的驱动源码

openmv与stm32f103zet6的串口通信

自动对焦摄像头模块OV5640原理图

CMOS图像传感器OV5640用户手册.pdf

OV5647高清手机摄像头原理图方案

STM32F4系列标准库工程模板文件结构分析及标准工程模板分享

STM32F103RCT6 基于STM32Cube_FW_F1_V1.8.0库建立工程模板

[STM32]STM32F407系列教程之一，搭建简洁template模板

STM32CubeMX 创建工程模板

STM32F103ZE构建固件库模板

STM32Keil工程模板创建(详细配图)

一个STM32编译Makefile模板

TouchGFX中Callback模板实现原理

基于stm32控制OV7670摄像头

STM32和OV2640的嵌入式图像采集系统设计资料下载

一种二分支神经网络匹配的人脸检测算法

STM32单片机移植带有FIFO摄像头的OV7670

基于D3 CAMERA MEZZ OV5640图像传感器的参考设计

STM32F103 CAN模板程序

机器视觉中基于灰度统计的快速模板匹配算法详细概述

OCR文字识别视觉检测系统应用程序免费下载

OV5640相机模块硬件应用说明

使用STM32单片机应用OV7670摄像头的AD原理图免费下载

STM32F107单片机开发板的模板文件免费下载

新建基于MDK的STM32工程模板教程说明

ATK-OV2640摄像头模块的资料和基于STM32应用的C语言源代码免费下载

使用STM32单片机驱动OV7670进行图像的采集的程序和工程文件免费下载

ATK - OV5640摄像头模块：电子工程师的实用之选

基于LockAI视觉识别模块：C++多模板匹配

基于LockAI视觉识别模块：C++模板匹配

手写图像模板匹配算法在OpenCV中的实现

OpenCV边缘模板匹配算法原理详解

PDF执行OCR使用指南（仅适用于万兴PDF专业版）

​详细剖析模板匹配

OCR实战教程

OpenMV如何实现旋转模板匹配呢

如何通过OV5640摄像头显示在VGA显示屏上

使用VPLC控制器对图像进行灰度匹配

什么是模板匹配？模板匹配的原理讲解 图像处理与模板匹配算法

函数模板与类模板的基本概念及实现原理

机器视觉运动控制一体机应用例程|OCR字符识别应用

基于边缘的模板匹配适用部分遮挡和光照变化情形(附源码)

探究halcon模板匹配干扰边缘消除办法

你们知道什么是函数模板、类模板？

关于OCR 你想了解的可能都在这儿了

【紫光同创国产FPGA教程】【第十五章】OV5640摄像头显示例程

基于滤波与预测自适应模板匹配的应用研究

i2c的设备树和驱动是如何匹配以及何时调用probe的

i2c的设备树是如何匹配以及何时调用probe的

基于ZYNQ LCD显示OV5640图像测试方法

模板对PCB组装的重要性

微雪电子OV5640 摄像头模块B型简介

微雪电子OV5640摄像头模块A型简介

微雪电子OV5640 摄像头模块C型简介

基于OmniVision的OV5640设计的USB摄像头模块

正点原子开拓者FPGA视频:OV5640 LCD显示视频

正点原子开拓者FPGA Qsys视频：OV5640摄像头MCU TFT-LCD显示实验

下载排行榜

矩形科技 CANopen 远程IO模块产品手册

OC5721欧创芯开关降压型LED恒流驱动器

灵动 ATE 自动测试系统用户使用说明

高性能非隔离交直流转换芯片 PC9403A数据手册

复旦微 FMQL100TAI 智能开发套件手册 AI 实时图像处理开发板资料

GL65P06A8产品光磊 60V 65A P沟道功率 MOSFET

详细剖析模板匹配

什么是模板匹配？模板匹配的原理讲解图像处理与模板匹配算法