关于开放平台OCR上线印刷文字识别的介绍

讯飞开放平台 2019-09-27 3717

描述

每当遇到以上情景，你是不是都希望有一个神奇的装置，哪儿需要扫哪里，迅速将文字转成计算机可编辑的数据？

说曹操曹操就到，讯飞开放平台印刷文字识别技术闪亮登场！作为OCR系列服务的新成员，带来处理大量非数据文本的神器。

1数字时代的刚需技术

大数据时代下，虽然我们每天在计算机上获取，编辑大量的文本，但计算机以外的各种文本一直在我们的工作和学习中占据重要位置。而将这些文本录入也一直耗费着大量的时间和人力。

如何高效处理海量非结构化数据，使它们能快速转化为计算机可处理的数据，方便进一步数据库采集、管理、分析和决策，已成为下阶段的行业大方向。作为处理图片文字数据的AI技术——OCR（optical character recognition 光学字符识别），正是一种有效的解决方案，在越来越多用户需求的真实场景中实践。

讯飞开放平台重磅推出的OCR系列产品，基于讯飞AI研究院独创的基于深度神经网络模型端到端文字识别系统，识别文字符号的数字影像，并将其转换为对应的电脑等设备可编辑的数字文本，最终达到识别的文字结果可编辑、可处理的目的，其中印刷文字识别技术面向的就是印刷字体的转化。

2印刷文字识别应用广泛

正如文章开头我们提到的，生活中有很多需要将印刷字体转换为设备可编辑的文本场景。而作为OCR家族的重要成员，印刷文字识别在这时候就大有作为，下面小编就带大家看一看——

1.资料/文档处理

工作或者科研学习中，要应对大量的会议材料、书刊杂志、电子资料（如PDF），印刷识别技术可以方便将这些资料的文字转化为可编辑和整理格式

2.卡证信息录入

在需要录入身份证、驾驶证、银行卡、营业执照等信息的场景下，印刷识别技术可以减轻手动录入的压力，更高效。

3.视频/图片内容审核

计算机可以处理电子字符，但对图片上和视频中的字体无法识别，通过印刷文本识别技术，可以将图片中的印刷字体以及视频中的字幕、弹幕、画面文字转换为计算机可处理的文本，增强审核能力。（图片、视频中的印刷字体可使用印刷文字识别技术）

4.书摘笔记

读书时，看到不错的金句和段落想要摘录或分享，印刷文字识别技术只需要随手一拍就能生成文本。

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存Mark，或是用截屏把手机页面内容保存到相册，但这些图片信息散乱在手机各处，很难进行归纳、整理和检索

6.医疗、金融、图书档案管理行业电子化

医疗单据、票据、病例等资料电子化入库；金融企业证照、年报、财报、票据等纸质资料的结构化录入；图书档案的电子数据库的搭建，更新。都能通过印刷文字识别技术达到减少人力录入成本，提高效率的目的。

7.拍照翻译

在国外旅行时，遇到指示牌/路牌、餐馆菜单、商品标签、入境卡等多种场景量身定制。利用印刷文字识别+翻译，随手一拍，翻译内容即刻显示。

如4月20日上市的讯飞翻译机2.0，就带有2.4英寸的液晶显示屏和摄像头，支持中文与英、日、韩、法、西、德、俄、意、葡、泰、阿拉伯语的在线拍照互译，并支持中英离线拍照互译。

3讯飞印刷文字识别技术优势

我们为什么用OCR？因为可以快速将文字转为可在设备上编辑的数字文本。因此能够得到用户青睐的OCR小编认为应能够准确生成文本，所见即所得，同时对不同字体，不同环境，不同颜色形状的文本准确识别。

产品优势

准确率业界领先地位

印刷文字识别的识别率高达90%

复杂场景支持

支持扫描体以及复杂自然场景下的文字识别，对方向有旋转的文字，支持文字与水平轴小于±15°夹角偏转。

识别不同语言

目前支持识别中文、英文、中英文混合的文字内容的识别。

在中文人工智能助手咪咕灵犀的翻译功能模块，接入讯飞开放平台的OCR与翻译能力，提供图片中文字的识别与翻译能力。

接入简单便捷

提供Restful API接口，可供开发者进行跨平台使用

以上，大家可以看到讯飞开放平台的印刷文字识别技术在准确率，识别能力方面表现出色，同时支持不同语言以及混合语言的识别。

打开APP阅读更多精彩内容