关于开放平台OCR上线印刷文字识别的介绍

描述

每当遇到以上情景,你是不是都希望有一个神奇的装置,哪儿需要扫哪里,迅速将文字转成计算机可编辑的数据?

说曹操曹操就到,讯飞开放平台印刷文字识别技术闪亮登场!作为OCR系列服务的新成员,带来处理大量非数据文本的神器。

1数字时代的刚需技术

大数据时代下,虽然我们每天在计算机上获取,编辑大量的文本,但计算机以外的各种文本一直在我们的工作和学习中占据重要位置。而将这些文本录入也一直耗费着大量的时间和人力。

如何高效处理海量非结构化数据,使它们能快速转化为计算机可处理的数据,方便进一步数据库采集、管理、分析和决策,已成为下阶段的行业大方向。作为处理图片文字数据的AI技术——OCR(optical character recognition 光学字符识别),正是一种有效的解决方案,在越来越多用户需求的真实场景中实践。

讯飞开放平台重磅推出的OCR系列产品,基于讯飞AI研究院独创的基于深度神经网络模型端到端文字识别系统,识别文字符号的数字影像,并将其转换为对应的电脑等设备可编辑的数字文本,最终达到识别的文字结果可编辑、可处理的目的,其中印刷文字识别技术面向的就是印刷字体的转化。

2印刷文字识别应用广泛

正如文章开头我们提到的,生活中有很多需要将印刷字体转换为设备可编辑的文本场景。而作为OCR家族的重要成员,印刷文字识别在这时候就大有作为,下面小编就带大家看一看——

1.资料/文档处理

工作或者科研学习中,要应对大量的会议材料、书刊杂志、电子资料(如PDF),印刷识别技术可以方便将这些资料的文字转化为可编辑和整理格式

2.卡证信息录入

在需要录入身份证、驾驶证、银行卡、营业执照等信息的场景下,印刷识别技术可以减轻手动录入的压力,更高效。

3.视频/图片内容审核

计算机可以处理电子字符,但对图片上和视频中的字体无法识别,通过印刷文本识别技术,可以将图片中的印刷字体以及视频中的字幕、弹幕、画面文字转换为计算机可处理的文本,增强审核能力。(图片、视频中的印刷字体可使用印刷文字识别技术)

4.书摘笔记

读书时,看到不错的金句和段落想要摘录或分享,印刷文字识别技术只需要随手一拍就能生成文本。

5.随手记录

在微信、微博等内容平台看到有价值的图片内容会随手保存Mark,或是用截屏把手机页面内容保存到相册,但这些图片信息散乱在手机各处,很难进行归纳、整理和检索

6.医疗、金融、图书档案管理行业电子化

医疗单据、票据、病例等资料电子化入库;金融企业证照、年报、财报、票据等纸质资料的结构化录入;图书档案的电子数据库的搭建,更新。都能通过印刷文字识别技术达到减少人力录入成本,提高效率的目的。

7.拍照翻译

在国外旅行时,遇到指示牌/路牌、餐馆菜单、商品标签、入境卡等多种场景量身定制。利用印刷文字识别+翻译,随手一拍,翻译内容即刻显示。

如4月20日上市的讯飞翻译机2.0,就带有2.4英寸的液晶显示屏和摄像头,支持中文与英、日、韩、法、西、德、俄、意、葡、泰、阿拉伯语的在线拍照互译,并支持中英离线拍照互译。

3讯飞印刷文字识别技术优势

我们为什么用OCR?因为可以快速将文字转为可在设备上编辑的数字文本。因此能够得到用户青睐的OCR小编认为应能够准确生成文本,所见即所得,同时对不同字体,不同环境,不同颜色形状的文本准确识别。

产品优势

准确率业界领先地位

印刷文字识别的识别率高达90%

复杂场景支持

支持扫描体以及复杂自然场景下的文字识别,对方向有旋转的文字,支持文字与水平轴小于±15°夹角偏转。

识别不同语言

目前支持识别中文、英文、中英文混合的文字内容的识别。

在中文人工智能助手咪咕灵犀的翻译功能模块,接入讯飞开放平台的OCR与翻译能力,提供图片中文字的识别与翻译能力。

接入简单便捷

提供Restful API接口,可供开发者进行跨平台使用

以上,大家可以看到讯飞开放平台的印刷文字识别技术在准确率,识别能力方面表现出色,同时支持不同语言以及混合语言的识别。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分