国内哪几家语音转写技术做得比较好

描述

语音转写,也叫音频文件转写,是指批量将音频文件(5小时以内)转换成文本数据,适用于语音质检、会议访谈等场景。

语音转写与语音听写的区别主要体现在「支持的音频时长上」,语音转写支持的音频时长是在五小时以内,语音听写支持的音频时长是在一分钟以内。因此,两者的使用场景也略有不同,语音转写更多应用于贴近日常的对话、演讲等长文本场景,而语音听写则主要应用于人机对话、输入法、语音搜素等短文本场景。

目前,国内提供语音转写技术的厂商主要有:

1、科大讯飞

成立于1999年,2008年,公司在深圳证券交易所挂牌上市(股票代码:002230)。一直深耕在人工智能领域,技术很全也很综合,多次在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等各项国际评测中取得佳绩。

在语音转写上,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027),支持中文、英文、中英混合识别。支持12种方言,8种外语,2中民族语言,可提供公有云接口及私有化部署方案。

2、腾讯云

腾讯集团倾力打造的云计算品牌。

在语音转写上,字准率97%,与微信、王者荣耀的语音转文字使用一套服务。支持中文普通话、英语。支持2种方言,4种外语,后续将陆续开放其他语种和方言的识别能力。

3、百度智能云

百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务。

在语音转写上,近场中文普通话识别准确率达98%。支持普通话和略带口音的中文识别,支持英文识别。

4、云知声

2012年6月创立于北京,是国内头部人工智能独角兽企业。

在语音转写上,准确率可达实用标准,适用于会议转写、字幕生成、音频内容分析等场景。

5、思必驰

07年创立于英国剑桥,08年回国落户苏州,12年完成A轮融资,是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术。

在长语音识别转写上,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。云端连续实时语音识别率>97%。

审核编辑:符乾江

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分