讯飞输入法将深度神经网络DNN技术应用于语音识别达到业界领先水平

电子说

1.3w人已加入

描述

10月20日,以“语见更好的我们”为主题的“讯飞输入法10周年 A.I.输入沙龙”在北京举办。记者从活动现场了解到,自2010年10月上线至今,讯飞输入法的日语音交互次数超过10亿次,语音输入累计服务设备超过5亿台,语音用户占比超过70%。十年间,作为科大讯飞智能语音技术的典型应用,讯飞输入法围绕提升输入效率这一核心目标,发力核心技术攻关,完善输入法的用户体验。

2010年,讯飞输入法1.0版本将隐马尔可夫模型成功应用于语音识别系统中,让输入效率提升了3倍;2012年,讯飞输入法率先将深度神经网络DNN技术应用于语音识别,使识别效果达到业界领先水平;2018年推出了Hybrid CNN语音识别引擎,大幅提升中英混合输入效果……在A.I.驱动和大数据积累下,讯飞输入法实现了从单一识别率提升到全场景输入覆盖的迭代。

回顾讯飞输入法十年发展历程,科大讯飞副总裁章继东说,一直在努力“让技术更有温度”。

图为科大讯飞副总裁章继东进行主题演讲

在大多数人眼里,语音输入仅仅是一个产品功能或者一种输入方式,但语音输入正在搭建一座座通往无国界、无地域、无障碍的“桥梁”。

新冠肺炎疫情发生后,讯飞输入法紧急上线“武汉话转普通话”功能,助力武汉抗疫;2017年,讯飞输入法发起“方言保护计划”公益行动,通过智能语音技术保护方言,目前方言库的珍贵语料近140万条,并通过A.I.语言复制实现23种方言识别;讯飞输入法连续3年发起“和我一起看见”信息无障碍公益行动,将业界领先的A.I.技术应用到无障碍模式上,让视障群体可以在不同场景下快速、顺畅地使用。沙龙上,讯飞输入法获得了中国盲人协会颁发的无障碍认证证书。

活动上,科大讯飞输入法业务部总经理程坤展示了最新发布的讯飞输入法10.0版本。这一版本搭载了“动态自适应编解码语音识别引擎”,令通用语音识别率在98%基础上再获突破。新增的唇形辅助输入,提高嘈杂环境及近距离多人说话的识别效果。同时,输入法大幅优化领域词的识别,帮助用户更精准地匹配游戏、医疗、旅游、购物等不同场景词汇。

科大讯飞输入法业务部总经理程坤在活动现场展示讯飞输入法10.0版本

“输入效率并不是终点,效率之上,输入法作为大众款产品更应满足多样化的表达,适应复杂的输入环境。”程坤补充道。

沙龙现场,相声演员方清平用讯飞输入法快语速输入挑战《木兰辞》。根据现场公证员公布的数据,方清平用17.81秒时间读出182字。在耳朵难以听清内容的语速下,讯飞输入法准确识别出内容并自动添加标点。

此外,基于“免切换”的理念,讯飞输入法10.0版本实现了英文单词连续手写,即在输入面板既可以手写汉字也可以直接手写完整的英文单词。至此,讯飞输入法已实现语音、拼音、手写多种方式的中英文输入免切换。

“新十年,讯飞输入法将目光投向5G和AIoT领域,”章继东表示,“过去十年里,讯飞输入法秉持着技术‘顶天’,引领语音交互‘落地’的理念,不断革新产品,努力让亿万用户高效输入,乐享沟通。下一个十年,随着5G和AIoT时代的到来,讯飞输入法将继续以过硬的技术实力直面行业发展的挑战与机遇,不断提高语音输入的行业‘天花板’。”

科大讯飞消费者BG副总裁严亚路、中国盲人协会信息无障碍促进委员会副主任朱清毅等出席活动,多位讯飞输入法粉丝在现场共同参与见证讯飞输入法10年征程。
       责任编辑:pj

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分