智能语音最强突破!微软语音识别率已堪比人声

音频技术

95人已加入

描述

  智能语音识别和语音应答,成为移动互联网时代重要的技术,苹果、微软、谷歌(微博)、亚马逊等各大巨头均有布局。在人类语音识别精度上,各家厂商也展开了军备竞赛。最新消息显示,微软研发团队在识别率上,达到了堪比人类的准确度。

  微软公司人工智能研发团队最近发表了一篇语音识别的论文,报告中提到他们研发的识别技术,已经实现了5.9%的词汇差错率。外媒指出,这样的差错率或者准确率,已经和正常人类基本接近。

  微软公司负责语音识别研究的领导人Xuedong Huang表示:“我们已经实现了和人类一样的识别水平,这是一个历史性突破。”

  据悉,各家厂商的团队,都在千方百计提高语音识别的准确率,降低词汇差错率,而在上个月,差错率的最新成绩降低到了6.3%,而微软的最新论文,又进一步实现了突破。

  和其他可能被束之高阁的创新研究不同,语音识别技术能够很快应用到实际产品中,因此这一研究成果,对于微软实际业务也将产生重大意义,比如微软可以在语音助手Cortana(中文俗称“小娜”)、Xbox游戏平台、Windows操作系统中部署最新的语音识别技术。

  在智能语音识别领域,微软的Cortana后来居上,行业评价已经超过了苹果的Siri,目前微软已经把语音助理覆盖了各种计算工具,比如手机、平板电脑、电脑操作系统等。

  为了提高语音识别的精度,微软的研究人员采用了神经网络,来存储海量的数据,可以帮助识别软件更聪明地识别出人类语音表达的模式。

  另外,微软还需要利用声音信息和图片信息,让神经网络更有效地利用存储的海量数据。

  不过在研究人员看来,达到和人类持平的程度,还不是研究的最终目标,目前的识别技术还不是完美无瑕。

  微软团队表示,接下来还要进一步提高语音识别的准确率。另外为了确保识别技术获得更加实际的应用,微软计划在更加嘈杂的环境中,同样实现高精度的识别,比如在一个热闹的餐馆、人潮涌动的大街上,或是在狂风暴雨环境中,微软希望在非正常环境下,语音系统也能够准确理解人们说的话。

  另据报道,在智能手机时代,语音识别技术的地位比过去更重要,而目前苹果Siri表现糟糕,已经引发了苹果高管的注意。就在近日,苹果从美国卡耐基梅隆大学挖来了一个人工智能技术的教授,将负责组建微软的人工智能研究团队,这一团队的使命之一,也是大大提高Siri识别语音和智能回答问题的“智商”。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分