云从科技在语音识别技术上取得重大突破

描述

10 月 29 日,广州云从信息科技有限公司(以下简称云从科技)宣布在语音识别技术上取得重大突破,该技术在全球最大的开源语音识别数据集 Librispeech 上刷新了世界纪录,错词率(Worderrorrate,WER)降低至 2.97%,将Librispeech 的 WER 指标提升了 25%,超过微软、谷歌、IBM、阿里、百度及约翰霍普金斯大学等企业及高校 。

据介绍,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,而语音识别技术是智能感知的重要部分,通过语音识别,机器可以像人类一样理解语言,进而展开处理并进行反馈。

云从科技此次推出的语音识别模型Pyramidal-FSMN 融合图像识别与语音识别的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,能够同时有效的提取空间和时间上不同粒度的信息,相比目前业界使用最为广泛的 LSTM 模型,其训练速度更快、识别准确率更高。

此次突破是云从科技在今年4月刷新“跨镜追踪技术(ReID)”三项世界纪录后取得的又一重大成果。今年4月,云从科技跨镜追踪技术(ReID)技术在 Market-1501,DukeMTMC-reID,CUHK03 三个数据集刷新了世界纪录,其中最高在 Market-1501 上的首位命中率(Rank-1 Accuracy)达到96.6%,让跨镜追踪技术(ReID)技术在准确率上首次达到商用水平。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分