云从科技在语音识别技术上取得重大突破

机器人技术与应用 2018-11-01 4046

描述

10 月 29 日，广州云从信息科技有限公司(以下简称云从科技）宣布在语音识别技术上取得重大突破，该技术在全球最大的开源语音识别数据集 Librispeech 上刷新了世界纪录，错词率（Worderrorrate，WER）降低至 2.97%，将Librispeech 的 WER 指标提升了 25%，超过微软、谷歌、IBM、阿里、百度及约翰霍普金斯大学等企业及高校。

据介绍，云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段，而语音识别技术是智能感知的重要部分，通过语音识别，机器可以像人类一样理解语言，进而展开处理并进行反馈。

云从科技此次推出的语音识别模型Pyramidal-FSMN 融合图像识别与语音识别的优势，将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,能够同时有效的提取空间和时间上不同粒度的信息，相比目前业界使用最为广泛的 LSTM 模型，其训练速度更快、识别准确率更高。

此次突破是云从科技在今年4月刷新“跨镜追踪技术（ReID）”三项世界纪录后取得的又一重大成果。今年4月，云从科技跨镜追踪技术（ReID）技术在 Market-1501，DukeMTMC-reID，CUHK03 三个数据集刷新了世界纪录，其中最高在 Market-1501 上的首位命中率（Rank-1 Accuracy）达到96.6%，让跨镜追踪技术（ReID）技术在准确率上首次达到商用水平。

打开APP阅读更多精彩内容