音视频及家电
(文章来源:百家号)
如果单独是因为口音问题,现在这么多在研究语音识别系统的公司,如果合作起来,只要资源共享,这应该不是个问题。那么,制约语音识别发展的最主要原因来了,各家公司语音识别系统的源数据并不共享。语音识别中最重要的就是对语音的采集和分析,这是项工作量非常庞大的内容,如果想要构建支持不同口音的语音识别系统,这一工作量还将呈几何倍数骤增。
所以,即使是对于苹果或亚马逊这样的超大型公司来说,也不可能支持无限语种的采集和分析。因此,各家研究语音识别系统的公司对源数据的保密控制堪称苛刻,想弄到其他公司的语音源数据也是根本不可能的。
除去口音问题和源数据不共享的问题,语音识别系统的分析能力和云计算能力也是严重制约语音发展的重要因素。当用户在使用语音系统时,设备端收集到语音,需要通过识别系统的云计算能力进行运算和分析。云计算能力和支持云计算的硬件、传输网络都不是一个非常好解决的问题,需要较长时间的积累不断完善优化。
很多人都觉得现在使用的语音识别系统并不好用,完全达不到我们想象中那种能够仅凭借语音就能实现所有操作,或者能够帮我们节约大量时间的程度。更多时候,我们会感觉面对的不适一个智能的语音识别系统,而是家中听不懂我们在说什么的宠物或者小孩子,需要我们放慢语气、用最标准的普通话、一遍一遍的和他们慢慢说。不过别着急,现在的语音识别系统还真就是个孩子,它正在以非常快的速度进步着,相信不久以后,真正好用的语音识别系统就会出现在我们身边。
全部0条评论
快来发表一下你的评论吧 !