从语音识别发展到语义识别还需要突破多少困难

独爱72H 2019-10-23 2663

音视频及家电

745人已加入

描述

（文章来源：晓芯智能语音）
语音识别作为打造良好交互体验的重要前提，今年的发展可谓是持续火爆。在智能音箱市场，令人首先想到的就是Amazon的Echo。Echo作为将自然语音转化为在线指令的设备，其效率之高毋庸置疑，并且可保持在线的自然环境中的自然语言识别。

而国内语音识别领域也开始争夺大战。以科大讯飞听见系列产品为例，自2015年发布以来，总用户突破1000万，应用于30余个行业。目前，已经形成了以听见智能会议系统、讯（询）问笔录系统、听见转写网站、录音宝APP、听见智能会议服务等以智能语音转写技术为核心的产品和服务体系。

晓芯电话机器人就是基于语音识别技术的一种应用产品。晓芯智能以服务低端劳力密集型企业为宗旨，帮助企业突破人工客服效率低、工作时间长的瓶颈，从而帮助企业扩大规模和提升业绩。

我们所期望的语音识别实质上是人机交互，大致上可以理解为人与机器之间无障碍沟通。在通信侧音源质量限制的情况下，晓芯机器人在对音源质量通过算法进行智能降噪以及通信侧持续优化之后，仍然能以80%的识别率达到行业领先的水准。但即便是达到100%也还是没有实现真正的人机交互

而我们晓芯电话机器人有很多的客户都问我们能不能达到语义识别？

目前来说确实不能，要从语音识别成功转变成真正意义上的语义识别，在智能电话客服的技术实现上依旧存在难点，大量的多音字和同音词是干扰机器人识别精准度的的主要障碍。首先要获得大量的数据，用这些数据不断训练，来提高识别的准确率。这一步的跨越还存在多种难关要攻克。就目前的市场分析来看，语义识别只是慢慢渗透到我们的生活中，还没有成熟的在行业中应用自如。随着技术不断地成熟，晓芯智能也必定会将语义识别技术融合进晓芯电话机器人。

语义识别的三个层次，1、应用层：包括行业应用和智能语音交互系统，2、NLP技术层：包括以语言学、计算机语言等学科为背景的，对自然语言进行词语解析、信息抽取、时间因果、情绪判断等等技术处理，最终达到让计算机“懂”人类的语言的自然语言认知，以及吧计算机数据转化为自然语言的生成。3、底层数据层：词典、数据集、语料库、知识图谱，以及外部世界常识性知识等都是予以是被算法木星的基础。

语义识别技术可以分析网页、文件、邮件、音频、论坛、社交媒体中的大亮数据，应用领域广泛，既可以直接应用与医疗、教育、金融等行业。也可以通过技术接口应用于所有智能语音交互场景，如智能家居、车载语音、可穿戴设备、VR、机器人等，从交互的方式上，也可以分为：事实问答、知识检索、分类问题等。智能语音交互被看做未来人工智能技术中最值得期待的应用场景。

人工智能作为国家战略发展规划之一，足见其重要性。在这个政策的驱动下，各种资源包括国家型自然科学基金、产业基金、地方政府财税优惠政策、人工智能相关实验室、科技产业园区等切实促进人工智能的发展落地，为自动驾驶、计算机视觉、语音/语义识别创业提供了更好的条件和基础设施。

打开APP阅读更多精彩内容