腾讯云小微AI语音技术探索和落地应用

jf_f8pIz0xS 2020-07-20 1453

人工智能

636人已加入

描述

随着科学技术的发展，自动化技术将机械控制演化为信号控制，使工业生产和日常生活更加方便、高效。

与此同时，人工智能开始代替人手做一些工作。例如，人工智能语音助手接收语音信号，分析和识别数据，并响应人工指令来完成指定的操作。

人工智能技术的每一次创新都会给社会生活带来深刻的变化。从进入千家万户的智能扬声器到伴随日常出行的智能汽车，面对数字升级和消费转型，我们能期待什么样的人工智能技术在未来开启智能生活？

在刚刚结束的腾讯科技开放日、腾讯云小人工智能语音专场上，腾讯智能平台产品部的人工智能语音专家在语音识别、自然语言理解、智能对话机器人等行业应用探索领域带来了精彩的分享。从腾讯云小人工智能语音助手的角度，展示了人工智能语音助手在技术和应用领域的探索和最新成果。

云端协调，软件和硬件集成，创建一个强大的车辆语音识别系统

正如在直播中提到的，就建立一个健壮的车辆语音识别系统而言，人工智能首先要解决的问题是数据分析和识别。只有通过收集各行各业的宝贵经验并建立数据库，然后通过计算机自动识别知识并进行分析，我们才能从数亿个数据中剥离出来，找到与用户使用场景相匹配的正确反馈。

然而，在实际应用环境中，如汽车使用，车辆语音识别面临许多挑战。在语音识别过程中，将人的语音信号转换成文字或指令，用户口音、环境噪声、大量兴趣点和场景语音都构成影响识别系统决策的变量，尤其是测试语音识别系统的基本稳定性。

因此，腾讯云微人工智能语音助手在接收到信号后，通过声学前端处理辨别出丰富的语音信息，并将其分发给本地语音识别、云语音识别和云协调机制进行准确识别，提供更加准确的技术解决方案。

语音技术

以常见的环境噪声处理为例，当用户的语音信号发出时，在道路噪声、风噪声、空调和音频等不同噪声类型的干扰下，很容易造成车辆语音识别的理解偏差。腾讯云微人工智能语音助手，从车内语音交互的场景出发，通过腾讯自己的技术和硬件设备完成回声消除、噪声抑制、定位和拾音，确保获得干净的语音信号。同时，在声学模型层面从训练数据、特征提取、网络结构等方面进行有针对性的优化，提高识别系统对噪声的鲁棒性。

语音技术

在基本功能方面，得益于腾讯云的祝福和自主开发的全堆栈人工智能技术，融合了前端降噪、语音识别、语义理解、语音合成和图像识别等功能，可以提供从云到端的完整人工智能解决方案。

在现场直播中，我们还看到了当不同用户输入不同口音的声音时，腾讯云的小型人工智能语音助手如何给出准确的反馈。腾讯云的小型人工智能语音助手的健壮性来自于两种容错性最小的处理方案，一种是基于迁移学习的区域模型方案，另一种是带有区域向量的单一模型方案。在这样一个智能车载语音识别系统下，腾讯云微人工智能语音助手和腾讯车练台已经与国内多家主流汽车公司和热销车型进行了合作。借助腾讯云端微型车语音识别系统，他们不怕用户口音，准确识别语音指令，满足车内互动场景的语音需求。

语音技术

实现深度学习的自然语义理解，在理解的基础上创造人机交互

自然语义理解是人机自然对话的核心技术基础。如何发出阿西的声音

在技术开放日，我们深入讨论了这种人工智能技术如何实现深度学习。人工智能技术是基于对数据的逻辑分析，在一定程度上可以实现自主学习。然而，与人类的情感需求和精神状态相比，智能人工智能语音助手很难理解主人的“心”。因此，具有理解能力的人机交互成为技术研究的重点。

根据腾讯科技开放日腾讯云微直播的演示，腾讯云微人工智能语音助手已经发展成为一个高质量、低延时的语音合成和智能语音交互系统的个性化服务。

语音技术

在物联网时代，语义理解已经成为语音交互的核心。通过声学前端处理，减少了干扰信号，抑制了回声，提高了语音识别效果和语音唤醒效果。然后，将这些词转换成命令词，通过语料库模型进行匹配，并在现场分发。在此过程中，腾讯云微人工智能语音助手支持自然语音识别、语义理解和自由语音指令，系统能够很好地理解和执行。同时，文本被转换成语言流，并且在终端设备上执行语音广播。

语音技术

以智能语音交互系统为例，腾讯云微人工智能语音助手向我们展示了智能车联网模式下人与车之间愉悦的交互体验。高效自然的语音输入模式，输入速度远远高于手动输入；安全驾驶释放手，切换导航和改变歌曲，而不会分散注意力；更重要的是，腾讯云的人工智能语音助手可以读取车主语音中包含的丰富信息，如语气、情感等，从而做出正确的判断，节省驾驶时的担心和精力。

高质量、低延迟的语音合成向我们展示了智能语音系统的深层学习能力。将自然语言理解发展为基于互联网的自然人机交互模式，意味着基于自然语言理解技术重塑人机交互模式，使自然语言成为人机交互的自然界面。通过腾讯云的小人工智能语音助手的语音合成能力，支持纯中文、纯英文和中英文混搭合成场景，提供50种不同的男女音颜色，个性化的音调定制能力，以及国王大吉和李白的荣耀定制语音包；采用业界领先的算法优化不同场景的声音音色，使人工智能语音助手听起来更加自然。

语音技术

这是因为腾讯云的小型人工智能语音助手使用一种专门为机器设计的语言来“告诉”机器。当用户发出语音命令时，机器通过深入学习掌握命令的真实意图并执行，从而达到机器说话脱口秀的效果。如何使机器声音高保真，节奏更加自然连贯？腾讯云微人工智能语音助手给出的答案是神经网络语音合成系统，该系统在整体架构中采用了序列建模的声学模型和神经网络声码器。通过升级由GAN优化的并行波网、韦弗恩和费瑟波等技术，可以获得高质量和高稳定性的自然人声。

客户服务机器人的功能设计与实现，开放能力降低企业智能成本

如何通过人工智能语音助手帮助企业用户实现业务？从客户服务机器人的访问和实现的角度出发，指出获取能力的途径之一是开发人员通过标准协议、开户、商业转型和推荐操作，在开放的技能平台上定制解决方案，构建从开发人员到用户的语音服务路径，使开发人员能够以最小的成本访问客户服务机器人，实现个性化和准确的服务效果最大化，并在服务咨询阶段引入客户服务机器人功能，可以节省前端客户服务人力，提高服务运营效率。

在腾讯云微人工智能语音特别会议上，我们了解到腾讯云微技能开放平台是唯一支持小程序访问的人工智能行业解决方案。目前，它已经开通了与京东的合作和公开评论，用户的语音指令可以操作购物和

腾讯云微人工智能语音助手以自身技术为切入点，在客服机器人的实现和接入方面构建了一个完整的工程闭环。面对非结构化环境下客户服务机器人未知状态（动态）、环境感知、环境交互和环境功能的需求，在功能设计和实现层，根据智能环境系统设计，提供客户服务配置、客户服务使用、问题发现和问题解决等手段来完成任务需求。

在客户服务配置方面，腾讯云微人工智能语音助手将文本模式分为知识库检索、服务前和服务后模式，检索为功能性检索。在服务前后，可以根据问题回答策略改变手动模式。其中，分层模块注重知识库的建立，分工明确，流程简单。

语音技术

在客户服务的使用中，采用多线程和人机合作来区分普通的聊天机器人，并依靠系统功能事件指令的智能交互来形成更加准确和人性化的索引推荐。

当然，客服机器人也需要加强培训。挖掘算法和索引堆叠不能解决问题，但更需要清晰的系统规则和流程。为了发现和解决问题，实现人和机器人之间的交互是很重要的。在线客服、模型算法、统计监控和配置平台都是必不可少的。例如，从手动服务界面参考客户服务机器人的索引，然后给出服务的明确答案。只有快速迭代和优化的深度学习才能满足数字时代业务发展的需要。

语音技术

在客服机器人的接入中，应用门户包括电子商务平台网站、WAP平台、微信小程序门户、内部客服助理、语音交互模式等。实现形式基本上是在线模式，网络聊天模式通过即时通讯、微信小程序、应用门户等实现。

在自然语言处理技术方面，我们主要分享了腾讯云肖伟的两项前沿技术：1）2019年法学研究杯阅读理解巡回赛冠军采用的方案；2）在国际人工智能会议IJCAI-2020上发表的关于信息抽取的最新论文。通过直播，我们看到了腾讯云肖伟在知识抽取和问答领域的技术积累，并以丰富的案例图像生动地展示了相关技术在实际应用中的作用。

语音技术

不仅如此，我们还可以从腾讯云的小人工智能语音助手强大的开放能力中找到更多的应用和探索，比如为企业定制品牌知识产权形象。我无法想象这在过去。在5G和直播网点，虚拟人以其安全性、可控性和高效性成为许多企业热衷的对象。腾讯云微语音助手提供的智能语音交互，可以根据不同的硬件终端和应用场景，触发丰富的表情动作，快速变换图像。由于腾讯云的小型人工智能语音助手的全双工交互功能、高智能、无唤醒和主动对话引导，以及腾讯的正版知识产权授权服务，人工智能语音助手的商业实现价值具有广阔的市场机遇。

打开APP阅读更多精彩内容