人机交互趋势预测:语音识别+声纹识别+NLP,让设备识你懂你

描述

日前,微软研究院对其2019年的研究进行了全方位盘点,“人机交互”赫然纸上。

自从人类发明了计算机,就持续面临着一个根本性问题:我们到底应该如何与机器交互?抛开具体交互形式,显然人机交互经历了一个从人适应机器,到机器适应人的过程。就目前来说,看待人机交互最终趋势的的根本视角,应当从人更渴望什么来分析。

用户期望的人机交互该具有哪些特点?

随着人工智能技术的发展,自然语言交互必定是实现“命令自然化”的关键突破口。语言声学技术为人机交互注入了智能属性,交互不再是精确的“指令”。

在上世纪出现Google、百度等搜索引擎的时候,交互还是单向的,但出现智能手机之后我们的交互变成了双向。比如苹果的交互史,在刚开始做出来第一代iPhone的时候并没有语音交互的能力,但经过市场调研之后发现有75%的用户都希望有语音控制。于是,在后面两代iPhone加入了语音控制,但到后面发现实际使用的用户竟然不到5%,苹果经过总结之后发现不仅仅是语音,还必须有自然语言交互。

研究公司Ovum报告称,人机交互技术进步,更趋向人类自然对话体验。正如我们对自然语言处理技术的应用场景的想象,关键在于足够自然,人工智能永远都在追赶最高的自然智能。

信息文明走向智能文明 ,机器需适应人类的自然语言体系,然后完成任务。

从使用场景想象,看人机交互未来发展趋势

技术的发展虽然革新了我们的生活方式,但是长久以来,人机交互一直延续着人类“输入”,机器“反馈”的循环模式,人类始终是主动的,机器始终是被动的。《百度人机交互研究报告》认为,人工智能赋予了机器情境感知和自主认知能力,使我们有机会构建机器主动服务于人的交互模型。

由此,我们可以预测人机交互的发展趋势,主要体现在:

交互理念方面,机器从被动接受信息到主动理解信息,以及从满足基本功能到强调用户体验;

交互设备方面,机器输入、输出的方式更加自然化、内容多样化。

显然,这些也是人机交互现阶段所面临的的痛点问题。

语音识别+声纹识别+NLP:破除人机交互智能化障碍

以智能音箱为例,需要其不再是基于几个关键词来反馈结果,而是能够理解用户的语言指令,完成一项完整的任务。

一方面,语音交互将使智能音箱跳出了传统的“命令式交互系统”,你可以说“为我播放一首爵士乐”、“为我查一下明天的天气”等这类不再精确的指令。机器拥有理解人类语言、分析语言意图,进行更多的决策的可能。

另一方面,语音技术的进展使得我们可以远距离控制设备。在移动互联网时代,用户需要更为方便自然的人机交互方式。当互联网从个人电脑向移动终端迁移,人们在走路、开车、吃饭时都可以通过互联网获取信息、完成任务,语音交互的非接触性,解放了双手,成为了快捷方便的方式。

“万物互联”时代下的人机交互:以用户为中心,使产品主动为受众的提供服务

随着5G的发展和互联网技术的不断成熟,人类已经进入到了一个万物互联的“大连接”时代,“大连接”的目的是为了让人类的生活更加美好,更加便利。

设备被赋予的大量连接,连接为交互建立了通道。交互通道建立后的下一步,是用人工智能技术为“大连接”时代赋能。

语音交互远距离控制的特性,极大地增加了可交互设备的数量,有利于智能设备的快速普及。

在未来全面智能化、万物互联的生活中,真实使用场景总是有多个声源和环境噪声叠加,比如经常会出现周边噪声干扰和多人同时说话的场景。

想象一下,如果所有的智能设备都在同一时间点被触发,“随意”的为用户展示信息,身处其中的大家可能会立刻疯掉。这时候,用声纹识别技术让智能设备可以识别“主人身份”就显得格外重要(语音识别是识别你说的话,而声纹识别是指识别说话的人是谁)。未来更多的智能设备上面将配有声纹识别,更将大大的提高设备的安全性。

让智能设备认识你,听懂你

以前的语音交互大多是以服务为主,以产品为核心,根据产品特性寻找用户。

随着人工智能技术的进一步发展,声纹识别等智能生物识别技术已经可以实现以用户为中心的智能交互解决方案。国内声纹识别和自然语言处理技术厂商快商通表示:通过远场声纹识别技术,可以让智能设备能够自然快速识别用户身份,从而时刻感知用户需求的本质来源,记忆用户行为习惯和各类偏好。通过自然语言交互,分析用户语言背后的真实意图,并随之快速作出合理的反应,并能在之后的生活中不断地进行调整。

快商通原创的语音与声学处理技术能够保证机器能够听得准真实环境下人的声音,使智能设备在充满噪声干扰和多人同时说话的场景中,仍然能保持95%以上的识别准确率,同时处理多人声纹身份识别的问题。

智能设备们除了能只被特定成员唤醒外,还能根据不同成员的习惯和喜好进行个性化推荐。唯有你能在你的整个智能生活的中心随心所欲。

目前,声纹识别技术在快商通等声纹识别厂商的带领下,已经可以为大量终端设备厂商提供优质的远场声纹识别与语义理解技术支持。用户可在不同场景下通过远场语音交互。进行自然语言交互,享受科技给生活带来的便利。未来,将携手人工智能生态链上下游合作伙伴,持续推进更自然、更智能、更人性化的人机交互发展,让人工智能更好的服务人类。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分