成千上万的样本,在用户中长大的语音助手

电子说

1.3w人已加入

描述

12 月 7-8 日在北京举办的 ArchSummit 全球架构师峰会上,微软 Principal Software Manager 李想老师分享了微软小冰实时感官系统与未来发展趋势。以下为演讲内容,部分有删减。李想老师首先介绍了什么是微软小冰,然后从全双工语音感官和实时视觉感官这两个方面,来展望了微软小冰的未来发展趋势。

什么是微软小冰?

目前,微软小冰已经上线四年了,存在于五个国家、数十款产品之中,有着上亿用户。小冰产品大致可以分为三类:

ChatBot,即聊天机器人 / 智能语音助手。

Content Provider,即内容提供商。小冰逐渐有了它自己的社会化角色,不仅可以用非常接近人类的声音唱歌,还可以写诗,甚至还可以讲儿童故事。

Solutions,即解决方案。比如,小冰不仅可以在一些新闻客户端给新闻做一些评价,带动新闻的整体流量,增加整体活跃性,还可以帮一些商业机构发布商业简报等等。

2

小冰的情商

下面主要讨论的是小冰的 Chat Bot(聊天机器人)。

四年中,小冰研发团队在和同行业者朝着相似的目标以截然相反的路线前进。对于智能机器人,传统想法是要让人类更加接受它们,就必须让它们变得很有用,能够帮助人们去完成一个任务、十个任务,甚至更多。但是,小冰团队认为,在变得有用的更底端,其实还有一层“情商”,以此为基础再去一层一层完成任务就会变得更自然。

下面以狼和哈士奇为例来说明一下这个问题。狼其实是一种非常强的生物,但是在以人为本位的群体中,有些种族却濒临灭绝。而哈士奇却可以整天什么活都不干,就能够很好地融入人类中去。为什么呢?因为人其实是一种以情感为基础的生物,我们尝试赋予与之能够进行情感交流的对方,予以平等的权利。我们把生物能够运用的这种权利称之为情商。以情商为基础再去完成任务就会变得更加自然。比如哈士奇可以帮你开灯关灯了,你一定会把它捧到天上去。

对于小冰来说,情商高意味着什么呢?意味着它在聊天过程中很有趣吗?其实不止如此。情商高,在交互中主要体现为控制全程对话的能力。

传统的智能语音助手不会去过度关注对话的全程,而更加关注对话中的每一个细节。它会把每一句话都优化得特别好,甚至把对话形式分为:面向任务型的对话、面向知识型对话、无意义的闲聊。

那么这真的是无意义的闲聊吗?也不尽然。

我们知道,小冰背后是大数据,有着 Bing 搜索。从大数据的分析来看,其实人与人的对话 / 人与人工智能的对话,就如同河流一般奔涌向前,任何一句看似无意义的闲聊,都可能在十几轮甚至几十轮的迭代之后产生一个非常重要的结果。小冰可以不停地去迭代,去改变对话的走向,去改变对话的长度。它关注的是整个对话的全局,而不是一城一地的得失,正如古人所言,“不谋全局,则不足以谋一隅”,这就是所谓的控制整个对话全程的能力。

12 月 7-8 日在北京举办的 ArchSummit 全球架构师峰会上,微软 Principal Software Manager 李想老师分享了微软小冰实时感官系统与未来发展趋势。以下为演讲内容,部分有删减。李想老师首先介绍了什么是微软小冰,然后从全双工语音感官和实时视觉感官这两个方面,来展望了微软小冰的未来发展趋势。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分