解读谷歌语音助手的全面进化

电子说

1.2w人已加入

描述

想要了解谷歌智能语音助手Google Assistant的潜力,最好的方法之一就是看看其现在能多快地打开碧昂斯(Beyonce)的Instagram页面。谷歌项目经理梅吉·霍伦格(Meggie Hollenger)通过“Hey, Google”这个短语唤醒了其智能手机上的谷歌助手,然后开始了测试,连续快速地发出12个指令。

霍伦格的指令包括:“打开《纽约时报》、打开YouTube、打开Netflix、打开日历、设置5分钟的计时器、今天天气怎么样?明天呢?显示约翰·传奇(John Legend)的Twitter更新、显示碧昂斯的Instagram更新、打开手电筒、关掉手电筒、预定Uber网约车到我所在的酒店。”

伴随着霍伦格的每个指令,手机就会弹出相应新的信息,整个过程耗时41秒。她不需要在命令之间重复唤醒Google Assistant的短语。当她要求查看碧昂丝在做什么时,Google Assistant不仅会启动Instagram应用程序,还会自动把我们带到这位流行歌手的页面,这样你就能看到她与1.27亿粉丝分享的最新照片。同样地,当霍伦格要求使用Uber时,该软件已经知道她当前位置。

在谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)向世界推出其人工智能驱动的智能虚拟助理三年后,谷歌于美国当地时间周二的年度I/O开发者大会上预展了这款助理的“下一代升级”。GoogleAssistant现在可以比以前快10倍的速度提供答案。速度的大幅提升可能有助于扭转人们对语音助手过于迟缓和不准确的看法。如果像谷歌和亚马逊等公司想让这些数字助手进一步成为主流,这将是一件大事。

对于这家全球最大,每年提供超过1万亿次搜索答案的搜索服务公司来说,让Google Assistant获得成功至关重要。许多人不再通过在电脑上打字来查询信息,而是通过智能手机和智能音箱来交谈。谷歌现在正与亚马逊及其Alexa、苹果及其Siri展开竞争,以给我们带来我们越来越希望从始终连网设备中得到的即时满足。

为此,在年度I/O开发者大会几天前,谷歌邀请资深科技记者理查德·内瓦(Richard Nieva)前往其加州山景城(Mountain View)全球总部,首先浏览下其迄今为止对Google Assistant进行的最大升级,此举堪称“成败在此一搏”。升级后的GoogleAssistant很吸引人,但也有点儿吓人。

下一代数字助手成为谷歌推出诸多新功能中的焦点,这些功能展示了谷歌世界级的人工智能和工程能力。Google Assistant不仅速度更快,而且更加智能化,谷歌继续依靠过去五年在神经网络研究和语音识别方面取得的突破,将自己与竞争对手区分开来。

此外,GoogleAssistant越来越个人化。你将能够将家庭成员添加到亲密联系人列表中。例如,当你向Google Assistant问路想去你妈妈家的时候,它知道你妈妈是谁,住在哪里。去年推出的语音礼宾服务Duplex也有一个新功能,可以让Google Assistant在你口头提出租车或购买电影票等要求后,自动在网上填写表格。

Google Assistant产品副总裁曼努埃尔·布朗斯坦(Manuel Bronstein)表示:“我们可能会看到这样的全新世界,即与系统实际通话的速度要比打电话快得多。如果这种情况成为现实,或当这种情况发生时,你会看到更多的人参与进来。”

Google Assistant产品副总裁曼努埃尔·布朗斯坦希望让语音搜索比打电话更快

但所有这些都凸显出这样的事实,即谷歌已经拥有了全球数十亿人的海量数据。该公司还强调称需要收集更多的个人信息,才能将Google Assistant的真正愿景变为现实。目前,Google Assistant已在10亿部设备上被使用,主要是因为它预装在运行全球最流行移动操作系统安卓(Android)的手机上。

此外,谷歌的许多其他服务,比如Gmail、YouTube、地图和Chrome浏览器,每月也为超过10亿人提供服务。所有这些服务都是有用的和创新的,但它们的命脉是你每天通过搜索历史、电子邮件收件箱、视频浏览习惯和驾驶方向向该公司提供的数据。

当然,这一切都需要以GoogleAssistant真正发挥作用为前提。谷歌不允许内瓦及其同事亲自体验其语音助手,也不允许他们录制演示视频。相反,谷歌为他们提供了预先拍摄的营销视频。霍伦格还根据预先编写的命令备忘单读取脚本。因此,在手机和智能家居设备上执行普通人漫不经心的请求时,目前还无法知道这款软件的灵活性有多强。

值得注意的是,演示过程中也出现了一些错误。虽然从一个应用程序跳转到另一个应用程序非常快,但霍伦格不得不重复一两次查询,因为Google Assistant在第一次尝试时没有处理她的请求。不过,在其他演示中,霍伦格使用Google Assistant以极高的准确度口述文本和电子邮件。该系统还能分辨出她想要在电子邮件中写什么,以及什么是通用命令。例如,当她说“发送它”时,GoogleAssistant就会发送电子邮件,而不是在电子邮件正文中键入“发送它”这样的字眼儿。

不过,GoogleAssistant肯定会成为讨论的主题,或许还会引发争议。阿斯彭科技政策中心(Aspen Tech Policy Hub)主任贝琪·库珀(Betsy Cooper)表示:“这其中有积极的一面,也有消极的一面,还有利弊权衡。有了Google Assistant,因为它总是处于倾听状态(捕捉唤醒短语),它有可能会滥用这种特权。”

打造个性化谷歌

谷歌首席科学家弗兰西斯科·比菲斯(Francoise Beaufays)表示,新的Google Assistant是他们五年辛勤工作的硕果,这比该软件问世的时间还长。在这五年中,谷歌研究人员在人工智能音频、语音、语言识别和语音控制方面取得了关键进展。比菲斯称:“我们所做的是彻底改造整个堆栈,使用一个神经网络来做所有的事情。”

这是一项重大的技术突破,将所需的空间从100GB降低到不足0.5GB。不过,这款升级版的数字助手需要智能手机具备强大的计算能力,因此只能在高端设备上使用。谷歌将在其旗舰手机Pixel的下一个高端版本上推出这款产品,预计Pixel将于今年秋季推出。

在2016年5月推出Google Assistant的几天前,内瓦和皮查伊在他那间玻璃墙的办公室里坐了下来,聆听后者的推介。这家搜索巨头在数字语音助手领域已经落后多年,现在终于准备好与Siri和Alexa展开竞争。对于谷歌来说,Google Assistant就是要突破公司标志性的白色主页,把它的工程学智慧渗透到你所拥有的每一项技术中——手机、汽车甚至洗衣机中。

皮查伊当时称:“这是谷歌在问用户:‘嗨。我能帮什么忙?’把它想象成建立你自己的谷歌。”现在,皮查伊为Google Assistant开启了一个新阶段,包括了解你家庭具体细节的功能,且比以往任何时候都更清楚地表明,当他说“打造个性化谷歌”时,他是认真的。谷歌不会让皮查伊接受采访。

时代变化

当然,现在的世界与三年前大不相同。

首先,谷歌与亚马逊的竞争如今已经是一场全面竞争。市场研究公司eMarketer的数据显示,在智能音箱方面,亚马逊的Alexa Echo设备占据了近67%的市场份额,而由Google Assistant驱动的Google Home占比近30%。谷歌今天发布了Nest Hub Max,这是一款内置Google Assistant的10英寸智能显示屏。

然后是关于隐私和安全的公开辩论。在社交网络巨头Facebook的剑桥分析公司(Cambridge Analytica)滥用数据丑闻发生之后,立法者和消费者对大型科技公司的政策更加关注,并将数据收集问题推到了风口浪尖上。就在上个月,谷歌还因为其Sensorvault数据库而受到批评,该数据库可以根据谷歌对你个人信息的了解,帮助衡量其利润丰厚的定向广告的有效性。

事实证明,全美各地的警察部门在试图破解犯罪调查时,都曾利用Sensorvault获取位置数据。作为回应,美国众议院下属的一个委员会致信皮查伊,要求就数据库问题给出答案。议员们要求在5月10日前举行一次现场简报会。

谷歌首席科学家弗兰西斯科·比菲斯表示,新一代Google Assistant背后的研究可以追溯到5年前

上周,谷歌被问及:如果执法部门要求谷歌提供家庭关系数据和Google Assistant收集的其他信息时,谷歌会怎么做?Google Assistant产品副总裁布朗斯坦表示,谷歌在为广告目的存储数据方面一直存在“非常好的争论”。他说,公司的理念是“不要为了存储信息而存储信息,而是要为能带来价值而存储。我们希望所有这些事情都能保持透明,这样你就能知道什么时候这些信息被用来做广告,或者永远不会被用于广告。”

但隐私专家表示,谷歌应该更好地向消费者传达其政策。斯坦福大学互联网与社会中心消费者隐私主管珍·金(Jen King)说:“我不知道人们实际上对此理解得有多透彻。”她补充说,谷歌应该给人们更多的选择,让他们选择是否参与数据收集,而不是把事情混为一谈。

谷歌在如何处理透明度方面已经受到挑战。去年,美联社报道称,谷歌甚至在人们关掉智能手机上的位置共享功能后,仍能追踪他们的位置。这些数据是通过名为“位置历史”的谷歌地图功能存储的,这与Sensorvault数据库中的功能相同。美国公民自由联盟(ACLU)等批评人士表示,谷歌披露的信息并不诚实。该公司后来在其网站上修改了此前的帮助页面,以澄清设置是如何工作的。上周,谷歌宣布了一项功能,允许人们自动删除位置、网页和应用程序历史。

布朗斯坦还表示,如果用户在设置中允许的话,来自Google Assistant的“一小部分”语音查询将与谷歌的一个团队共享,该团队致力于改进人工智能系统。他没有提供任何关于“被分享语音记录有多小”的细节。但他说,在这些情况下,个人信息被从语音音频中剥离。

Duplex的演化

除了GoogleAssistant带来速度上的震撼外,谷歌还在更新去年引发最大争议的项目——Duplex。该功能使用听起来令人不安的人工智能软件,代表Google Assistant用户打电话进行服务预订和预约。它的人工智能可以模仿人类的语言,使用像“uh”和“um”这样的口头语。它说话的节奏就像真人一样,在回答问题前停顿一下,拉长某些单词发音,好像是在争取时间思考。

去年的演示立即为人工智能伦理学家、行业观察人士和消费者敲响了警钟,他们担心这款机器人具有欺骗人类的能力。谷歌后来表示,它将增加信息披露,这样人们就会知道他们在与自动软件对话。这次新的迭代要温和得多。

谷歌Duplex获得升级,增加了许多新功能

谷歌周二更新了Duplex功能,以简化租车和购买电影票等更多类型预订的流程。但这一次没有说话听起来像人类的机器人,它基本上自动完成了你在移动网络上可以找到的表单填写过程。你可以这样说:“Hey Google,下次旅程为我从National租车公司租辆车。”然后,Google Assistant会在你的手机上打开National的网站,开始实时填写这些字段。

在整个过程中,你将看到一个进度条,就像下载文件时看到的那样。当Duplex需要更多信息时,比如价格或座位选择,进程会暂停并提示你进行选择。填好表格后,点击确认预订或付款即可。与其他Google Assistant功能一样,该系统使用从日历、Gmail收件箱和Chrome自动填充(包括信用卡信息)中挑选的数据来填写表单。今年晚些时候,这一更新将在安卓手机上推出。

Google Assistant工程主管斯科特·霍夫曼(Scott Huffman)今年早些时候曾说过,尽管这一版本可能会造成较少的反冲,但去年广泛的争议对谷歌来说是一个关键时刻。他说:“人们的反应强度让我吃惊,这让我们清楚地看到,这些社会问题未来会有多么重要。”

Google Assistant也有其他的事情要处理。谷歌周二还推出了一款新的安卓手机“驾驶模式”。当你激活它时,用户界面会将一些你可能在开车时使用的项目放在前面和中间位置。这些功能包括谷歌地图、Waze导航导航、音乐控制以及来电提醒等。当你启动导航功能后,音乐或电话控制就会出现在屏幕的底部,这样你就不用摆弄手机来找它们了。

道路规则

总的来说,谷歌的新智能助手公告可能会对我们如何使用科技产品和服务产生重大影响。让语音命令变得更简单、快捷,可能会改变我们与设备的互动方式,就像十多年前以苹果iPhone为首的智能手机成为主流,并引发触摸屏时代到来一样。也许我们可以把这看作是迈向人类不断与无生命物体对话世界的第一步。

Google Assistant的“驾驶模式”突出导航和音乐功能

谷歌下一代GoogleAssistant还可以为培养语音查询的新习惯打下基础。去年,谷歌宣布了语音命令的“继续对话”功能,它可以在用户提出问题后将麦克风打开8秒钟,这样用户就可以继续提问。下一代Google Assistant已经基于这一概念改进,最终可能为摆脱唤醒短语开辟一条道路。

这种开放式麦克风可能会引发对隐私的担忧。布朗斯坦说,把麦克风打开一段时间是有帮助的(公司还在调整这段时间的长短),但他希望人们在说话时“能保持相关意识”。他说:“你不一定想让这个东西把你说的话都抄录下来,因为你会觉得不舒服。”

谷歌还有许多其他方式可以提升GoogleAssistant。霍夫曼今年早些时候曾说,他有兴趣让这款软件记住你昨天和它进行的一次确切讨论,这样今天你就可以从你们上次讨论的地方继续。他甚至希望Google Assistant能够检测你的情绪和语调。

不管这是否令人恐惧,这就是谷歌如何考虑改进Google Assistant的方式。不过,布朗斯坦表示,目前他的重点是让用户体验变得更加无缝,并在添加这些面向未来的功能之前弄清楚哪些功能对用户更有价值。

与此同时,人们将不得不解决大规模数据收集和比以往任何时候都要聪明的技术所带来的各种问题,谷歌知道这一点。正如霍夫曼早些时候所说的那样:“有了人工智能,我们最终会让社会思考一些道路规则。”

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分