语音命令系统的低功耗解决方案一

描述

什么是始终在线的语音命令?

在始终在线的语音命令系统中,用户的语音使用特定的唤醒词(也称为触发词)激活或“唤醒”系统,以便它可以响应语音命令。用户不必按下按钮即可使系统处于活动状态;它总是在“听”唤醒词。这就是目前大多数“智能扬声器”的工作方式,如亚马逊Echo,苹果HomePod和谷歌家庭。

消费者非常喜欢始终在线的语音命令而不是按钮式语音命令,因为用户的手保持自由,并且用户不需要与设备进行物理交互。迄今为止,始终在线的系统主要在为家庭使用而设计的设备中实施,并由交流墙上插座供电。然而,最近的技术发展使得在由电池供电的便携式/移动产品中添加始终在线的语音命令成为可能。

电池

[图1|Ambiq 微型 MCU 在声音唤醒和关键字处理期间的功耗。

便携式产品中始终在线的语音命令应用

由于在便携式和电池供电产品中使用始终开启的语音命令的概念是新的,因此该技术的应用才刚刚开始出现。可能性包括:

耳戴式设备:始终开启的语音命令允许用户开始和停止播放音频节目材料;选择材料;跳过或重复音乐曲目;接听电话;并在耳机或头戴式耳机(通过蓝牙)连接到联网的智能手机时访问个人助理功能。由于无需按下按钮,因此用户的双手可以自由执行其他任务,使语音命令耳机成为运动/健身和办公室工作或入耳式个人助理的理想选择。

遥控器:大多数当前的语音命令遥控器要求用户在说出命令之前按下按钮以唤醒系统。许多要求用户将遥控器靠近他或她的嘴巴。始终在线的系统将允许用户在遥控器无法触及(甚至放错位置)时访问遥控器的功能。

智能家居设备:为墙上控制面板配备始终开启的语音命令将允许用户从语音范围内的任何地方控制家庭系统(HVAC,照明,安全等),而不必走到面板上或拉出智能手机并调用必要的控制应用程序。这还可以通过消除对昂贵触摸屏的需求来降低成本。电池电源在这些产品中是可取的,因为它消除了雇用电工来运行专用电源线的需要,并且它为更广泛的智能家居产品(例如自动打开的垃圾桶以及语音控制的窗帘和窗帘)打开了语音命令。

汽车:始终开启的语音命令使驾驶员不必对当前大多数汽车语音命令系统中使用的唤醒按钮进行感觉,从而可能提供更安全的车辆操作。它还允许其他车辆乘员访问系统,从而触发远程操作后舱口等功能。

可穿戴设备:始终在线的语音命令系统可以使许多类型的可穿戴设备受益。在健身追踪器或衣领安装的设备中,始终开启的语音命令将允许用户在跑步或行走时控制设备,而不必摸索控制。语音命令特别实用的是较小的产品,它们可能没有空间容纳一个相当大的显示和控制按钮。小型可穿戴设备可以用作夹式个人助理,也可以用作与智能扬声器或其他超出语音范围的设备的接口。数据可以通过蓝牙传输到联机电话,或通过WiFi传输到本地网络。

便携式产品中始终在线的语音命令面临的挑战

到目前为止,语音命令尚未在许多便携式和电池供电产品中实施,原因有很多。挑战是巨大的。

功耗:为了使语音命令系统能够随时接收命令,它必须始终处于活动状态。对于插入交流电源的智能扬声器来说,这不是问题,但对于电池供电的产品来说,这可能是一个大问题 - 特别是当电池运行时间是购买便携式技术产品的消费者的主要关注点之一时,并且工程师必须经常最小化电池尺寸以保持紧凑的外形尺寸。

在语音命令系统中,至少一个麦克风必须始终处于活动状态,并且负责识别唤醒词的处理器也必须处于活动状态。在较大的系统中,其中一些功能可能与专用组件隔离,从而允许在设备空转时关闭设备的大多数其他组件的电源。较小的便携式产品往往依赖于片上系统(SoC),其中单个组件执行几乎所有设备的功能,因此可能很少有或没有可以关闭的非活动组件。

电池寿命预期:如上所述,电池寿命通常是技术消费者的主要关注点。大多数人希望产品至少可以使用一整天(8小时),而无需充电或更换电池。大多数活动耳机和入耳式耳机现在运行18至20小时;即使是便宜的型号通常也可以管理10个小时。虽然一些最新的可穿戴设备,如“真无线”耳机和夹式无线扬声器,电池运行时间在5小时范围内,但制造商面临着来自消费者和评论家的压力,要求提高这种性能。

在用作控制接口的语音命令产品中,挑战甚至更大。消费者目前预计遥控器中的电池可以使用6个月到一年;即使是带有可充电电池和充电底座的遥控器也需要至少持续几周的充电时间,因为遥控器通常会留在沙发上,而不是返回到充电底座。智能家居系统的壁挂式控制面板往往在一组AA或AAA电池上运行约一年(甚至两年);期望消费者经常更换这些电池是不现实的,在墙上控制面板中使用可充电电池也是不切实际的。

可疑的互联网连接:虽然家庭产品可以依赖于几乎总是存在的互联网连接,允许大多数语音识别处理卸载到外部服务器,但便携式产品不能。大多数此类产品需要通过低功耗蓝牙连接到智能手机以实现互联网连接,并且在许多地方,蜂窝数据连接不可靠甚至不可能。

由于便携式应用中 Internet 连接的不可靠性,使用语音命令的便携式产品必须在没有外部服务器帮助的情况下自行识别和处理少量语音命令。这一要求需要更强大的处理,同时也限制了可以通过语音命令控制的功能。

外形:大多数便携式产品的紧凑尺寸可能要求在阵列中使用的麦克风数量方面做出妥协,并且还可能迫使工程师以损害其性能的方式放置麦克风,并使多个麦克风的响应和灵敏度的精确匹配变得困难或不可能。

可穿戴设备和其他紧凑型便携式产品的外形尺寸也迫使产品设计人员选择更小的电池,这些电池的功耗更低。例如,典型的AA碱性电池可能提供3000毫安时(mAH)的功率,而许多微型科技产品中使用的CR2032锂“纽扣电池”仅提供220 mAH的功率。这意味着,当由CR2032供电时,绘制10 mA(或10,000 μA)的产品将运行22小时。

环境因素:便携式产品暴露在比家用产品更具挑战性的环境中。可穿戴产品必须至少防汗(要求入口防护等级为IPx5),并且用于恶劣户外使用的便携式产品应完全浸入(IPx7等级)。达到这些额定值所需的密封件可能会损害麦克风的功能,并对麦克风阵列的配置施加限制。

审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分