将语音识别添加到电视遥控器

描述

  语音控制在消费电子产品中很受欢迎。添加带有“唤醒词”是不可能的,并且不会过快地耗尽电池电量。

  虚拟助手继续集成到我们家中的更多设备中。亚马逊将Alexa引入各种新设备,包括耳塞,眼镜和戒指,为消费者提供更多获取信息的方式。这些新的语音产品反复出现的主题是它们是无线和免提的。该设备可轻松连接到您的手机或其他主机,并耐心地聆听要说出的命令。引擎盖下的技术是蓝牙RF芯片组,支持无线连接和运行唤醒词引擎(WWE)以识别语音命令的专用嵌入式处理器。

  这种趋势的另一个例子是糖果棒形遥控器,每个新的平板电视,机顶盒和媒体播放器都附带。它们也将很快完全无线和免提。当然,当您想要语音控制时,许多人仍然会支持旧的红外视线模式和“一键通”按钮,但这些很快就会过时。用户想要一个无缝响应其命令的设备,而不是像对讲机那样必须使用的设备。与亚马逊小工具浪潮类似,下一代电视遥控器将是无线和免提的。

  然而,远程控制设计带来了一些独特的挑战。例如,遥控器通常不可充电;它们通常使用标准AA电池运行。遥控器不仅需要在嘈杂的环境中表现良好,而且还需要在距离您身体3至9英尺的地方立即将信息无线传输到主机设备(如电视)。

  此外,消费者更喜欢耐用的电池,这些电池在设备的使用寿命内不需要更换。毫不奇怪,设备制造商接到的客户支持电话的很大一部分可以通过更换电池来解决。消费者拨打的每个电话都会使公司花费30至50美元,具体取决于通话持续多长时间。从本质上讲,遥控器必须像墙壁供电的亚马逊Echo Dot一样运行,同时也比入耳式耳机更节能。

  设计功能强大、高能效遥控器的这一挑战需要创新的蓝牙解决方案和音频处理解决方案,因为它们中的一个或两个都有助于电池寿命。

  与传统 IR 相比,使用蓝牙 5.0/LE 可解决几个问题。首先,蓝牙是一种符合标准的解决方案,因此设备可以轻松地与现有蓝牙设备的大型基础架构进行通信。此外,蓝牙 5.0/LE 提供与 WiFi 设备相当的范围。这非常适合支持语音的遥控器。传统的蓝牙解决方案已经针对手机和笔记本电脑进行了优化,这些手机和笔记本电脑往往具有较大的电池,并且蓝牙功耗并不那么显着。

  这两个问题 - 更大的电池和功耗 - 不能很好地转化为遥控器等端点设备。像Atmosic这样的公司通过创建一个专注于消费者终端设备(如遥控器)的全新解决方案,对整体解决方案设计进行了创新。这种设计显著降低了有功功率(约5倍),因此,与竞争解决方案相比,电池寿命延长了3倍至5倍。

  除了极低功耗的蓝牙设计外,还可以使用消耗明显更少的功率(比标准接收器低20到50倍)的辅助唤醒接收器,使整个蓝牙SoC进入深度睡眠状态。设备可以通过来自另一个主机的特殊模式唤醒。我们不会在这里详细介绍这项技术,因为这与少量的专用遥控器有关。

  第三种技术是利用能量收集(嵌入到蓝牙 SoC 中)来收集射频无线能量,以延长电池寿命。许多家庭和建筑物都具有显著的RF能量(通常在ISM频段),当遥控器放在桌子上时,可以收集这些能量。根据能量水平,设备可以收集数十微瓦到1 mW的能量。目标是尽可能替代电池电源,并将电池的使用寿命延长到几年,而目前的寿命为六到九个月。对于工业和特殊用途的遥控器,也可以使用其他能源技术,如照片(太阳能),热能和运动能量收集。

  如前所述,要实现真正的免提操作,遥控器必须同时像智能扬声器一样运行,同时又要像入耳式耳机设备一样节能。像QuickLogic这样的公司已经创建了高度优化的超低功耗配套设备,以与蓝牙芯片组配合使用,以应对这一挑战。

  具有蓝牙连接的语音遥控器基本上有三种模式:待机、唤醒词检测和数据传输模式。每种方法都使用逐渐升高的能量模式。

  在待机模式下,蓝牙和配套芯片处于睡眠状态,等待周围环境中的一些噪音来唤醒它们。实现这一点的最节能方法之一是使用Vesper的麦克风声音唤醒功能,该功能仅消耗10 μA,等待环境噪声超过预配置的阈值dB SPL(声压级)。在典型的客厅用例中,系统可以在多达80%的时间内处于这种模式。

  一旦达到阈值水平,就会从麦克风发出中断,并唤醒配套芯片;这是进入唤醒词检测模式的时间。配套芯片的MCU可以启动并在确定的时间段内运行WWE,以检测关键字是否已被说出。第三方解决方案,如Retune DSP的VoiceSpot WWE可以在Cortex-M4上运行,仅使用一个麦克风,并且不需要具有多麦克风自适应波束形成的计算密集型解决方案,这通常是中场(3至9英尺)语音识别所必需的。

  除了明显的 MIPS 节省外,从系统中移除的每个麦克风还节省了 400 至 650 μA(有功功率)。如果检测到唤醒字,则它会中断并唤醒蓝牙芯片以进入数据传输模式。这是必要的,因为唤醒词之后的用户单词需要以脉冲编码调制(PCM)或压缩数据的形式传输到主机(TV)。

  如果未检测到唤醒字,系统将恢复到初始待机模式。一些配套芯片(如 QuickLogic 的芯片)具有专用的低功耗声音检测 (LPSD) 硬件,可降低唤醒词检测模式下使用的平均系统功耗。例如,有些声音像风扇有很高的dB SPL,但显然不是语音。LPSD硬件有足够的智能来感知这一点,并忽略声音,以避免不必要的运行WWE的额外功耗。

  蓝牙 5.0/LE 非常适合数据传输模式,因为它可以在低功耗按需数据包中传输数据。理想的伴侣应具有足够的内存空间和处理能力,以便在将语音数据发送到蓝牙设备之前对其进行压缩。一个典型的例子是运行配置为复杂度设置为 4 的 Opus 编码器。

  审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分