如何构建自己的Amazon Echo或类似的东西

李慎梓 2022-08-24 971

今日头条

1193人已加入

描述

您通过口语与之交互的个人助理（例如亚马逊的 Alexa、苹果的 Siri 和 Google Home）的成功使语音控制成为系统设计中的热门项目。不过，开始使用这项技术需要大量的音频和信号处理专业知识来解决背景噪音和扬声器位置方面的问题。Microsemi 与亚马逊的 Alexa 语音服务 (AVS) 合作推出了一个新的开发套件，旨在简化启动过程，以便开发人员可以专注于应用程序而不是实施。

AcuEdge开发套件是开发语音激活系统的开发人员的起点，但不是开箱即用的系统。该套件包含一个基于Microsemi 的 ZL38063 Timberwolf 音频处理器的开发模块，该处理器预装了该公司的免许可AcuEdge音频处理软件。还有一个圆柱形安装框架来承载电子设备，看起来很像亚马逊 Echo 的骨架。但是，开发人员需要提供他们自己的Raspberry Pi 3或他们选择的类似处理器板，开发板安装在该处理器板上。开发人员还需要一个扬声器来传递来自 AVS 的音频。扬声器选择对开发人员开放，但框架尺寸适合JBL Clip便携式扬声器。

Amazon

图 1：Microsemi 的 AcuEdge Alexa 开发套件。

组装好硬件后，接下来需要的是开发人员的Amazon AVS帐户。但是，该帐户是免费的，并且在从技术培训到产品营销指南的所有方面都得到了亚马逊的大力支持。然后启动硬件，从 Microsemi 的github安装软件，启动 Alexa 服务，并开始与 Alexa 对话。

开发板包括两个麦克风，因此 AcuEdge 软件包中的回声消除和波束形成算法允许 180° 或 360° “聆听”用户语音。波束成形可以将用户定位到 20° 窗口，以帮助抑制来自外部源的噪声。该软件还能够支持全双工语音交互。除其他外，这种全双工允许系统主动消除其自己的输出音频的噪音，以便它可以更好地响应用户试图通过系统的响应进行交谈。

借助该套件，开发人员能够快速开始开发能够利用消费者对语音控制的快速增长兴趣的应用程序。据 Microsemi 称，语音系统市场预计在五年内每年将达到 7500 万台，其中三分之二是像 Echo 这样的数字助理。诸如照明系统、电器、机顶盒等应用形成了更大的语音激活功能市场。

Amazon

图 2：可能的语音激活架构。图片来源：Microsemi。

虽然该套件可作为设计语音激活系统的入口点，但它仅代表开发人员可以追求的三种潜在架构之一。该系统使用板载处理来识别唤醒词，然后将进一步的音频数据发送到基于云的 AVS 以处理随后的命令。另一种架构提供了更有限的内置单词识别功能，因此设备无需云连接即可响应命令。混合系统提供了第三种选择，使用云连接提供完整的语音功能，并以板载识别基本命令作为备份。Timberwolf 处理器可以用作任何这些架构的音频前端处理器。

　　审核编辑：汤梓红

打开APP阅读更多精彩内容