为语音控制应用选择合适的MEMS麦克风

陈超 2022-08-23 1764

今日头条

1194人已加入

描述

几十年来，研究人员一直在努力让计算机能够理解人类语音，它终于为黄金时间做好了准备。随着 Apple 的 Siri、Amazon Echo 和 Google Home 等个人语音助手的出现，电子系统的语音控制现在已成为必备功能。从合适的麦克风入手是在此类设计中实现最佳性能的关键。

语音控制设备的首选技术是微机电系统 (MEMS) 麦克风。由于许多原因，它们基本上取代了旧的驻极体电容麦克风。一方面，MEMS 麦克风很小——只有 2.5 x 1.6 x 0.9 mm。然而，更重要的是，它们可以提供不会随时间漂移的稳定性能，并且可以具有更好的相位匹配以实现精确的波束成形。

MEMS 麦克风通过电容工作。硅的微加工产生了一个以柔性板为一壁的声学室，压力波（声音）可以移动该板。板和腔室其余部分之间不断变化的电容会产生代表声音的电信号。存在两种类型的 MEMS 麦克风。模拟麦克风与其较大的同类麦克风一样，只是提供传感器信号——可能经过调节或过滤，但基本上没有改变。因此，如果要在机器语音识别中使用模拟麦克风，则需要使用外部 ADC。数字麦克风包括 ADC 和其他板载数字元件，用于将传感器信号转换为数字数据流，通常是脉冲密度调制的。

麦克风

图 1：MEMS 麦克风本质上是一个可变电容器，通过对声学室中的可移动硅板进行微加工制成。（来源：意法半导体）

MEMS 麦克风技术首先在移动设备和笔记本电脑中得到采用，这些应用仍在推动市场发展。大多数设备都有多个麦克风，它们位于靠近底部的位置，用于拾取电话声音，靠近相机镜头，用于拾取视频声音。然而，这些麦克风旨在捕捉声音以供人类聆听，这为设计人员在应用数据压缩和其他过滤算法时提供了相当大的自由度。然而，对于机器收听，音频处理需求是不同的。

在评估用于语音控制的 MEMS 麦克风之前，开发人员首先需要决定如何使用该系统。例如，电池供电的手持设备（例如遥控器）可能总是放在说话者的嘴边。因此，该设计可能只需要一个麦克风，而信噪比 (SNR) 等声学参数可能不像功耗那么重要。但是在像 Amazon Echo 这样的设备中，它必须可靠地理解在嘈杂环境中从几米外传来的声音，关键参数将是 SNL（它确定可靠地感知到的最柔和的声音）和声学过载点 (AOP)，它是传感器在不饱和的情况下可以处理的最大声压级 (SPL)。

第二个前期考虑是麦克风的安装位置和方式。MEMS 麦克风有两个方向。有顶部端口，声音入口孔指向远离安装表面的方向，底部端口。对于底部端口，安装麦克风的 PCB 必须有一个与孔对齐的通孔，以便声音进入。虽然这似乎是一种更复杂的方法，但底部端口麦克风目前主导着市场。移动设备设计人员一直将麦克风安装在柔性电路上，然后将其连接到设备外壳上，在这些设计中，底部端口设计大大简化了组装。

图 2：底部端口麦克风的声学孔径与其 PCB 安装焊盘位于同一侧。

此外，在考虑安装时，供应商警告说，工业设计的声学特性需要注意。如果外壳的声音孔径和外壳的谐振腔不合适，即使是最好的麦克风也会产生较差的性能。根据应用的不同，可能还需要使用垫圈或其他屏障来防止灰尘或水进入麦克风的声孔。

幸运的是，MEMS 麦克风供应商可以提供帮助。例如，英飞凌等供应商与声学专家合作，提供客户可以利用的参考设计。其他公司，如意法半导体，提供声学仿真服务，以帮助根据客户的 3D 图纸验证客户设计。

考虑到这些基本考虑因素，设计人员可以评估各个麦克风的性能特征以做出最终选择。电子表格中列出了可供选择的具有代表性的 MEMS 麦克风的关键参数，可供注册的 EP 阅读器下载。其中一些规格包括：

端口灵敏度 — 给定端口处参考 94-dB -SPL 声学信号的输出信号幅度。这有助于指示麦克风将拾取的最柔和的声音。

SNR — 麦克风的本底噪声与 94-dB、1-kHz 声波产生的信号之间的差异（以 dB 为单位）。

动态范围——麦克风可以可靠地捕捉而不会失真的声音强度级别的分布。它本质上是麦克风的本底噪声与其 AOP 之间的差异（以 dB 为单位）。

频率范围——麦克风在不损失灵敏度的情况下可以响应的音频频率范围。

麦克风

图 3：点击本文底部的“下载指南”按钮下载此 MEMS 麦克风选择指南。

一些供应商还指出了开发人员可以考虑的麦克风产品的特殊功能。其中一个更有趣的是低功耗模式，它允许麦克风在不太敏感但始终开启的状态下运行。在这种状态下运行允许设计在保持活动状态的同时节省电力，以便检测“唤醒”字词，例如“Alexa”。一旦检测到唤醒字，系统就可以切换到全灵敏度（和全功率）操作。这种模式对于电池供电的设计特别有价值，因为它有助于延长电池寿命。

然而，MEMS 麦克风只是声控系统设计的第一个元素。它们之后通常必须进行信号处理，将来自多个麦克风的信号组合起来以降低噪音。降噪技术包括波束成形（需要多个麦克风），它将系统的声学响应集中在扬声器的方向上，以及“插入”操作，它消除了设备本身产生的声音，因此扬声器不需要大声喊叫才能被听到。

当然，本文仅涉及 MEMS 麦克风操作和评估的皮毛。幸运的是，网上有许多供应商教程和其他指南可供进一步研究。这些包括：

MEMS 麦克风规格简介— Cirrus Logic

音频波束成形— Infineon Technologies

MEMS 麦克风教程— STMicroelectronics

您还可以通过以下文章链接了解一些语音信号处理选项及其开发套件。

审核编辑：汤梓红

打开APP阅读更多精彩内容