IoT中的高音质音频设计

电子工程师 2018-03-17 4197

电子说

1.2w人已加入

描述

音频是许多物联网应用不可或缺的组成部分, 包括消费品（如扬声器、耳机、可穿戴设备），医疗设备（如助听器），自动化工业控制应用、娱乐系统和汽车的信息娱乐设备等。

物联网的声音可大致分为三类: 流媒体(即音乐、声音和数据)、语音识别 / 命令, 以及蓝牙和 Wi-Fi 无线连接播放(例如, 将多通道音频通过 Wi-Fi 传输到家庭环绕立体声系统)。然而, 设计一个高质量、不间断的音频子系统可能是一个挑战, 因为工程师必须遵守基于物联网设备所要求的严格约束。

更复杂的设计需要包括先进的功能, 例如语音识别，使驱动控制汽车的信息娱乐系统就像手机一样轻松易用。由于 MCU是所有这些音频系统的核心, 选择一个集成设计可能是一个可靠无噪音音频系统所需的。本文探讨了设计此类系统所需的音频技术。

音频子系统的组件

如前所述，物联网的音频包括三个主要的活动: 高质量的语音 / 数据流, 无线传输和语音控制。图1显示了嵌入式系统中的重要构件。

图1 音频处理子系统

需要注意的是, 许多这些功能可以集成在一个现代化的单片机中, 如本例所用的 Cypress CYW43907与集成的 Wi-Fi 802.11 n。一些基于物联网系统的重要音频技术可能包括:

音频应用

一个带有音频功能的单片机，允许工程师对大多数流行媒体播放器和内容提供商使用 mp3 / 4流。许多设计也需要支持 WMA 和苹果的 AAC 解码, 这需要更多的处理能力。通常可以在消费者音频应用程序中使用低成本的音频单片机, 或者管理音频配件中的数字音乐流, 如数字扬声器集。

在这些应用程序中, 一帧 PCM 音频数据(封装在 USB 音频类格式中)通过处理器的 SPI/ I2C 串行通道可达1 ms。视来源而定, 音频流一般以多种格式中的一种形式出现, 但是, 一些低成本的编码器只能接受一个特定的格式。在这些情况下, MCU 在确保数据在输入到编解码器之前的正确对齐方面发挥了重要作用。

由于并非所有音频来源都使用相同的采样率, 所以编解码器还必须将其采样频率进行调整, 或依靠单片机将取样数据流转换成一个通用采样率(见图2)。在这些情况下, MCU 必须管理数据流, 以避免在其他情况下导致静默、持久性污染和音频中断, 这种情况会随着数据丢失而产生, 并扰乱用户的听力体验。需要注意的是, 音频单片机也可以用来实现音频子系统的其他功能, 例如在音频播放过程中控制照明。

图2 音频单片机可能执行格式转换、采样率调整和数据流管理, 以及支持音频用户界面

为了在广泛的应用中使用音频, 音频 MCU 需要支持各种音频技术。图3显示了这些音频技术的例子。

图3 音频技术

音频编码器(编码器 / 解码器)

音频编解码器是音频系统的主要前端组件。许多在物联网应用程序架构的 MCU支持硬件中的编解码功能。这使得系统可以减少数字音频样本的大小, 以加速无线传输(节省电力)和减少存储空间(减少内存容量的压力)。一个编码器可以支持各种音频格式, 如 AAC, AC-3和 ALAC等。要做到这一点, 它需要一个解码接入单元(AU) , 这个单元在任何音频后处理(如 DSOLA, SOLA)之前实现。当使用像 AAC, AC-3和 ALAC 这样的标准音频格式时, 音频的分类方式使得后续音频样本在音频包数据流中指定的格式范围内。分组间隔也需要被管理, 以允许最小的交叉抖动和不间断操作。 AU 的有效负载大小允许任何需要执行。

基带处理

基带信号是模拟或数字波形中的一组基本频率, 可以通过电子电路进行处理。基带信号可以由单个频率或一组频率组成, 如果在数字域中, 数据流通过一个非多路通道发送。基带被定义为带有载波信号的基带混合, 以产生调制信号。需要注意的使, 在支持物联网音频的MCU 中, 音频编解码器与基带处理以及RF 可以集成在一个芯片上。音频编解码器可以在各种无线收发器中实现, 以提供语音数据和/或音乐功能。它还有单音频和立体声音频输出通道, 以及立体声输入。

包丢失隐藏和数据复制

过度的延迟、数据包丢失和高延迟抖动都会影响通信质量。突发数据包丢失的可能性随着网络负载的增加而增加, 并导致了用户可以听到的中断。通过高级功能, 如丢包隐藏技术, 可以增强通过 Wi-Fi音频传输。系统体系结构的源 / 接收器如下: 一个源捕获音频, 通过 RTP 流结构将 PCM 数据消除, 并使时钟与 PLC 连接的所有源同步。

需要注意的, 无线通信链接的性能取决于链接预算性能的质量。这种连接预算由三个因素决定: 传输功率、发射天线增益和接收天线增益。例如, 如果连接路径的功率衰减空间损耗大于接收无线电的最低接收信号水平, 那么就可以在802.11网络上进行可靠的通信(见图4)。

图4 无线通信的链接预算性能

语音清晰度提升(SIE)

音频系统中的背景噪声降低了语音的可理解性。如果噪音超出一定水平, 那么用户将很难理解这样的语音。对于嵌入式设备而言，实时连续语音识别的可用性要求系统能够提高信噪比。选择一个支持移植和优化的大词汇量持续语音识别系统的单片机可以简化开发过程。

唤醒词检测(WUPD)

通过这个功能，用户可以通过语音激活设备, 以一种不用手的方式打开系统(见图5)。

图5 唤醒式短语检测

打开APP阅读更多精彩内容