解读端侧AI降噪模组设计方案

飞利信 2025-10-31 3237

描述

端侧AI降噪模组产品概述

随着智能会议、直播和游戏语音交流的普及，高质量的音频输入设备变得越来越重要。专为语音收集和处理设计的USB AI降噪麦克风模组，这是一款基于XMOS XU316芯片和Codec芯片的专业音频处理模组。

基于XMOS XU316和Codec芯片，专为麦克风输入和耳机输出场景设计的模组。该模组集成了强大的音频处理能力，搭配不同的固件，可以实现直播麦克风、游戏耳机等多种产品应用。

作为一款USB即插即用设备，A316-Codec-V1无需额外驱动，支持多种采样率（16kHz/48kHz）和位深（16bit/24bit/32bit），能够满足不同场景下的音频处理需求。

核心功能

AI降噪技术：采用先进的AI算法实现环境噪声抑制

自动增益控制：智能调节音量，确保语音清晰度

硬件配置

核心模组：

采用U316-Codec-V1模组，提供强大的数字信号处理能力

音频接口：

1、USB音频输入输出，支持UAC 1.0/2.0协议

2、耳机输入、输出，支持mini3.5接口

3、卡农输入、输出

4、I2S输入、输出

参数调试接口：

1、USB参数调试接口

2、SPI参数调节接口

监听输出：

提供耳机监听输出，便于实时监听音频效果

端侧AI降噪模组功能设计架构

无论是工业现场的机械轰鸣、交通枢纽的嘈杂人声，还是居家环境的电器运转声，端侧AI 降噪模组均能通过智能频谱分析，精准剥离复杂背景噪音，同时保留语音信号的完整性与自然度。相较传统降噪方案，其深度学习算法可针对非平稳噪音实现毫秒级动态响应，有效避免语音失真与信息损耗，确保语音交互的清晰度与流畅性。

传统降噪技术（如线性滤波、谱减法）依赖固定参数设定，在处理复杂动态噪音时易出现适应性不足问题。端侧AI 降噪模组采用RNnoise算法，通过提前语音特征值，融合神经网络模型实现端到端深度学习架构，通过海量声学数据训练的神经网络模型，能够实时分析语音与噪音的时域、频域及空间特征。当含噪语音输入时，模型可智能识别噪音成分并生成反向声波进行抵消，实现从 “被动过滤” 到 “主动抑制” 的技术跨越，显著提升复杂场景下的降噪性能。端侧AI降噪模组功能框图如图1所示。

图1 端侧AI降噪模组功能框图

端侧AI降噪模组硬件架构

模组硬件架构

端侧AI降噪模组的硬件架构是一个以高集成度异构SoC为核心的精密系统，其设计核心是在严格的功耗、成本和尺寸限制下实现高效实时处理。该架构通常包含音频输入、核心处理芯片（XMOS XU31芯片）、高效电源管理单元及各类接口。端侧AI降噪模组硬件架构如图2所示。

图2 端侧AI降噪模组硬件架构图

模组硬件接口解析

模组采用邮票半孔封装设计，高度集成化布局兼容多种设备形态。其功能接口涵盖：

1、电源管理接口：

支持宽电压输入（2.8V-5.5V），内置电源稳压模块，确保复杂供电环境下的稳定运行

2、音频输入输出接口

模拟音频接口：兼容传统驻极体麦克风与扬声器，支持即插即用（如耳机、卡农）

数字音频接口：支持 I²S、USB，实现高保真音频数据传输

（如I2S、USB）

3、智能交互接口

USB 接口：支持 Windows、Android、Linux 系统免驱连接，集成固件在线升级功能

SPI 调试接口：提供降噪参数实时调节动态配置等功能

端侧AI降噪模组可调参数

AGC参数

1、AGCGAIN ：AGC增益系数

2、AGCMAXGAIN ：AGC增益系数最大值

3、AGCONOFF ：设置AGCGAIN的值是否可变

测试调试参数方法：

近端音频信号源： IEEE_269-2010_Male_mono_48_kHz.wav，调整参数后，播放近端音频，观察输出音频为合适电平

AI降噪参数

1、AI_denoise_ONOFF : 设置是否采用AI降噪功能

2、NS_Parameter ：噪声衰减系数，NS_Parameter默认值为0.15，表示了在设备输出音频信号中大约实现了15dB 的噪声衰减处理，增加NS_Parameter参数值会增加噪声抑制，同时也会增加近端语音失真。因此，需要做好语音质量和稳定性噪声抑制两方面平衡。增加这个参数值会影响进度语音的音质，尤其在混响存在的环境下更加显著。

端侧AI降噪模组加密

采用XMOS提供的片内OTP，高安全性AES加密模块，加密方式、过程，以及加密效果待验证，查到资料表示OTP一次性编程，且容量偏小，最大代码量为8KB

XMOS芯片包含一个片上的 OTP存储器，我们能够将XMOS的AES模块的配置信息存储到芯片的OTP上，这样程序在被烧录到Flash上的时候就会被加密。XMOS的AES模块不会被自身程序或是第三方程序修改；程序通过密钥进行AES加密，不会被第三方设备进行盗用。所以XMOS的AES加密具有非常好的安全性和可靠性。

XMOS的AES加密步骤：

1、使用XBURN命令生成128位密钥对，写入密钥文件

$ xburn --genkey keyfile

其中密钥文件第一行是公钥（认证密钥），第二行是私钥（解密密钥）。

2、使用XBURN命令将AES模块和安全密钥写入目标设备的OTP存储器，并设置其安全启动位

$ xburn --lock keyfile --target-file target.xn --enable-jtag --disable-master-lock

3、加密烧写固件并将其写入闪存

$ xflash target.xe --key keyfile

XMOS加密后程序的运行过程如图3所示。首先XMOS芯片从自身的Boot ROM加载基本启动程序，启动程序会查询安全寄存器（Security Register）的所有安全设置位，其中如果安全启动位（secure boot bit）没有置位，程序就会使用正常启动方式，把控制权交个外部的SPI Flash，运行外部的 Flash loader和用户应用程序。如果置位了，则会使用安全启动模式，并且会使用OTP内部的引导启动程序（boot loader）。从OTP内部拷贝出AES的设置资料并加载AES模块。AES模块通过SPI读取外部Flash loader 到RAM里面，然后使用AES128-CMAC运算法则和一个128bit的加密密钥对Flash loader进行进行校验，如果校验失败，那么启动程序（boot loader）将会被终止。若校验成功，则AES会读取Flash 对应的镜像程序块，使用一个解密密钥进行解码，并正常运行程序。

图3 XMOS使用AES模块加密后程序的运行过程

打开APP阅读更多精彩内容