解读端侧AI降噪模组设计方案

描述

端侧AI降噪模组产品概述

随着智能会议、直播和游戏语音交流的普及,高质量的音频输入设备变得越来越重要。专为语音收集和处理设计的USB AI降噪麦克风模组,这是一款基于XMOS XU316芯片和Codec芯片的专业音频处理模组。 

基于XMOS XU316和Codec芯片,专为麦克风输入和耳机输出场景设计的模组。该模组集成了强大的音频处理能力,搭配不同的固件,可以实现直播麦克风、游戏耳机等多种产品应用。

作为一款USB即插即用设备,A316-Codec-V1无需额外驱动,支持多种采样率(16kHz/48kHz)和位深(16bit/24bit/32bit),能够满足不同场景下的音频处理需求。

核心功能

AI降噪技术:采用先进的AI算法实现环境噪声抑制

自动增益控制:智能调节音量,确保语音清晰度

硬件配置

核心模组:

采用U316-Codec-V1模组,提供强大的数字信号处理能力

音频接口:

1、USB音频输入输出,支持UAC 1.0/2.0协议

2、耳机输入、输出,支持mini3.5接口

3、卡农输入、输出

4、I2S输入、输出

参数调试接口:

1、USB参数调试接口

2、SPI参数调节接口

监听输出:

提供耳机监听输出,便于实时监听音频效果

端侧AI降噪模组功能设计架构

无论是工业现场的机械轰鸣、交通枢纽的嘈杂人声,还是居家环境的电器运转声,端侧AI 降噪模组均能通过智能频谱分析,精准剥离复杂背景噪音,同时保留语音信号的完整性与自然度。相较传统降噪方案,其深度学习算法可针对非平稳噪音实现毫秒级动态响应,有效避免语音失真与信息损耗,确保语音交互的清晰度与流畅性。

传统降噪技术(如线性滤波、谱减法)依赖固定参数设定,在处理复杂动态噪音时易出现适应性不足问题。端侧AI 降噪模组采用RNnoise算法,通过提前语音特征值,融合神经网络模型实现端到端深度学习架构,通过海量声学数据训练的神经网络模型,能够实时分析语音与噪音的时域、频域及空间特征。当含噪语音输入时,模型可智能识别噪音成分并生成反向声波进行抵消,实现从 “被动过滤” 到 “主动抑制” 的技术跨越,显著提升复杂场景下的降噪性能。端侧AI降噪模组功能框图如图1所示。

音频

图1 端侧AI降噪模组功能框图

端侧AI降噪模组硬件架构

模组硬件架构

端侧AI降噪模组的硬件架构是一个以高集成度异构SoC为核心的精密系统,其设计核心是在严格的功耗、成本和尺寸限制下实现高效实时处理。该架构通常包含音频输入、核心处理芯片(XMOS XU31芯片)、高效电源管理单元及各类接口。端侧AI降噪模组硬件架构如图2所示。 

音频

图2 端侧AI降噪模组硬件架构图

模组硬件接口解析

模组采用邮票半孔封装设计,高度集成化布局兼容多种设备形态。其功能接口涵盖:

1、电源管理接口:

支持宽电压输入(2.8V-5.5V),内置电源稳压模块,确保复杂供电环境下的稳定运行

2、音频输入输出接口

模拟音频接口:兼容传统驻极体麦克风与扬声器,支持即插即用(如耳机、卡农)

数字音频接口:支持 I²S、USB,实现高保真音频数据传输

(如I2S、USB)

3、智能交互接口

USB 接口:支持 Windows、Android、Linux 系统免驱连接,集成固件在线升级功能

SPI 调试接口:提供降噪参数实时调节动态配置等功能

端侧AI降噪模组可调参数

AGC参数

1、AGCGAIN :AGC增益系数

2、AGCMAXGAIN :AGC增益系数最大值

3、AGCONOFF   :设置AGCGAIN的值是否可变

测试调试参数方法:

近端音频信号源: IEEE_269-2010_Male_mono_48_kHz.wav,调整参数后,播放近端音频,观察输出音频为合适电平

AI降噪参数

1、AI_denoise_ONOFF : 设置是否采用AI降噪功能

2、NS_Parameter :噪声衰减系数,NS_Parameter默认值为0.15,表示了在设备输出音频信号中大约实现了15dB 的噪声衰减处理,增加NS_Parameter参数值会增加噪声抑制,同时也会增加近端语音失真。因此,需要做好语音质量和稳定性噪声抑制两方面平衡。增加这个参数值会影响进度语音的音质,尤其在混响存在的环境下更加显著。

端侧AI降噪模组加密

采用XMOS提供的片内OTP, 高安全性AES加密模块,加密方式、过程,以及加密效果待验证,查到资料表示OTP一次性编程,且容量偏小,最大代码量为8KB

XMOS芯片包含一个片上的 OTP存储器,我们能够将XMOS的AES模块的配置信息 存储到芯片的OTP上,这样程序在被烧录到Flash上的时候就会被加密。XMOS的AES模块不会被自身程序或是第三方程序修改;程序通过密钥进行AES加密,不会被第三方设备进行盗用。所以XMOS的AES加密具有非常好的安全性和可靠性。

XMOS的AES加密步骤:

1、使用XBURN命令生成128位密钥对,写入密钥文件

$ xburn --genkey keyfile

其中密钥文件第一行是公钥(认证密钥),第二行是私钥(解密密钥)。

2、使用XBURN命令将AES模块和安全密钥写入目标设备的OTP存储器,并设置其安全启动位

$ xburn --lock keyfile --target-file target.xn --enable-jtag --disable-master-lock

3、加密烧写固件并将其写入闪存

$ xflash target.xe --key keyfile

XMOS加密后程序的运行过程如图3所示。首先XMOS芯片从自身的Boot ROM加载基本启动程序,启动程序会查询安全寄存器(Security Register)的所有安全设置位,其中如果安全启动位(secure boot bit)没有置位,程序就会使用正常启动方式,把控制权交个外部的SPI Flash,运行外部的 Flash loader和用户应用程序。如果置位了,则会使用安全启动模式,并且会使用OTP内部的引导启动程序 (boot loader) 。从OTP内部拷贝出AES的设置资料并加载AES模块。AES模块通过SPI读取外部Flash loader 到RAM里面,然后使用AES128-CMAC运算法则和一个128bit的加密密钥对Flash loader进行进行校验,如果校验失败,那么启动程序(boot loader)将会被终止。若校验成功,则AES会读取Flash 对应的镜像程序块,使用一个解密密钥进行解码,并正常运行程序。

音频

图3 XMOS使用AES模块加密后程序的运行过程

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分