电子说
音频降噪领域长期存在一个难以突破的工程悖论:降噪深度与功耗呈近似指数级正相关。传统双麦降噪方案中,每提升 10dB 降噪深度,系统功耗通常需要增加 80%-120%。这导致 30dB 以上的高性能降噪方案,工作电流普遍超过 50mA,无法应用于电池供电的便携设备、可穿戴设备和低功耗物联网终端。
近期一款量产的低功耗双麦降噪模块打破了这一行业共识:在常规工作模式下电流仅为 15mA,比多数通用单片机的运行电流还低;而在近距离拾音模式下,实测降噪深度达到了 50dB。这一性能指标意味着,它可以将 99.999% 的环境背景噪音有效抑制,即使在 60dB 的工业环境噪音中,也能清晰提取 3 米内的人声信号。
本文将从理论瓶颈、硬件架构、算法优化和工程实现四个维度,系统分析在 15mA 低功耗约束下实现 50dB 高降噪深度的技术路径,探讨音频降噪技术未来的发展方向。
一、低功耗音频降噪的理论瓶颈
要理解这一技术突破的意义,首先需要明确传统降噪方案面临的理论限制。
1.1 单麦降噪的物理天花板
单麦克风降噪的本质是基于信号统计特性的盲源分离。由于单麦只能捕捉到 "人声 + 噪音" 的一维混合信号,无法获取声音的空间信息,因此只能通过分析信号的频谱、幅度和统计特性来区分人声和噪音。
根据香农信息论,单麦降噪的理论信噪比提升上限约为 25dB。在实际应用中,受限于算法精度和信号失真的约束,多数单麦方案的实际降噪深度只能达到 12-18dB,且在非稳态噪音环境下效果会急剧下降。
1.2 传统双麦降噪的功耗困境
双麦降噪通过引入空间维度信息,将一维信号问题转化为二维空域滤波问题,理论上可以实现无限高的降噪深度。但在工程实现中,双麦降噪的功耗主要来自三个方面:
波束成形计算:传统延迟求和波束成形需要对两路信号进行精确的时延估计和相位对齐,每采样点需要数十次乘累加运算
自适应滤波:为了抑制残留噪音,通常需要使用高阶自适应滤波器,512 阶滤波器每秒钟需要进行超过 800 万次运算
数模转换开销:多数方案采用数字接口设计,需要外接 ADC 和 DAC,每次转换都会引入额外的功耗和信号失真
这三个部分的功耗占比超过了系统总功耗的 80%,导致传统双麦方案难以将工作电流控制在 30mA 以下。
1.3 AI 降噪的计算量陷阱
近年来兴起的深度学习降噪方案,虽然在非稳态噪音抑制方面表现出色,但也带来了巨大的计算量负担。一个中等规模的 CNN 降噪模型,每秒钟需要进行数十亿次浮点运算,即使经过量化和剪枝优化,功耗也通常超过 100mA,完全不适合低功耗应用场景。
二、硬件架构重构:从通用计算到专用加速
突破上述瓶颈的核心思路,是放弃 "通用 DSP + 软件算法" 的传统架构,转而采用专为音频降噪优化的异构计算架构。通过将 90% 以上的计算任务硬件化,大幅降低系统功耗。
2.1 通用内核 + 专用加速器的异构设计
该模块采用了 "32 位 RISC-DSP 内核 + 三个专用硬件加速器" 的异构架构,核心主频仅为 64MHz,远低于同类产品的 200-300MHz 主频。但通过专用加速器的硬件加速,其实际音频处理能力超过了多数 300MHz 主频的通用 DSP。
三个专用加速器分别针对音频处理中最耗时的三种操作进行了优化:
1024 点 FFT/IFFT 加速器:采用基 - 2 蝶形算法硬件实现,完成一次 1024 点 FFT 仅需要 10 个时钟周期,比软件实现快 12 倍,功耗降低 85%
64 通道并行滤波器组加速器:支持同时对 64 个不同频段的信号进行滤波处理,单周期完成一个频段的滤波运算
16 位 MAC 阵列加速器:包含 8 个并行的 16 位乘累加单元,单周期完成 8 次乘累加运算,是自适应滤波算法的核心
这种架构设计的优势在于,通用内核只负责简单的控制和调度,所有计算密集型任务全部由专用加速器完成。实测表明,在相同的降噪效果下,该架构的功耗仅为通用 DSP 架构的 1/3。
2.2 全模拟信号链路设计
另一个反常识的设计是采用了纯模拟输入输出的全链路设计。模块内部集成了两路 16 位高精度 Σ-Δ ADC 和一路 16 位 DAC,直接支持模拟麦克风输入和模拟音频输出。
与传统数字接口方案相比,全模拟链路具有三个显著优势:
降低 BOM 成本:省去了外部 ADC 和 DAC 芯片
减少功耗:避免了两次外部数模转换带来的功耗开销,系统总功耗降低 30% 以上
提高信号保真度:减少了信号转换过程中的失真,总谐波失真 (THD) 控制在 0.05% 以内
2.3 细粒度电源管理
为了将工作电流进一步压缩到 15mA,模块采用了三级细粒度电源管理机制:
多电压域设计:内核、加速器和 IO 口分别采用 1.2V、1.5V 和 3.3V 独立供电,不用的模块可以单独断电
动态频率调节:根据输入信号的复杂度自动调节内核主频,安静环境下主频可降至 16MHz,电流仅为 7mA
零静态功耗设计:所有寄存器和存储器都采用低功耗工艺制造,待机电流小于 0.8μA
三、算法层面的极致优化:用物理和数学代替算力
硬件架构只是基础,真正实现 50dB 降噪深度的关键,是对传统降噪算法进行了从物理原理到数学实现的全方位优化。
3.1 近距离差分波束成形:物理层面的噪音抑制
该模块最具创新性的算法设计,是采用了15mm 间距的近距离差分波束成形技术。与传统的远距离延迟求和波束成形不同,差分波束成形利用的是声音的声压差而非时间差。
其基本原理非常简单:
plaintext
y(t) = p₁(t) - p₂(t)
其中p₁(t)和p₂(t)分别是两个麦克风接收到的声压信号。
当声源位于正前方时,两个麦克风接收到的声压几乎相等,相减后人声信号被保留;当声源位于其他方向时,两个麦克风接收到的声压存在差异,相减后噪音信号被抵消。
这是一种纯物理层面的噪音抑制机制,不需要任何算法计算,功耗为零。实测表明,这种差分结构对正后方噪音的抑制深度可以达到 30dB 以上,从源头上就过滤掉了大部分环境噪音。
3.2 频域分块自适应滤波:计算量降低 70%
经过差分波束成形后,残留的噪音主要来自正前方和侧面。为了在低功耗下进一步抑制这些噪音,模块采用了频域分块自适应滤波算法 (FDAF) 代替传统的时域 NLMS 算法。
FDAF 算法的核心思想是将时域信号转换到频域进行处理,利用 FFT 的快速卷积特性将计算复杂度从 O (N²) 降低到 O (NlogN)。对于一个 512 阶的滤波器,FDAF 算法的计算量只有时域 NLMS 算法的 1/5。
再结合硬件 FFT 加速器的加速效果,整个自适应滤波模块的计算量降低了 70% 以上,功耗仅为传统时域方案的 1/4。
3.3 轻量级 AI 辅助分类:只做决策,不做处理
为了提升对非稳态噪音(如键盘声、关门声、车流声)的抑制能力,模块引入了一个轻量级 AI 模型。但与多数纯 AI 降噪方案不同,这个模型的作用不是直接生成降噪信号,而是对噪音类型进行分类。
该模型采用了深度可分离卷积结构,参数总量仅为 97KB,运行时仅占用 18KB 内存。它可以实时识别 12 种常见的噪音类型,然后系统根据噪音类型自动选择最优的传统降噪算法参数:
对于稳态低频噪音(空调声、风扇声),使用高通滤波器 + 谱减法
对于瞬态高频噪音(键盘声、关门声),使用瞬态噪声抑制算法
对于多人说话场景,使用波束成形 + 语音活动检测 (VAD)
这种 "AI 分类 + 传统算法处理" 的混合框架,既保留了传统算法低功耗、低延迟的优势,又获得了 AI 算法对复杂噪音的强大识别能力。引入该模型后,非稳态噪音的抑制能力提升了 15dB,而系统功耗仅增加了 2mA。
四、工程实现的细节:决定最终效果的 "最后一公里"
很多团队在复制上述硬件和算法后,发现实际降噪效果远达不到预期。这是因为双麦降噪的最终效果,70% 取决于工程实现的细节。
4.1 麦克风一致性校准:精度决定上限
差分波束成形的效果高度依赖于两个麦克风的一致性。如果两个麦克风的灵敏度差 0.5dB,降噪深度就会下降 10dB 以上;如果相位差超过 1 度,降噪效果会急剧恶化。
该模块在出厂前,每一个单元都会在标准消声室中进行逐台校准:
使用标准声源发出 1kHz 的正弦波信号
精确测量两个麦克风的输出幅度和相位
在数字域计算校准系数,将两个麦克风的响应完全对齐
校准精度达到了0.1dB 的幅度误差和 0.1 度的相位误差,这是目前行业内的最高水平。正是因为有了如此高精度的校准,才能实现 50dB 的峰值降噪深度。
4.2 声学腔体设计:PCB 也是声学器件
很多工程师容易忽略的一个事实是:PCB 板本身就是一个重要的声学器件。如果腔体设计不合理,会产生结构共振和声泄漏,严重影响降噪效果。
该模块的 PCB 板采用了 1.6mm 厚的 FR-4 材质,麦克风周围做了密封处理,内部填充了吸音材料,有效抑制了结构共振。麦克风与 PCB 板之间采用硅胶垫隔离,减少了振动传导。
对比测试表明,同样的芯片和算法,使用普通 PCB 板安装时,降噪深度只有 28dB;而使用经过优化的声学腔体设计后,降噪深度可以达到 48dB。
4.3 动态范围优化:兼顾小声和大声
一个优秀的降噪系统,必须能够同时处理 20dB 的小声说话和 116dB 的大声喊叫。该模块采用了三级自动增益控制 (AGC) 架构:
前置可编程增益放大器 (PGA):0-40dB 可调,适应不同灵敏度的麦克风
数字 AGC:-20dB 到 + 20dB 可调,自动调节语音音量
峰值限制器:防止大声说话时出现削波失真
同时,模块采用了 16 位高精度 ADC,动态范围达到了 96dB,确保在各种音量下都能获得清晰的信号。
五、实测数据与技术对比
为了客观评估该方案的性能,我们在标准消声室中进行了对比测试。测试环境为 60dB 白噪音,人声位于正前方 0°,噪音源位于 90° 方向。
表格
| 技术方案 | 核心主频 | 降噪深度 | 工作电流 | 算法延迟 |
|---|---|---|---|---|
| 本文分析方案 | 64MHz | 36dB (常规)/50dB (近距离) | 15mA | <10ms |
| 通用 DSP 方案 A | 300MHz | 32dB | 45mA | 15ms |
| 通用 DSP 方案 B | 200MHz | 28dB | 38mA | 12ms |
| XMOS 方案 | 400MHz | 35dB | 120mA | 20ms |
| 纯 AI 方案 | 500MHz | 42dB | 180mA | 30ms |
从测试数据可以看出,该方案在降噪深度和功耗两个维度上都取得了显著的领先优势,同时保持了极低的算法延迟,完全满足实时通话的要求。
六、总结与展望
低功耗双麦降噪技术的突破,为便携设备、可穿戴设备和物联网终端的音频交互带来了新的可能性。本文分析的技术路径表明,通过硬件架构的专用化、算法的物理化和工程实现的精细化,可以在极低的功耗下实现高性能的降噪效果。
未来,低功耗音频降噪技术将朝着三个方向发展:
硬件与算法的深度协同:进一步将更多的算法功能硬件化,实现 "算法即硬件"
边缘 AI 的轻量化:开发更小、更高效的 AI 模型,实现 "感知 - 决策 - 处理" 的全链路智能化
多传感器融合:结合麦克风阵列、振动传感器和光学传感器,实现更精准的声源定位和噪音抑制
对于电子工程师来说,这一技术突破也带来了重要的启示:真正的技术创新不是堆砌参数和功能,而是深入理解问题的本质,用最简单、最有效的方法解决问题。在追求高性能的同时,更要关注功耗、成本和可靠性等工程实际问题。
【技术讨论】 大家在低功耗音频设计中遇到过哪些难题?有没有其他值得关注的低功耗降噪技术?欢迎在评论区分享你的经验和见解。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !