智能语音技术之麦克风的主要技术特性分析

描述

智能语音助理成为当红炸子鸡,作为相关应用不可或缺的声音感测器,麦克风的市场规模也将出现明显爆发,其中又以MEMS麦克风受惠最大。至于驻极体麦克风(ECM),虽然具有高讯噪比(SNR)的优势,但因为匹配工作相对繁琐,对于需要采用阵列架构的智能语音助理应用来说,并非最理想的选择。

研究机构Yole预估,在智能语音助理、车用等应用需求爆发的加持下,MEMS麦克风的出货量将稳定成长,到2022年时,年出货量可望超过80亿颗;ECM麦克风出货量则缓慢萎缩,到2022年时,出货量约仅在30亿颗左右。如此庞大的市场,我们有必要重视一下这个产品的技术了。

麦克风

MEMS麦克风的结构和工作模式概述

MEMS麦克风含一个可移动的膜片和静态背板,矽晶圆基板上采用常见的沉积和选择性蚀刻的工艺制作。背板有穿孔,允许空气流通而不引起偏离。膜片的设计是为了适应声波引起的气压变化。弯曲会造成膜片相对背板移动,产生一定比例的电容变化。与MEMS换能器共同封装的一个配套IC将此电容变化转换成一个模拟或数字格式的电讯号。

市场上有模拟或数字输出的MEMS麦克风。模拟麦克风基本上包含MEMS换能器和配套的模拟放大器集成电路(IC),是一种用于小型手持装置的热门方案,像是功能手机与入门级到中阶的智能型手机。

数字化

整合模拟调节讯号和模拟数字转换器(ADC)的数字麦克风通常是PC或高阶智能型手机的首选装置。数字技术利用固有的更高射频和抗电磁干扰(EMI)实现更佳的音讯性能,如图一所示。此外,电路设计和电路板布局可以简化,更易于更动设计,无需修改电阻和电容值。

麦克风

图一: 数字化改进抗噪性

大多的数字麦克风还有时脉和一个L / R控制的输入。时脉输入用来控制Δ?调变器,将感测器的模拟讯号转换成数字脉冲密度调变(PDM)讯号。典型的时脉频率范围从1MHz至3.5 MHz。麦克风的输出被驱动到所选择的时脉边缘的适当水准,接着进入一个高阻抗状态的时脉周期的另一半。这使两个数字麦克风输出能共用单条数据线(图二)。L / R输入确定有效数据的时脉边缘。

麦克风

图二: 数字麦克风可减少传输线数量

数字MEMS麦克风具有高抗噪性和简化电路设计的优点,适用于多麦克风阵列以消除回音和杂讯,以及波束形成以实现定向灵敏度。为让智能型手机能消除杂讯,一种常见方法是在远离主语音麦克风之处放置一个或多个额外麦克风,例如在外壳边缘或背面,检测来自周围环境的杂讯,再从语音麦克风的输出中减去,能提高通话品质。降噪麦克风也经常用于影音录制模式。

波束形成还使用到两个或多个麦克风阵列。虽然大多数麦克风有全向灵敏度,但一些应用可得益于一个特定方向所增加的灵敏度或在其他方向降低灵敏度,例如在电话会议中或行车通话时提高音讯品质和清晰度。根据从不同方向传来的声音相位差,波束形成可利用数字演算法到阵列的麦克风输出,而且还能判定特定声音传来的方向。

关于麦克风的主要技术特性

1.灵敏度

灵敏度是表示麦克风声电转换效率的重要指标。它表示在自由声场中,麦克风频率为1KHz恒定声压下与声源正向(即声入射角为零)时所测得的开路输出电压。单位为毫伏/帕。1Pa=10bar1ubar大致相当于人正常说话音量,在1m远处测得的声压。

动圈式麦克风灵敏度约1.5~4毫伏/帕,而电容式麦克风灵敏度比动圈式高10倍左右,约20毫伏/帕。

麦克风的灵敏度也有用分贝(db)表示,规定1伏、帕为0db。由于灵敏度都比1伏/帕小得多,所以表示的灵敏度都一db。

麦克风灵敏度高是件好事,它可以向调音台提供较高输入电平,可以提高信噪比,但太高其输出电压也高,容易产生过激失真。

用于卡拉OK演唱时,麦克风与嘴巴的距离很近,所以对灵敏度的要求并不高。如果用于乐队录音或舞台剧演出,则对灵敏度的要求较高。

2.频率响应

频率响应是反映麦克风电转换过程中对频率失真的一个重要指标。麦克风在恒定声压和规定入射角声波作用下,各频率声波信号的开路输出电压与规定频率麦克风开路输出电压之比,称为麦克风的频率响应,用分贝(db)表示。一般专业用麦克风频响曲线容差范围在2db。频率响应是麦克风接受到不同频率声音时,输出信号会随着频率的变化而发生放大或衰减。最理想的频率响应曲线为一条水平线,代表输出信号能直实呈现原始声音的特性,但这种理想情况不容易实现。

频率响应曲线图中,横轴为频率,单位为赫兹(Hz),大部份情况取对数来表示;纵轴则为音强,单位为分贝(db)。0分贝代表麦克风的输出信号跟原始声音一致,没有被改变;大于0分贝代表输出信号被放大;小于0分贝则代表输出信号被衰减。

麦克风使用场合不同,要求频响范围和不均匀度范围也不同。

动圈麦克风往往不取平坦频响曲线,而在高频段(3~5KHz)稍有提升,这样可增加拾音明亮度和清晰度。一般在离声源很近距离使用时,会出现低频提升现象称为"近讲效应",所以在150Hz以下低频段较好有明显衰减。

电容式麦克风的频率响应曲线会比动圈式的来得平坦,还原更为真实。常见的麦克风频率响应曲线大多为高低频衰减,而中高频略为放大;低频衰减可以减少录音环境周遭低频噪音的干扰。

3.指向特性

麦克风灵敏度随声波入射方向的变化而变化的特性称为指向性。常用指向图来表示。用不同指向特性的麦克风拾音时,对直达声/混响声的比例有很大影响。我们可以根据声源选择合适指向性的麦克风。

常见指向性有全向型(无指向)、心形、超心型、锐心型、8字型(双向)等几种。

a.无指向:此特性对所有方向声波入射有同等灵敏度。要拾取环境声时,通常都会使用全指向性的麦克风,这样拾取到的声音会有强烈的空间感 、但在环境噪声大的条件下不宜采用。

b.心形:此特性对正面180度方向声波入射有效,背面声音被抑制。正面灵敏度较大侧面稍小,背面较小。如要拾取正前方的声源,心形指向性的麦克风较为理想。

c.锐心型:此特性正面110度入射角,抑制声反馈较好。

d.超心型(单指向性麦克风):此特性正背面90度入射角同等效果。 它的指向性比心形麦克风更尖锐,正面灵敏度极高,其它方向灵敏度急剧衰减,特别适用于高噪音的环境和立体声拾音等。

4、输出阻抗:

从麦克风的引线两端看进去的麦克风本身的阻抗称为输出阻抗。 目前常见的麦克风有高阻抗与低阻抗之分。高阻抗的数值约1000~20000欧姆,它可直接和放大器相接;面低阻抗型为50~1000欧姆,要经过变压器匹配后,才能和放大器相接。高组抗的输出电压略高,但引线电容所起的旁路作用较大,使高频下降,同时也易受外界的电磁场干扰,所以,麦克风引线不宜太长,一般以10~20米为宜。低阻抗输出无此缺陷,所以噪音水平较低,传声器引线可相应的加长,有的扩音设备所带的低阻抗传声器引线可达100米。如果距离更长,就应加前级放大器。

5.动态范围

是指麦克风输出较小有用信号和较大不失真信号之间电频差。动态范围小,会引起声音失真,音质变坏,因此要求有足够大的动态范围。

6.信噪比

指在规定输入电压下的输出信号电压与输入电压切断时输出所残留之杂音电压之比,也可看成是较大不失真声音信号强度与同时发出的噪音强度之间的比率,通常以S/N表示,一般用分贝(dB)为单位。信噪比越高越好,信噪比越大,则表示混在信号里的杂波越少,还原质量就越高。

7.较大输入声压级

较大输入声压级是麦克风所能承受的达到0.5总谐波失真的较大声压级的度量,一般用分贝(dB)表示。

无论什么型号的麦克风,其声一电变换非线性畸变都会随声音声压级的增加而加大,所以,每种麦克风都有一个“较高适用声压级”的限度。当麦克风所处的声压级超过这个限度时,麦克风输出的电信号的非线性畸变会超过它能允许的程度,后面的电声设备就无法加以校正了。所以,使用的麦克风必须要满足其在拾音点的声压级的要求。

专业麦克风的较大输入声压级一般定得较高,只要它和声源间的距离得当,就不会产生可闻的失真。

8.音色

麦克风的技术参数,对我们按不同用途或要求,使用麦克风起到很好的参考作用,但不是的,尤其是麦克风的音色是不能用技术参数作标准的,音色更多取决于声音的谐波,而影响谐波的因素非常多,环境、演唱者、扩声录音器材是最主要的,甚至一个麦克风支架、一块窗帘、一颗小小的螺丝都会对音色有影响。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分