语音增强系统的性能依赖于噪声估计的准确性。若噪声的估计值偏小,则会残留大量恼人的“音乐噪声”,反之,若估计值偏大,则会导致语音失真严重,语音的可懂度下降。传统的噪声估计方法是基于语音活性判决(VAD)基础上,通过语音的无声段对噪声功率谱进行估计。该方法仅适用于信噪比较高的平稳噪声环境下。因为在低信噪比环境下,VAD判决的准确率较低。同时,由于该方法仅通过无声段估计噪声,所以在非平稳噪声环境下性能急剧恶化。然而实际噪声往往是非平稳的,所以对噪声的估计不应仅仅限制在无声段,在语音存在期间也要连续估计噪声。
Martin提出了一种基于最小统计和最优滤波的噪声谱估计算法(Minimum Statistic, MS),该算法不需要进行语音活性判决,同时在语音存续期间也可更新噪声,相对于VAD方法能够较好跟踪非平稳噪声。但是,MS算法存在较大跟踪时延,虽然经过无偏修正因子修正,但估计值仍然偏小,尤其在噪声上升区域存在的噪声欠估计更为明显。
本文提出的噪声估计方法,不需要进行语音活性判决同时能快速跟踪噪声的变化。实验结果表明,本文算法较MS算法明显减少了在噪声功率谱上升区域存在的跟踪时延。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !