提出一种基于非负矩阵分解( Nonnegative matrix factorization,NMF)后验特征优化和修正分段动态时间规整(Segmental dxrnamic time warping,SDTW)检索的无监督语音查询样例检测方法。该方法首先应用频域线性预测(Frequency domain linear prediction,FDLP)声学特征参数代替梅尔频率倒谱系数( Mel-frequency cepstral coefficients,MFCCs)训练高斯混合模型(Gaussian mlxture model,GMM)模型,然后使用NMF算法对高斯后验特征矩阵进行分解,将得到的基矩阵作为子空间变换矩阵对原始后验特征投影,投影可以突出特征中主要分量,平滑距离矩阵。在检索阶段,使用多相邻输出得分对最佳匹配得分进行修正,用于代替标准SDTW算法的1-best输出得分。实验结果表明,在不增加检索时间的情况下,该方法相比应用MFCCs和FDI。P特征的基线系统性能提升明显,检索精度分别相对提升了18. 6%和18. 1%。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !