马来语广泛使用于马来西亚、新加坡等东南亚国家,目前使用人数约有2亿多人。本文研究马来语语音合成系统的前端文本分析与处理方法、以及基于HMM的后端语音合成方法。在前端文本分析与处理环节,研究并实现了马来语语料的收集与挑选、文本归一化、以及音节自动划分;在后端语音合成环节,研究并实现了马来语音子列表确定、文本标注、上下文属性和问题集设计、HMM声学模型训练、以及语音波形产生。实验结果表明:本文提出并实现的前端文本分析与处理方法可满足后端语音合成的要求,采用本文构建的后端语音合成系统可合成出完整的马来语语句。
随着信息科学的进步,语音合成技术在近几年得到了飞速发展。合成语音的自然度、可懂度等各种指标都得到了明显的改善,并被广泛的应用于导航、手机语音交互等实际系统中。
现如今,语音合成的应用主要集中在汉语、英语等常用语言,而小语种的研究相对缺乏。作为使用人数较多的马来语是东南亚地区一种重要的民族语言,因此研究马来语语音合成系统对中国与东南亚地区交流互动有积极的意义。
本论文主要研究了马来语语音合成系统的前端文本分析的方法和后端语音合成。从文本层面,通过规则、音节列表、正则表达等方法对马来语的文本进行分析和处理,完成了语料库构建、文本归一化、文本音节化等工作。在系统后端根据音子列表和上下文属性的信息设计问题集,利用HTS工具包进行模型训练,最后生成马来语的语音。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !