不定长语音单元在语音自动切分中的运用
在语音自动切分中普遍采用的声学模型是三音子模型。研究表明,以三音子模型为单元模型在语音自动切分中是存在局限性的。其原因在于连续语流并不是简单的音子串联组合,各音子结合的紧密程度或协同发音现象,在不同的环境下是不同的,从而导致不同的音变现象并影响切分精度。本文针对三音子模型在英语语音切分中的不足,根据语音学知识和实际训练数据,增加了一批较长的语音单元组成了不定长的语音单元,并在此基础上提出了基于不定长单元HMM 模型的语音自动切分方法。利用三音子模型的初始对不定长单元HMM 模型进行训练,可以获得令人满意的结果:长单元的边界切分准确率从79.6%提高到了89.1%,总体切分精度上较三音子模型也有了一定的提高。
隐马尔可夫模型 不定长语音单元 语音自动切分
杜嘉 曹振海 祖漪清
上海交通大学生物医学工程系,上海,200240 摩托罗拉中国研究中心,上海,200041
国内会议
安徽黄山
中文
2007-10-21(万方平台首次上网日期,不代表论文的发表时间)