会议专题

面向多口音语音识别的声学模型重构方法

  本文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并 通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合,从而提高了重构后的声学模型的效率。实验表明:该方法在不降低对标准普通话的识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了9.25%和9.21%。

语音识别 多方言口音 声学模型 数理语言学

张超 刘轶 郑方

清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京 100084 清华大学 计算机科学与技术系,北京 100094 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京 100084

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-6

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)