面向多口音语音识别的声学模型重构方法

摘要：

　　本文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型，并通过声学模型重构的方法将它们融合到标准普通话模型中，以改善普通话语音识别器对带多方言口音语音的识别效果。另外，提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合，从而提高了重构后的声学模型的效率。实验表明：该方法在不降低对标准普通话的识别率的前提下，对粤、吴口音的绝对音节错误率分别下降了9.25％和9.21%。

关键词：语音识别多方言口音声学模型数理语言学

作者: 张超刘轶郑方

作者单位: 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京 100084 清华大学计算机科学与技术系,北京 100094 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心,北京 100084

会议类型: 国内会议

会议名称: 第十一届全国人机语音通讯学术会议

会议地点: 西安

会议语种:中文

页码: 1-6

在线出版日期: 2011-10-16（万方平台首次上网日期，不代表论文的发表时间）

会议专题

面向多口音语音识别的声学模型重构方法