会议专题

基于发音词典自适应的纳西语口音汉语普通话语音识别

非母语口音、少数民族语口音是汉语普通话连续语音识别应用中必须面对的问题。本文以纳西语口音为实例,研究如何利用民族语口音的发音变异规律,在低成本和易于扩展的前提下,实现由标准普通话识别器到民族语口音普通话识别器的变换。本文采用专家知识指导下的数据驱动方法,研究民族语口音普通话的声母、韵母和音节的变异规律。在此基础上,提出了一种新的多发音词典生成策略,以实现用某种口音的音节混淆矩阵自动构建该种口音的多发音词典。实验结果表明:引入二元语言模型后,采用多发音词典的民族语口音普通话的音节识别率都高于采用单发音词典的识别率。

语音识别 纳西语口音 说话人自适应 词典自适应 发音变异 二元语言模型

陈江 杨鉴 徐永华

云南大学信息学院,昆明 650091

国内会议

第29届中国控制会议

北京

中文

2685-2689

2010-07-29(万方平台首次上网日期,不代表论文的发表时间)