会议专题

多发音字典在维吾尔语方言语音识别中的应用

  基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。本文针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果验证了该方法对维吾尔语方言口音的识别性能有提升作用。

维吾尔语 语音识别 发音变异 数理语言学

杨雅婷 马博 王磊 吐尔洪·吾司曼 李晓

中国科学院 新疆理化技术研究所,乌鲁木齐 830011 中国科学院 研究生院,北京 100190 中国科学院 新疆理化技术研究所,乌鲁木齐 830011

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-4

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)