基于HMM的维吾尔语连续语音识别系统
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。本文结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolKit)工具实现了基于HMM(Hidden Markov Model)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了大量的识别实验。
维吾尔语 连续语音 语音识别 HMM模型 词缀 二元文法语言模型
那斯尔江·吐尔逊 吾守尔·斯拉木
西安交通大学电子与信息工程学院,西安 陕西 710049 新疆大学数学与系统科学学院,乌鲁木齐 新疆 830046 新疆大学信息科学与工程学院,乌鲁木齐 新疆 830046
国内会议
合肥
中文
272-278
2008-10-07(万方平台首次上网日期,不代表论文的发表时间)