一种语料缺乏条件下的藏语音素自动切分方法
藏语语音合成及语音学研究中,经常需要切分音素,人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确.以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,从而对音素进行切分,实验证明,切分效果要优于单纯的藏语模型方法.
藏语语音 音素切分 声学模型 维特比算法 隐马尔可夫模型
李冠宇 于洪志 吴志强
西北民族大学中国民族语言文字教育部重点实验室,甘肃兰州 730030
国内会议
济南
中文
1-7
2014-10-16(万方平台首次上网日期,不代表论文的发表时间)