基于潜在语义信息的汉语语音识别方法
统计语言模型必须包容语言中各种各样的全局和局部约束,N元文法却无法融入语音间长距离的语义信息.潜在语义分析利用奇异值分解实现词和文本的数量化表示,以揭示训练语料中所呈现出的显著语义关系.本文将潜在语义信息应用于汉语语音识别的两个方面:一是语言模型自适应,动态调整不同主题语言模型的插值系数,相比于均匀插值系数法,识别正确率绝对提高6.12个百分点;二是同三元文法相结合,结合一种新的融合方式以调整三元文法的概率,实现表明识别正确率可绝对提高1个百分点.
语义分析 语言模型 语音识别 汉语语音 语料
任纪生 王作英 赵敏
清华大学电子工程系(北京) 第二炮兵装备研究院(北京)
国内会议
包头
中文
84-90
2004-09-01(万方平台首次上网日期,不代表论文的发表时间)