汉语语音检索中基于音节和词语言模型的索引方法研究
本文研究汉语语音检索中基于音节和词语言模型的索引方法。首先介绍利用音节Lattice建立索引的方法,采用了基于后验概率的置信测度。之后在使用相同声学模型和语言学模型训练语料的情况下,分别使用音节语言模型和词语言模型进行解码,得到含有不同基元的Lattice。将含有多音节基元的Lattice拆分成只含有单音节基元的Lattice,用其作索引有效地避免多音节基元影响OOV 词检出的问题。最后对利用两种语言模型生成的Lattice进行规模、错误率和词检出性能评测。与只用音节语言模型的Lattice索引相比,利用词语言模型生成的Lattice经转换之后得到的索引,表现出更好的词检出性能。
语音检索 词语言模型 音节模型
郑铁然 李海洋 韩纪庆
哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001
国内会议
安徽黄山
中文
2007-10-21(万方平台首次上网日期,不代表论文的发表时间)