会议专题

汉语语音检索中基于音节和词语言模型的索引方法研究

本文研究汉语语音检索中基于音节和词语言模型的索引方法。首先介绍利用音节Lattice建立索引的方法,采用了基于后验概率的置信测度。之后在使用相同声学模型和语言学模型训练语料的情况下,分别使用音节语言模型和词语言模型进行解码,得到含有不同基元的Lattice。将含有多音节基元的Lattice拆分成只含有单音节基元的Lattice,用其作索引有效地避免多音节基元影响OOV 词检出的问题。最后对利用两种语言模型生成的Lattice进行规模、错误率和词检出性能评测。与只用音节语言模型的Lattice索引相比,利用词语言模型生成的Lattice经转换之后得到的索引,表现出更好的词检出性能。

语音检索 词语言模型 音节模型

郑铁然 李海洋 韩纪庆

哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001

国内会议

第九届全国人机语言通讯学术会议

安徽黄山

中文

2007-10-21(万方平台首次上网日期,不代表论文的发表时间)