基于后验概率词格的汉语自然对话语音索引
语音索引是语音检索任务的关键问题之一,本文针对汉语自然对话语音索引问题进行研究,提出了基于子词的词格索引和融合方法。通过最优路径索引和词格索引的性能比较,选择词格进行索引,首先将词格进行后验概率表示,根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格,选择字、有调音节和无调音节作为子词单元,在汉语自然对话语音关键词检测任务上,关键词检测指标FOM从基线系统的68.3%分别提高到 70.9%,71.3%和73.3%,性能优于音节识别器音节索引方法。根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,FOM 指标由基线系统的68.3%(LVSCR)和66.9%(音节识别器)提高到78.8%。
语音检索 后验概率词 格索引单元 语音索引
孟莎 余鹏 Frank Seide 刘加
清华大学,电子工程系,北京,100084 微软亚洲研究院,北京,100080
国内会议
安徽黄山
中文
2007-10-21(万方平台首次上网日期,不代表论文的发表时间)