基于两层词法树的大词表连续语音识别搜索算法

摘要：

在连续语音识别中,首先要考虑的就是词典的表示问题,它关系到整个搜索空间的规模和搜索算法的效率.在现有的词典表示方法中,最通用的就是树形词典表示方法,也称为词法树(Lexical Tree).但是在词法树构成中,因为要将所有的搜索这间都体现在词法树上,所以在使用跨词(Cross-Word)模型、多发音词典时就会出现词法树规模超大的问题需要解决”2”我们从搜索空间组成的角度入手,提出了两层词法树的概念,解决了现有的词法树规模问题.其中第一层词法树重点描述词网络信息和基元网络信息,而第二层重点描述实际动态规划搜索中的各种信息.因为声学信息都很好地在第二层中实现了共享,所以词法树的规模很小,使得它有足够的能力来处理很多复杂的问题.另外,本文还给出了完整的基于两层词法树的动态规划搜索算法,从实验结果可以看出,这种搜索算法具有很好的识别性能和效率.

关键词：连续语音识别搜索算法两层词法树语言模型

作者: 张国亮郑方吴文虎

作者单位: 清华大学计算机科学与技术系智能技术与系统国家重点实验室语音技术中心(北京)

会议类型: 国内会议

会议名称: 第六届全国人机语音通讯学术会议

会议地点: 深圳

会议语种:中文

页码: 239-242

在线出版日期: 2001-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于两层词法树的大词表连续语音识别搜索算法