汉语连续语音识别中声学模型基元比较:音节、音素、声韵母

摘要：

本文研究的是汉语连续语音识别中声学模型基元的选择问题.根据汉语语音的特点,本文分别采用音节、音素和声韵母等三种语音识别基元进行声学建模.为了描述连续语音中的协同发展现象,本文针对音素和声韵基元,设计了相应的问题集,利用基于决策树的状态共享策略建立了上下文相关音素模型(Triphone)和上下文相关声韵模型(TriIF),并对几种声学基元进行了对比.实验结果表明,对于上下文无关模型,音素和声韵模型都要劣于音节模型,而对于上下文相关模型,Triphone和TriIF模型与音节模型相比,识别性能有了很大提高,其音节误识率分别降低了8.5﹪和23.6﹪.

关键词：语音识别系统声学模型基元选择语音识别基元音素声韵单元

作者: 李净徐明星张继勇郑方吴文虎方棣棠

作者单位: 语音技术中心智能技术与系统国家重点实验室清华大学计算机科学与技术系(北京)

会议类型: 国内会议

会议名称: 第六届全国人机语音通讯学术会议

会议地点: 深圳

会议语种:中文

页码: 267-271

在线出版日期: 2001-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

汉语连续语音识别中声学模型基元比较:音节、音素、声韵母