汉语连续语音识别中声学模型基元比较:音节、音素、声韵母
本文研究的是汉语连续语音识别中声学模型基元的选择问题.根据汉语语音的特点,本文分别采用音节、音素和声韵母等三种语音识别基元进行声学建模.为了描述连续语音中的协同发展现象,本文针对音素和声韵基元,设计了相应的问题集,利用基于决策树的状态共享策略建立了上下文相关音素模型(Triphone)和上下文相关声韵模型(TriIF),并对几种声学基元进行了对比.实验结果表明,对于上下文无关模型,音素和声韵模型都要劣于音节模型,而对于上下文相关模型,Triphone和TriIF模型与音节模型相比,识别性能有了很大提高,其音节误识率分别降低了8.5﹪和23.6﹪.
语音识别系统 声学模型基元选择 语音识别基元 音素 声韵单元
李净 徐明星 张继勇 郑方 吴文虎 方棣棠
语音技术中心 智能技术与系统国家重点实验室 清华大学计算机科学与技术系(北京)
国内会议
深圳
中文
267-271
2001-11-20(万方平台首次上网日期,不代表论文的发表时间)