一种基于DDBHMM的利用帧间相关性的混合模型
尽管作为当前最为流行的语音识别模型,HMM由于采用了状态输出独立同分布假设,忽略了对语音现象中固有的时间相关性的描述.本文引入了一个更为灵活的语音描述统计框架——广义DDBHMM,并在此基础上提出了一种混合模型,采用将语音特征静态信息和动态变化信息分别描述又有机结合在一起的方式,以较小的计算代价更好地刻划了真实的语音特征.汉语大词汇量非特定人连续语音识别的实验表明,通过利用帧间相关性,这种混合模型使识别系统的性能得到了明显改善.
语音识别模型 时间相关性 语言特征混合模型
欧智坚 王作英
清华大学电子工程系语音实验室
国内会议
深圳
中文
277-280
2001-11-20(万方平台首次上网日期,不代表论文的发表时间)