基于混合高斯密度的三音子模型
HMM模型的状态输出概率能否很好地描述实际分布对模型的识别性能有很大的影响.双音子模型下,单高斯的输出概率分布假设业已受到置疑,但大部分三音子模型仍沿用单高斯分布.为了准确考察三音子模型输出概率,本文构造了单高斯和混合高斯密度(GMD)为输出概率的三音子模型,力求通过两种输出概率分布识别效果的比较,以及同双音子模型在两种输出概率条件下实验数据的类比,检验单高斯分布描述的有效性.实验结果表明,采用GMD后平均提升系统性能9﹪以上,且改进效果完全类似于双音子模型,说明GMD能更准确地描述三音子模型的输出概率分布.
语音识别 三音子模型 输出概率 高斯密度
刘玉宇 吴及 王作英
清华大学电子工程系(北京)
国内会议
长沙
中文
76-80
2002-11-01(万方平台首次上网日期,不代表论文的发表时间)