语音识别段分布模型建模方法特性分析

摘要：

混合密度多项式段模型(Mixture Density Polynomial Segment Models)MDPSM在语音段内利用时变轨迹的概念,准确地描述了特征矢量的动态特性.它的模型参数包括均值轨迹矩阵、残差矩阵和混合权重.本文通过孤立汉语数字的识别任务,对模型参数的物理意义、建模单元的选择、轨迹形状进行了详细分析.实验结果表明,该方法与HMM相比,由于不需要采用差分特征,所以在识别时间和模型所占空间等方面占有一定的优势.

关键词：语音识别段分布模型语音特征模型参数估计

作者: 张翼燕刘文举徐波

作者单位: 中国科学院自动化研究所模式识别国家重点实验室(北京)

会议类型: 国内会议

会议名称: 第六届全国人机语音通讯学术会议

会议地点: 深圳

会议语种:中文

页码: 285-289

在线出版日期: 2001-11-20（万方平台首次上网日期，不代表论文的发表时间）

会议专题

语音识别段分布模型建模方法特性分析