会议专题

语音识别段分布模型建模方法特性分析

混合密度多项式段模型(Mixture Density Polynomial Segment Models)MDPSM在语音段内利用时变轨迹的概念,准确地描述了特征矢量的动态特性.它的模型参数包括均值轨迹矩阵、残差矩阵和混合权重.本文通过孤立汉语数字的识别任务,对模型参数的物理意义、建模单元的选择、轨迹形状进行了详细分析.实验结果表明,该方法与HMM相比,由于不需要采用差分特征,所以在识别时间和模型所占空间等方面占有一定的优势.

语音识别 段分布模型 语音特征 模型参数估计

张翼燕 刘文举 徐波

中国科学院自动化研究所模式识别国家重点实验室(北京)

国内会议

第六届全国人机语音通讯学术会议

深圳

中文

285-289

2001-11-20(万方平台首次上网日期,不代表论文的发表时间)