语音识别段分布模型建模方法特性分析
混合密度多项式段模型(Mixture Density Polynomial Segment Models)MDPSM在语音段内利用时变轨迹的概念,准确地描述了特征矢量的动态特性.它的模型参数包括均值轨迹矩阵、残差矩阵和混合权重.本文通过孤立汉语数字的识别任务,对模型参数的物理意义、建模单元的选择、轨迹形状进行了详细分析.实验结果表明,该方法与HMM相比,由于不需要采用差分特征,所以在识别时间和模型所占空间等方面占有一定的优势.
语音识别 段分布模型 语音特征 模型参数估计
张翼燕 刘文举 徐波
中国科学院自动化研究所模式识别国家重点实验室(北京)
国内会议
深圳
中文
285-289
2001-11-20(万方平台首次上网日期,不代表论文的发表时间)