基于NN-HMM模型和语种无关PRLM的自动语种识别
NIST多年的评测表明,基于并行音素识别(PPRLM)的方法取得了很好的性能,本文提出了一种基于Multilingual音素和NN-HMM混合模型PRLM识别方法的自动语种识别系统。由于音素识别器建模能力有限,本文引入基于NN-HMM混合模型的方法用于音素识别。系统中Multilingual音素集是使用基于数据驱动聚类获得。通过真实环境电话语音测试表明,基于NN-HMM混合模型的PPRLM性能比传统的基于HMM的PRLM高5”%”-10”%”,同时由于Multilingual音素识别的引入,在只使用了很少的识别时间的情况下,获得了跟PPRLM系统可比的识别正确率。同时经过与PPRLM系统融合后,获得了更好的性能。
并行音素识别 语种识别 NN-HMM模型 数据驱动聚类
王士进 梁加恩 徐波
中国科学院自动化研究所
国内会议
乌鲁木齐
中文
118-122
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)