会议专题

MLLR特征的SVM语种识别算法

为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。本文比较了均值方差和排序两种归一化方法,并将本文提出的多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明,排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7”%”的提升,并与GMM分类器有很强的互补性。

语种识别 最大似然线性回归 支持向量机 语种训练 Gauss混合模型

钟山 刘加

清华大学 电子工程系,北京 100084

国内会议

第十届全国人机语音通讯学术会议

乌鲁木齐

中文

24-28

2009-08-14(万方平台首次上网日期,不代表论文的发表时间)