基于时间规整网络的GMM说话人识别模型的初始化方法
对于与文本无关的说话人识别,一般采用混合高斯模型(GaussianMixtureModel:GMM)来进行识别,在训练GMM模型之前,模型的初始参数必须首先确定.初始化模型参数的有效方法是对训练数据进行分段,训练数据语音帧根据其特征分到M个不同的类中(M为混合数的个数),与初始的M个高斯分量相对应.每个类的均值和方差作为模型的初始化参数。本文根据基于GMM与文本无关说话人识别系统的特性,提出了一种对GMM模型进行初始化的方法。实验结果表明,该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。
说话人识别 混合高斯模型 时间规整网络 初始化方法
沈忱 章明 赵力 邹采荣
东南大学无线电系,江苏,南京,210096
国内会议
南京
中文
121-122
2005-10-22(万方平台首次上网日期,不代表论文的发表时间)