会议专题

基于时间规整网络的GMM说话人识别模型的初始化方法

对于与文本无关的说话人识别,一般采用混合高斯模型(GaussianMixtureModel:GMM)来进行识别,在训练GMM模型之前,模型的初始参数必须首先确定.初始化模型参数的有效方法是对训练数据进行分段,训练数据语音帧根据其特征分到M个不同的类中(M为混合数的个数),与初始的M个高斯分量相对应.每个类的均值和方差作为模型的初始化参数。本文根据基于GMM与文本无关说话人识别系统的特性,提出了一种对GMM模型进行初始化的方法。实验结果表明,该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。

说话人识别 混合高斯模型 时间规整网络 初始化方法

沈忱 章明 赵力 邹采荣

东南大学无线电系,江苏,南京,210096

国内会议

2005年津、鲁、浙、苏声学学术会议暨全国物理声学学术会议

南京

中文

121-122

2005-10-22(万方平台首次上网日期,不代表论文的发表时间)