基于时间规整网络的GMM说话人识别模型的初始化方法

摘要：

对于与文本无关的说话人识别,一般采用混合高斯模型(GaussianMixtureModel:GMM)来进行识别,在训练GMM模型之前,模型的初始参数必须首先确定.初始化模型参数的有效方法是对训练数据进行分段,训练数据语音帧根据其特征分到M个不同的类中(M为混合数的个数),与初始的M个高斯分量相对应.每个类的均值和方差作为模型的初始化参数。本文根据基于GMM与文本无关说话人识别系统的特性，提出了一种对GMM模型进行初始化的方法。实验结果表明，该方法能够改善基于GMM的与文本无关说话人识别系统的识别率。

关键词：说话人识别混合高斯模型时间规整网络初始化方法

作者: 沈忱章明赵力邹采荣

作者单位: 东南大学无线电系,江苏,南京,210096

会议类型: 国内会议

会议名称: 2005年津、鲁、浙、苏声学学术会议暨全国物理声学学术会议

会议地点: 南京

会议语种:中文

页码: 121-122

在线出版日期: 2005-10-22（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于时间规整网络的GMM说话人识别模型的初始化方法