会议专题

语音情感识别中UBM 训练集的组成研究

  语音情感识别中训练模型的数据组成是模型性能的关键。本文在基于以高斯超向量为特征的SVM识别理论框架下考察什么样的数据用于训练UBM最为合适,这其中的主要因素有哪些?本文从五个方面考察UBM训练集的选取标准,通过实验对比了其对于语音情感识别系统性能的影响,实验结果表明高斯混合数的不同对系统性能影响最强,信道次之,包含的情感类型与语种因素的影响程度弱于信道,但强于时长因素,为研究中对训练集的选取与模型的训练提供了依据。

情感语音 语音识别 高斯模型 数理语言学

戴明洋 杨大利 徐明星

北京信息科技大学 计算机学院,北京 100101 普适计算教育部重点实验室 清华信息科学与技术国家实验室(筹)清华大学计算机科学与技术系,北京100084

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-5

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)