会议专题

基于声学特征的语音情感识别

语音情感识别是语音处理领域一个具有挑战性并且具有广泛应用前景的研究课题.本文探索了语音情感识别中的关键问题之一:生成情感识别有效的特征表示.我们从四个角度生成了语音信号中的情感特征表示:1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征.2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征.3)声学特征依据声学词典进行转化而得出的特征.4)声学特征转化为高斯超向量的特征.我们通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合.我们比较了不同的声学特征在几个不同语言的情感数据集上的效果.在IEMOCAP数据集上,我们的系统达到了71.9%的正确识别率,超越了之前在此数据集上报告的最好结果.

语音情感识别 声学特征 情感数据集 识别率

陈师哲 金琴 李锡荣 杨刚 许洁萍

中国人民大学信息学院计算机系,北京,中国,100872 中国人民大学信息学院计算机系,北京,中国,100872;中国人民大学数据工程与知识工程教育部重点实验室,北京,中国,100872 中国人民大学数据工程与知识工程教育部重点实验室,北京,中国,100872

国内会议

第十届和谐人机环境联合学术会议

北京

中文

1-7

2014-09-13(万方平台首次上网日期,不代表论文的发表时间)