会议专题

面向真实情感识别的训练语音选择研究

  在实际应用语音情感识别系统时,测试语音与模型的训练语音在情感产生方式上往往存在很大差异。本文对比了三种情感产生方式(非专业人员模仿特定情感、专业演员表演特定情感与生活中普通人表达真实情感)对应的系统性能。得出对于面向应用的语音情感识别,情感的产生方式是至关重要的;普通人表达出的真实情感语音对应的系统性能要远优于其它两种产生方式,识别率可达到77.35%;专业演员表演的情感语音可达到近50%的识别率;非专业人员的模仿语音可用性很差,识别率近35%。

情感语音 语音识别 GMM超向量 数理语言学

戴明洋 杨大利 徐明星 张永超 陈胜

北京信息科技大学 计算机学院,北京 100101 普适计算教育部重点实验室 清华信息科学与技术国家实验室(筹)清华大学计算机科学与技术系,北京 100084

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-5

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)