会议专题

基于韵律语段的语音情感识别方法研究

语音情感识别领域提取情感特征时,普遍采用”不同情感类别,相同时长基准”的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。实验表明,使用敏感韵律段特征的系统识别率达到67.9”%”,与使用定长语段特征相比有了很大的提高。

情感特征 敏感韵律段长 韵律语段 Elman神经网络 语音情感识别 多分类器识别

韩文静 李海峰

哈尔滨工业大学 计算机科学与技术学院,哈尔滨 150001

国内会议

第十届全国人机语音通讯学术会议

乌鲁木齐

中文

271-275

2009-08-14(万方平台首次上网日期,不代表论文的发表时间)