会议专题

基于人耳听觉特性的谱能量特征在情感语音识别中的研究

  本文以语音产生的非线性模型为基础,研究了用于情感语音分类的语音信号能量谱包络下的面积(AUSEES, Area Under the Spectral Energy Envelope of the Speech Signal)和声门波形能量谱包络下的面积(AUSEEG, Area Under the Spectral Energy Envelope of the Glottal Waveform)两种谱能量特征。用模拟人耳听觉特性的Bark尺度频带划分方法对基本的 AUSEES、AUSEEG 特征中的线性平均划分方法进行了改进,生成了基于人耳听觉特性的谱能量AUSEES-Bark、 AUSEEG-Bark特征。将AUSEES-Bark、AUSEEG-Bark特征应用到情感语音识别中,试验的结果表明,改进后的特征识别率有了较大的提高,具有更好的情感分类效果。

情感语音 语音识别 非线性模型 数理语言学

孙颖 阴杰敏 张雪英

太原理工大学 信息工程学院信息系,太原 030024

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-5

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)