非线性频谱变换的说话人识别性能分析
本文分析非线性频谱变换对说话人识别系统性能的影响.首先对反映人耳听觉感知特性的三种典型非线性频谱变换,即Mel尺度频谱变换、BARK尺度频谱变换和ERB尺度频谱变换特性进行了分析与描述,并在频率变换域提取语音信号的倒谱特征,分析相应的说话人识别系统性能.实验结果表明,Mel频率倒谱系数并不是表征说话人特征的最优特征参数,在很多情况下,基于BARK尺度的特征参数更优.
语音识别 频谱变换 听觉感知 语音信号
袁冬梅 俞一彪 颜祥 戴志强
苏州大学电子信息学院,苏州市干将东路178号,苏州,215021
国内会议
四川都江堰
中文
160-163
2006-08-14(万方平台首次上网日期,不代表论文的发表时间)