会议专题

非线性频谱变换的说话人识别性能分析

本文分析非线性频谱变换对说话人识别系统性能的影响.首先对反映人耳听觉感知特性的三种典型非线性频谱变换,即Mel尺度频谱变换、BARK尺度频谱变换和ERB尺度频谱变换特性进行了分析与描述,并在频率变换域提取语音信号的倒谱特征,分析相应的说话人识别系统性能.实验结果表明,Mel频率倒谱系数并不是表征说话人特征的最优特征参数,在很多情况下,基于BARK尺度的特征参数更优.

语音识别 频谱变换 听觉感知 语音信号

袁冬梅 俞一彪 颜祥 戴志强

苏州大学电子信息学院,苏州市干将东路178号,苏州,215021

国内会议

2006和谐开发中国西部声学学术会议

四川都江堰

中文

160-163

2006-08-14(万方平台首次上网日期,不代表论文的发表时间)