会议专题

新型汉语耳语音频率尺度在说话人识别中的应用

  本文采用滤波器组分析的方法对汉语耳语音的频率特性进行了研究。结果表明在汉语耳语音说话人识别中,第一和第三共振峰的作用远大于其他频段。实验表明,800-1200赫兹和2800-3200赫兹对于区分耳语说话人是最重要的频率范围。在此基础上,本文提起了一个新的频率尺度——耳语音敏感尺度(WSS)以取代通常使用的Mel尺度,并以此提取耳语音信号的倒频谱系数。实验表明,新的特征倒谱参数在解决汉语耳语音说话人识别问题上优于传统方法。

汉语耳语音 滤波器组 耳语敏感特性 说话人识别 频率尺度 倒频谱系数

林玮

南京航空航天大学理学院,南京,210016

国内会议

2011中国西部声学学术交流会

银川

中文

251-254

2011-08-01(万方平台首次上网日期,不代表论文的发表时间)