一种基于Gammatone滤波和FrFT的抗噪语音识别方法
人耳听觉系统在噪声条件下具有自动语音识别(ASR)系统无法比拟的优良性能,将代表人耳时频处理特性的听觉模型应用到ASR系统中有望提高系统性能。语音信号是一种非平稳信号,而分数阶Fourier变换(FrFT)在处理调频信号方面有着独特的优势。本文采用Gammatone滤波器组对语音进行前端时域滤波,之后将每个子带信号依chirp假设应用FrFT来提取声学特征,FrFT的变换阶数由模糊函数自适应地计算得到。在干净与混噪的汉语孤立数字库上进行的识别实验结果表明,所提特征性能比MFCC有大幅度的提高。
语音识别 Gammatone滤波 分数阶Fourier变换 模糊函数 时频处理 听觉模型
尹辉 谢湘 匡镜明
北京理工大学信息科学技术学院电子工程系,北京 100081
国内会议
乌鲁木齐
中文
62-65
2009-08-14(万方平台首次上网日期,不代表论文的发表时间)