会议专题

一种用于声道长度归一化的频率折叠技术

本文提出了一种新的VTLN方法.首先基于不同人群的平均第三共振峰求得频率折叠因子,采用双线性变换对Mel滤波器组的位置和宽度进行折叠,从而获得声道归一化的特征矢量.该方法避免了对折叠因子α的线性搜索,同时还利用了双线性变换使折叠的频谱连续且无带宽改变的优点.在元音和孤立洞的识别中对该方法进行了性能测试,并和非线性频率折叠和巴克双线性变换法进行了比较.结果表明用本文的声道长度归一化技术对MFCC参数进行变换后,男性元音样本训练的基线系统对女性元音数据的识别率提高了11.67﹪;男性青年的语音样本训练的基线系统对女性青年和儿童的孤立词识别率分别增加了19.5﹪和13﹪.

语音识别 声道长度归一化 双线性变换 平均第三共振峰

徐望 王炳锡 丁琦

解放军信息工程大学(郑州)

国内会议

2003年通信理论与信号处理年会

重庆

中文

982-982

2003-10-01(万方平台首次上网日期,不代表论文的发表时间)