会议专题

共振峰瞬时频率特征用于说话人识别

  本文提出了一种新的共振峰瞬时特征(formant instantaneous characteristics,FIC)的提取方法并用于说话人识别。Hilbert-Huang 变换(HHT) 是分析非平稳信号的有力工具,利用HHT 分析语音信号共振峰处的时变信息,提取FIC 参数。由于共振峰瞬时频率反映了说话人的声道个性特点及声道与声门作用的结果,与传统的方法比较,本文提出的方法可以更准确地描述共振峰瞬时频率。本文的FIC 与MFCC 构成组合参数,应用在基于高斯混合模型(GMM)的说话人识别系统中进行实验,正确识别率可提高11.96% 。实验结果说明共振峰的瞬时频率对语音信号的幅度频谱有补偿作用。

共振峰 瞬时频率特征 说话人识别

侯丽敏 谢娟敏

上海大学通信与信息工程学院 200072

国内会议

第九届中国语音学学术会议

天津

中文

333-337

2010-05-28(万方平台首次上网日期,不代表论文的发表时间)