基于最大互信息的Delta相位谱参数确定方法
目前多数说话人识别算法的研究着眼于从语音短时傅里叶变换幅度谱中提取个性化特征,而相位信息往往被忽略。本文针对基于短时相位谱提取特征时,帧长和帧移参数的选取仅依赖于经验分析而缺乏有效理论依据的现状,本文提出依据最大互信息准则确定最优参数的算法.算法介绍以Mel频率Delta相位倒谱系数为例,兼顾提高相位突变检测能力和降低相位噪声两方面的目标.实验结果表明,采用最大互信息准则确定帧长和帧移参数的说话人识别系统性能明显优于由经验分析所得参数的系统测试结果,验证了所提算法的有效性和可靠性。
说话人识别 最大互信息 Delta相位谱 参数分析
虢明 王金芳
吉林大学通信工程学院,长春130012
国内会议
第十六届全国图象图形学学术会议 暨第六届立体图象技术学术研讨会
长春
中文
803-807
2012-07-30(万方平台首次上网日期,不代表论文的发表时间)