一种基于频谱能量的音调检测算法

摘要：

对人耳掩蔽效应的研究表明掩蔽阈值与音频信号是类音调还是类噪声相关。本文提出了一种新的基于频谱峰值因子的低复杂度不可预测度计算方法,然后利用不可预测度计算信号的音调系数。同时本文提出了一种平滑音调系数的插值后处理算法,该算法解决了瞬时突变噪声引起信号音调检测误判的问题。仿真实验表明本文所提算法的性能优于MPEG心理声学模型Ⅰ和Ⅱ中的音调检测算法,同时运算复杂度较MPEG心理声学模型Ⅱ中音调检测算法降低了80％.

关键词：频谱峰值因子不可预测度音调检测频谱能量心理声学模型

作者: 张勇胡瑞敏高戈

作者单位: 武汉大学国家多媒体软件工程技术研究中心,湖北武汉 430072

会议类型: 国内会议

会议名称: 第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议

会议地点: 杭州

会议语种:中文

页码: 408-413

在线出版日期: 2006-10-31（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于频谱能量的音调检测算法