会议专题

一种基于频谱能量的音调检测算法

对人耳掩蔽效应的研究表明掩蔽阈值与音频信号是类音调还是类噪声相关。本文提出了一种新的基于频谱峰值因子的低复杂度不可预测度计算方法,然后利用不可预测度计算信号的音调系数。同时本文提出了一种平滑音调系数的插值后处理算法,该算法解决了瞬时突变噪声引起信号音调检测误判的问题。仿真实验表明本文所提算法的性能优于MPEG心理声学模型Ⅰ和Ⅱ中的音调检测算法,同时运算复杂度较MPEG心理声学模型Ⅱ中音调检测算法降低了80%.

频谱峰值因子 不可预测度 音调检测 频谱能量 心理声学模型

张勇 胡瑞敏 高戈

武汉大学国家多媒体软件工程技术研究中心,湖北武汉 430072

国内会议

第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议

杭州

中文

408-413

2006-10-31(万方平台首次上网日期,不代表论文的发表时间)