一种时域到心理声学频域变换的研究
双耳听觉技术是近年来国内外音频技术发展的一个热点。2003年,Faller提出一种FFT框架下的基于双耳信息的多声道音频压缩算法(BCC),在将多声道的信号压缩成单声道信号的同时,提取声道之间影响人的空间听觉感知的参数作为边信息,经常规的编解码器进行编解码,极大的降低了传输数据量,并且保存了相应的空间信息。本文利用非均匀的离散傅立叶变换(NDFT)将时域信号变换到心理声学频域,实现听觉子带的均匀划分,提高了中低频子带的参数估计精度,尝试改进BCC算法的空间感知效果。本文第二部分介绍了相关的心理声学基础;第三部分引入了NDFT;具体的变换方式将在第四部分提出:第五部分给出了该变换方式应用于BCC后得到的主观测试结果;第六部分给出结论。
心理声学 频域变换 双耳听觉 音频压缩算法
仇波 吕亚东 杨军
中国科学院声学研究所声场声信息国家重点实验室,北京,100080
国内会议
上海
中文
390-391
2008-10-21(万方平台首次上网日期,不代表论文的发表时间)