保持音频特征的层次式音频流检索
随着数字技术的发展,在人们的日常生活中产生和积累了大量的包括音频和视频的多媒体数据资料,由于多媒体数据库有着与传统关系型数据不同的特点,使得对多媒体数据的检索和管理比关系型数据更复杂。由于人的视觉皮层感知呈非线性指数响应,本文假定人的听觉皮层也满足这一假设,在此基础上讨论音频流的检索,采用Gabor滤波器在频率空间抽取信号的特征,然后利用能量特征和帧相似性准则在音频样本和音频文件去匹配,由于本文所提的方法在每一频率ω周围进行了多分辨率采样,总合考虑了全局与局部特性,因能准确地检索音频文件。最后应该指出,增加采样深度,设计特定滤波器运用本文所提出的方法可分析音频中的其它特征.
音频特征 音频流检索 多媒体数据库
李晓丽 杜振龙 余冬梅 李明
兰州理工大学电气工程与信息工程学院,兰州,730050
国内会议
厦门
中文
610-612,628
2004-10-14(万方平台首次上网日期,不代表论文的发表时间)