针对快速视频检索的DCT域内基于高斯模型的视频镜头内容代表
对于视频检索而言,视频首先被分割为一组镜头,每个镜头由最优的的镜头内容代表应当尽可能多的保留该镜头内所有帧的信息.本文提出一种新的镜头内容代表提取方法,综合考虑帧内空域的频率信息与帧间时域的统计信息.本方法首先将镜头内的每一帧变换到离散余弦变换(DCT)域中,对于DCT域中的不同频率系数,基于一阶高斯模型计算其概率分布的概率参数(均值与标准差),然后以DCT不同频率系数在帧间时域内的分布作为镜头内容表示去描述该镜头.DCT域中的低频分量含有较高的信息量,本方法检索中采用首先基于DCT低频分量粗排序然后逐级累加高频分量精细排序的方案,构成由粗至精的分级快速检索系统.在MPEG-7测试集上进行的实验结果显示该方法的检索准确度优于MPEG-7标准所采用的以阿而法裁减平均直方图(alpha-trimmedaveragehistogram)作为镜头内容表示的方法.
基于内容 视频检索 视频镜头代表 视频索引 DCT域 快速检索 平均直方图
蔡骋 谈正
西安交通大学,西安,710049
国内会议
北京
中文
594-598
2005-10-12(万方平台首次上网日期,不代表论文的发表时间)