针对快速视频检索的DCT域内基于高斯模型的视频镜头内容代表

摘要：

对于视频检索而言,视频首先被分割为一组镜头,每个镜头由最优的的镜头内容代表应当尽可能多的保留该镜头内所有帧的信息.本文提出一种新的镜头内容代表提取方法,综合考虑帧内空域的频率信息与帧间时域的统计信息.本方法首先将镜头内的每一帧变换到离散余弦变换(DCT)域中,对于DCT域中的不同频率系数,基于一阶高斯模型计算其概率分布的概率参数(均值与标准差),然后以DCT不同频率系数在帧间时域内的分布作为镜头内容表示去描述该镜头.DCT域中的低频分量含有较高的信息量,本方法检索中采用首先基于DCT低频分量粗排序然后逐级累加高频分量精细排序的方案,构成由粗至精的分级快速检索系统.在MPEG-7测试集上进行的实验结果显示该方法的检索准确度优于MPEG-7标准所采用的以阿而法裁减平均直方图(alpha-trimmedaveragehistogram)作为镜头内容表示的方法.

关键词：基于内容视频检索视频镜头代表视频索引 DCT域快速检索平均直方图

作者: 蔡骋谈正

作者单位: 西安交通大学,西安,710049

会议类型: 国内会议

会议名称: 第十二届全国图象图形学学术会议

会议地点: 北京

会议语种:中文

页码: 594-598

在线出版日期: 2005-10-12（万方平台首次上网日期，不代表论文的发表时间）

会议专题

针对快速视频检索的DCT域内基于高斯模型的视频镜头内容代表