会议专题

基于音频语谱图像识别的广告检索技术

  随着我国广播电视事业的快速发展,对广播电视进行广告监测的重要性越来越突出。本文提出了一种基于音频语谱图像识别的广告检索方法,该方法把每个广告片段的音频转换成语谱图像,并通过boosting训练算法,从中提取可区分的、适合索引的特征以训练分类器。检索时,通过特征对齐,采用基于EM的迭代方法识别最匹配的广告。 实验结果表明,该方法可以快速准确地从广播电视中检索到广告,而且具有很好的鲁棒性,基于该方法开发的广播 电视广告监测系统已经得到了实地应用。

广告检索 语谱图像 图像识别 图像处理

姜洪臣 任晓磊 赵耀宏 徐波

中国科学院自动化所 数字内容技术与系统研究中心,北京 100190 北京交通大学 软件学院,北京 100044

国内会议

第十一届全国人机语音通讯学术会议

西安

中文

1-4

2011-10-16(万方平台首次上网日期,不代表论文的发表时间)