会议专题

文字自动提取及其在视频索引和检索中的应用

视频中的文字作为一种高级语义特征,对视频内容的理解、索引、检索具有重要作用.本文提出了一种数字视频文字自动提取的方法,提取出的二值文字图像可输入到标准OCR软件包,得到文字的ASCII码表示.该方法充分利用视频流中YCbCr各分量中蕴含的信息,并且压缩域分析和空域分析相结合,以达到速度和精度的较好折衷.本文还实现了利用提取的文字做视频索引和检索的一个原型系统.实验结果表明,该文字提取方法能达到很高的正确率和速度.

文字提取 二值化 OCR 视频索引

卿来云 王伟强 高文

中国科学院,研究生院,计算机学部,北京,100039 中国科学院,计算技术研究所,数字化室,北京,100080 中国科学院,研究生院,计算机学部,北京,100039;中国科学院,计算技术研究所,数字化室,北京,100080;哈尔滨工业大学,计算机科学与工程系,哈尔滨,150001

国内会议

中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会

四川广元

中文

239-246

2002-07-13(万方平台首次上网日期,不代表论文的发表时间)