一种基于聚类的视频字幕提取方法

摘要：

本文针对现有方法的不足提出了一种视频中字幕提取的方法。本方法采用多尺度文字定位,并加上文字区域精确化,得到文字区域后运用改进的 K 均值聚类方法对其中的象素点进行聚类,获得二值化的图像,最后用OCR软件识别得到文字。本方法应用于网络视频敏感词语检测具有良好的效果,实验证明了该方法的有效性。

关键词：文字提取 OCR识别 K均值聚类

作者: 宋砚颜成钢刘安安庞琳张勇东唐胜林守勋

作者单位: 中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所智能信息处理重点实验室,北京 100190 中国科学院研究生院,北京 100049 山东大学威海分校,山东 264209 中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所智能信息处理重点实验室,北京 100190

会议类型: 国内会议

会议名称: 2008中国计算机网络安全应急年会(信息内容安全分会)

会议地点: 深圳

会议语种:中文

页码: 99-104

在线出版日期: 2008-04-07（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种基于聚类的视频字幕提取方法