一种基于聚类的视频字幕提取方法
本文针对现有方法的不足提出了一种视频中字幕提取的方法。本方法采用多尺度文字定位,并加上文字区域精确化,得到文字区域后运用改进的 K 均值聚类方法对其中的象素点进行聚类,获得二值化的图像,最后用OCR软件识别得到文字。本方法应用于网络视频敏感词语检测具有良好的效果,实验证明了该方法的有效性。
文字提取 OCR识别 K均值聚类
宋砚 颜成钢 刘安安 庞琳 张勇东 唐胜 林守勋
中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所 智能信息处理重点实验室,北京 100190 中国科学院研究生院,北京 100049 山东大学威海分校,山东 264209 中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所,虚拟现实技术实验室,北京 100190 中国科学院计算技术研究所 智能信息处理重点实验室,北京 100190
国内会议
深圳
中文
99-104
2008-04-07(万方平台首次上网日期,不代表论文的发表时间)