静态低分辨率长微博图片的文字提取效果对比分析
长微博图片是近年来出现的微博信息形式,对其进行文字提取对社交网络信息传播规律的分析具有重要意义,但目前尚缺乏针对静态低分辨率长微博图片的文字提取效果的对比分析。本文针对6种主流长微博生成工具进行分析,将主流长微博图片分为8种主要类型,并利用6种典型OCR工具进行测试。实验结果表明,现有OCR技术对长微博图片的平均识别率达到90%以上,但对于常见的复杂类型长微博识别率较低,亟待研究针对性的长微博图片文字提取方法。
长微博图片 静态低分辨率 文字提取 效果评估
Zhao Lei 赵磊 Guo Jing 郭晶 Wu Xiao 吴潇
Renzixing Network Technology Co., Ltd. 100029 任子行 网络技术股份有限公司 100029 CNCERT/CC 100029 国家计算机网络应急技术处理协调中心 100029
国内会议
北京
中文
149-155
2013-03-01(万方平台首次上网日期,不代表论文的发表时间)