印刷体中文文档识别系统的研究
本文主要介绍包含公式识别功能的印刷体中文文档识别系统.该系统能够进行含有汉字、公式、表格和图形的中文文档识别,能够将无法修改内容的文档图像转化成可编辑的电子文档.本文分析了文档图像预处理、版面分析以及汉字识别和公式识别模块的实现方法,重点讨论了对公式的识别及输出,通过实例说明了本系统的识别能力.
版面分析 汉字识别 公式识别 印刷体 中文文档 识别系统 电子文档
王科俊 陈卉
哈尔滨工程大学 自动化学院,哈尔滨 150001
国内会议
北京
中文
305-310
2009-04-01(万方平台首次上网日期,不代表论文的发表时间)