会议专题

表格中字符块的提取

该文讨论了表格文档识别中的一种预处理方法,在表格样本中,表格图角有一定的倾斜,表格内的字符与表格线会有各种情况的粘连与交叉,字符周围有各种复杂的污点干扰,这些都影响了识别系统的准确率,该文针对这些情况进行了分析讨论并提出了一种解决方案,最后通过实验验证了该方法有效性。

表格分析 噪声处理 该文识别

任鲲鹏

信息工程学院OCR室

国内会议

第七届全国汉字识别学术会议

昆明

中文

147~153

1999-10-01(万方平台首次上网日期,不代表论文的发表时间)