会议专题

“原文重现”的自动电子出版系统

该文介绍了一个自动电子出版系统,此系统用于完全自动地将已存在的印刷品转换成为机器可读并可以直接用于CD-ROM出版或网上出版的电子文档格式。在这个系统中,除文字识别OCR技术外,最重要的问题还有版面分析、版面理解和版面恢复。作者们讨论了版面分析和版面理解的研究现状并介绍了一些算法,比较了几种电子出版业常用的文件格式并得出了适于版面恢复的格式。最后,作者们给出了一个实验系统,这个系统显示了比较好的结果。

版面分析 版面理解 版面恢复

陈明 丁晓青

大学电子工程系(北京)

国内会议

1998中文信息处理国际会议

北京

中文

536~541

1998-09-01(万方平台首次上网日期,不代表论文的发表时间)