基于双层PDF技术的文档电子化研究
PDF格式文件目前己成为数字化信息事实上的一个工业标准,它的跨媒体、跨平台、安全性使其在文档电子化中应用越来越广泛,对其研究显得日益重要.针对使用双层PDF文档电子化技术实现的文档管理手段,不仅可以有效保存纸质文档的原始面貌,还可以借助第二层文档的结构化数据进行查找、批注、修改和加密等操作,是目前企业解决文档电子化的有效方法.如何生成双层PDF文件在国内研究的较少,本文探讨了双层PDF文件的生成方法,详细介绍了双层PDF文件格式、特点及应用,包括图像预处理、特征提取、字符分割、图像分类、版面分析等。
文档电子化 双层PDF文件 图像预处理 特征提取 版面分析
张硕 王幸元
吉林油田公司科技与信息处,吉林松原138000 吉林油田公司地球物理勘探研究院,吉林松原138000
国内会议
长春
中文
571-573
2016-11-01(万方平台首次上网日期,不代表论文的发表时间)