会议专题

流式文档到固定版式文档的可逆转换方法研究

分析以往流式文档和固定版式文档一体化处理方法的局限,提出一种可逆转换方法,即将文档的转换信息记录于目标文档中,以便用于源文档的重构.论述了可逆转换的原理、关键技术、实验结果以及技术优势.选择标文通(UOF)作为流式文档格式,CEBX作为固定版式文档格式,利用该方法成功地实现标文通文档到CEBX文档的可逆转换,实验结果表明,该方法取得较好的效果.

文档处理 选择标文通 公共电子文档 可逆转换法

李宁 刘寅 梁琦 冯雪

北京信息科技大学计算机学院,北京100101;数字出版技术国家重点实验室,北京100871

国内会议

第三届CCF国际自然语言处理与中文计算会议

深圳

中文

203-212

2014-12-05(万方平台首次上网日期,不代表论文的发表时间)