一种压缩XML数据仓库的存储策略
本文提出了一种基于PCG存储的压缩XML数据仓库的存储策略,这种方法适合于大量的可能具有较相近内容的XML形式的文档,比如历史数据,从Web上提取的数据。方法的核心是将文档根据其编辑距离进行聚类,对每一个聚类中按照“中心十其他文档到中心的变化”的方式进行存储,本文还研究了在这种逻辑的存储模型下的物理存储策略以及数据管理的方法.
压缩XML数据仓库 存储策略 XML文档 文档聚类图
王宏志 李建中 何震瀛
哈尔滨工业大学计算机科学与工程系,哈尔滨,150001
国内会议
郑州
中文
16-18
2002-08-26(万方平台首次上网日期,不代表论文的发表时间)