会议专题

高可扩展的RDF数据存储系统

  由于资源描述框架(resource description framework,RDF)具有表达灵活、简洁等优点,已被接受为表达元数据及万维网上数据互联的规范.近年来,其数据量在以飞快的速度增长.相应地,要求存储RDF数据的系统应具有高扩展性.介绍了一个高可扩展的RDF数据存储系统TripleBit.为尽可能降低存储空间消耗,采用了增量压缩和变长整数编码方法.并采用了数据分块的存储方法,既使得存储管理方便又使得存储结构紧凑,加速了数据读取.系统提供了基于启发式规则的动态查询计划生成方法,所产生的查询计划在执行过程中根据中间结果会相应作调整,以保持最优的执行顺序.对于多变量的查询,使用二步执行策略以减少查询过程中产生的中间结果.与目前流行RDF数据存储系统相比较,在存储空间上RDF-3X比TripleBit至少多40%;在查询性能上,比RDF-3X和MonetDB获得数倍的提升.

数据存储系统 资源描述框架 数据编码 查询处理

Yuan Pingpeng 袁平鹏 Liu Pu 刘谱 Zhang Wenya 张文娅 Wu Buwen 吴步文

Key Laboratory of Services Computing Technology and System(Huazhong University of Science and Techno 服务计算技术与系统教育部重点实验室(华中科技大学) 武汉430074 Key Laboratory of Cluster and Grid Computing of Hubei Province(Huazhong University of Science and Te 集群与网格计算湖北省重点实验室(华中科技大学) 武汉430074 School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 4300 华中科技大学计算机科学与技术学院 武汉430074

国内会议

第29届中国数据库学术会议

合肥

中文

2131-2141

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)