会议专题

一种实时数据仓库中海量数据高效分区算法

数据库分区技术采用”分而治之”的策略来降低管理海量数据复杂性,提升系统性能,其中以区间分区最为常用。实时数据仓库通常要求迅速地对数据仓库数据进行分区以满足实时性要求.常规的区间分区算法的时间复杂度随着分区个数增加而线性增长,不适合海量数据实时分区的要求.为提高海量数据的分区速度,研究了现有数据库分区算法,提出了一种有效的针对海量数据的非等数据量的区间分区算法NEP,该算法通过允许各分区的数据量在小范围内浮动等改进策略提高分区效率。实验结果表明,该算法与目前常用分区算法相比,能大幅度地减少运算时间,与传统算法比较,在大规模实时分区的情况下有明显优势。

实时数据仓库 数据库分区 海量数据 水平分区 区间分区算法 非等数据量分区

张峰 宋杰 周德友 王大玲 鲍玉斌 于戈

国家海洋信息中心 天津 300171 东北大学信息科学与工程学院 沈阳 110004

国内会议

第二十五届中国数据库学术会议(NDBC2008)

桂林

中文

569-574

2008-10-24(万方平台首次上网日期,不代表论文的发表时间)