会议专题

内存列存储数据库中优化的混合自适应索引

分析型数据库在现代企业中得到广泛应用,在使用过程中对查询处理速度的要求逐渐增强.大数据环境下,分析型数据库面临一系列新的挑战:首先,数据复杂性与日俱增,使得数据库系统的初始配置任务更加繁重,例如索引创建等;其次,在分析过程中,由于查询负载模式无法预知,需要对某些属性反复构建索引,以满足查询的时间要求.显然,传统的索引构建维护技术不能完全满足新的应用环境.数据库分裂技术提出了一种不同的策略去解决这些问题.使用数据库分裂技术,DBA不需要对数据库进行细粒度的系统配置.在查询执行过程中,数据库能自动调整以适应查询负载;随着查询负载的变化,系统自动调整索引.近年来,一系列数据库分裂算法被提出,但已有的算法都各有优缺点.在本文给出了一个cacheconscious的数据库分裂代价模型,并基于模型构建了一个新的自适应索引,可以综合不同数据库分裂算法的优势.通过大量实验验证了这种新自适应索引技术的有效性.

现代企业 内存列存储数据库 混合自适应索引 代价模型 优化分析

薛忠斌 周烜 张延松 吴欣 周新 王珊

教育部数据工程与知识工程重点实验室(中国人民大学),北京 100872;中国人民大学 信息学院,北京 100872

国内会议

2014全国高性能计算学术年会

广州

中文

317-324

2014-11-06(万方平台首次上网日期,不代表论文的发表时间)