基于Fermi架构的Join算法
在列数据库中,连接操作依然是最核心和最耗时的操作,GPU 强大的计算能力可为此提供新的优化手段.基于Fermi 架构,文中提出了新的Hash Join 算法和Sort-merge Join 算法,基本思想是充分利用该架构新增的缓存结构,减少连接操作的cache缺失率.在此基础上,采用CUDA stream 技术,在输出结果较多时可以有效隐藏主存与显存间数据传输带来的延迟,进一步提升算法的执行效率.实验结果表明了基于Fermi 架构的Hash Join 算法处理偏斜数据的高效性及Sort-merge Join 算法的稳定性,并且通过比较,这两种算法的性能全面优于基于多核CPU 充分优化的Join 算法,最大加速2.4 倍,在外键分布高偏斜时新的Hash Join 算法的执行速度甚至达到217M 元组每秒.
列数据库 join算法 Fermi架构 缓存结构
Li Guanzhao 李观钊 Chen Sitong 陈思桐 Zhen Zhen 甄真 Chen Hu 陈虎
School of Computer Science and Engineering, South China University of Technology, Guangzhou 510006 华南理工大学 计算机科学与工程学院 广州 510006 School of Software Engineering, South China University of Technology, Guangzhou 510006 华南理工大学 软件学院 广州 510006
国内会议
张家界
中文
1-8
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)