GPU索引表求交算法的性能分析
索引表求交是搜索引擎进行查询处理中的一个重要操作。在前期工作中,提出了GPU批次索引表求交框架,在这个框架中,若干查询在CPU端组织成为一个批次,并在GPU上同时处理一个批次内的若干查询任务。这个框架可以有效地利用GPU大规模并行计算的能力,在这个框架中的一个关键步骤就是利用GPU进行并行搜索,这个步骤为整个流程中的瓶颈,因此本文主要集中讨论GPU求交算法中使用的搜索算法。本文同时研究了文档重排后对索引表求交算法性能的影响。相比随机编号的索引,大多数的算法在docID按照URL排序的索引上都能达到更好的性能。同时,用CUDAprofiler这个软件分析各种求交算法的性能,并发现docID按照URL排序的索引上的算法具有更少的缓存失效和线程分离次数。
搜索引擎 索引表求交算法 图形处理单元 性能分析
Kebin Wang 王克宾 Fan Zhang 张帆 Gang Wang 王刚 Xiaoguang Liu 刘晓光
College of Information Technical Science,Nankai University,Tianjin 300113,China 南开大学,信息技术科学学院,天津市,300071
国内会议
张家界
中文
1-4
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)