会议专题

基于树结构索引的带权值字符串的Top-k查询算法

  在一个字符串集合中,通过一些字符串的相似性函数寻找与查询字符串相似的字符串集合被称为字符串的近似查找。这种查找常应用于数据库、信息检索等各个领域。但是在某些特定的情况下,需要考虑字符串在查询中的重要性,即权值。针对这种同时考虑字符串相似性与权重的查询,在字符串集合中选择最佳的查询结果。首先提出了一个分为两步的Dtree算法处理这样的查询,并在两个步骤中设计了基于树状的索引结构来支持这样的查询。在真实的数据集上进行了实验,实验结果表明该算法优于传统的基于倒排表索引结构的Top-k查询算法。

信息处理 Top-k查询算法 索引结构 字符串技术

Tong Xing 佟星 Wang Hongzhi 王宏志 Li Jianzhong 李建中 Gao Hong 高宏

School of computer Science and Technology, Harbin Institute of Technology, Harbin 150001 哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001

国内会议

第29届中国数据库学术会议

合肥

中文

79-85

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)