一种支持高维数据查询的并行索引机制
提出了一种基于独立特征的并行索引体系结构以检索符合正态分布的高维数据。通过分析并行搜索的多维数据及其复杂度,结合用户设定的维度权重返回待核实的结果,最后通过加权相似度计算函数合并检索结果以完成kNN查询。针对高维数据的异构性特点,给出了规范情景上下文信息数据的算法。通过联合香港大学的2个社区和深圳先进研究院的CNGrid社区进行的测试,证明基于并行检索机制的100NN查询准确率可达93%,在千万个高维数据中的检索时间小于0.7s,结果表明所提出的并行索引机制能有效提高查询效率,尤其适合海量高维数据的有偏组合特征查询。
组合查询 高维数据查询 并行索引机制 位置敏感哈希函数 中国国家网格
王寅峰 刘昊 狄盛 胡昊宇
香港大学计算机系,香港;深圳信息职业技术学院,广东深圳518029 香港大学计算机系,香港
国内会议
北京
中文
156-160
2011-01-15(万方平台首次上网日期,不代表论文的发表时间)