会议专题

基于LSH的时间子序列查询算法

  子序列的相似性查询是时间序列数据集中的一种重要操作,包括范围查询和k近邻查询。现有的大多算法是基于欧几里德距离或者DTW距离的,缺点在于查询效率低下。文中提出了一种新的基于LSH的距离度量方法,可以在保证查询结果质量的前提下,极大提高相似性查询的效率;在此基础上,给出一种DS-Index索引结构,利用距离下界进行剪枝,进而还提出了两种优化的OLSH-Range和OLSH-kNN算法。实验是在真实的股票序列集上进行的,数据结果表明算法能快速精确地找出相似性查询结果。

时间序列数据库 相似性查询 索引结构 计算方法

TANG Chun-Lei 汤春蕾 DONG Jia-Qi 董家麒

School of Computer Science, Fudan University, Shanghai 200433 复旦大学计算机科学技术学院 上海 200433

国内会议

第29届中国数据库学术会议

合肥

中文

2228-2236

2012-10-01(万方平台首次上网日期,不代表论文的发表时间)