会议专题

基于主维过滤的高维数据索引

高效的数据过滤是减少距离函数计算次数的捷径。提出了一种高效处理高维数据的索引算法一在主成分分析的基础上,利用第一主成份的组合方差最大的特点,选取第一主成分为主维,结合三角不等式完成数据过滤。实现分级索引,构成一种基于主维过滤的索引结构-PK-Tree。用方差覆盖权对第一主成分的信息保持量做了定量分析,并与已有算法进行了实验比较,得出了M+-Tree的距离比较次数近于PK-Tree的二倍等结论,验证了PK-Tree在降低CPU开销、提高检索速度方面的实效性。

方差覆盖权 高维索引 三角不等式 主维过滤

李仲生 李仁发 禹亮

湖南大学计算机与通信学院 4100521 邵阳学院信息工程系 422000 湖南大学计算机与通信学院 4100521

国内会议

2010年中国计算机大会

杭州

中文

128-138

2010-10-11(万方平台首次上网日期,不代表论文的发表时间)