会议专题

不确定数据集上的k-Skyline查询

由于数据本身固有的不确定性、采集的随机性及不精确性导致现实应用中产生了大量的不确定数据集.基于概率Skyline的思想,提出了不确定数据集上的k-Skyline查询,用于查询Skyline概率最大的k个对象,并设计了一个高效算法:GIKS(grid indexed k-skyline).GIKS是一个自底向上的网格索引方法,将数据空间分割为多个易于处理的小区域,利用网格的优势分而治之;同时借助索引结构IDM(instances distribution map)实现信息共享,大幅降低时间复杂度.对于实例密度很大的数据集上的k-Skyline查询,提出了自顶向下的BRKS(bounding and refining k-skyline)方法,它以均值评估为基础,利用分层树进行限界求精.详细的理论分析以及大量的实验评估表明GIKS是有效且高效的,且BRKS在大实例密度数据集上有互补优势。

概率Skyline Top-k查询 多标准决策 网格索引结构 不确定数据集 信息共享

李金玖 熊贇 朱扬勇

复旦大学计算机与信息技术系 上海 200433

国内会议

第二十五届中国数据库学术会议(NDBC2008)

桂林

中文

554-561

2008-10-24(万方平台首次上网日期,不代表论文的发表时间)