不确定数据集上的k-Skyline查询
由于数据本身固有的不确定性、采集的随机性及不精确性导致现实应用中产生了大量的不确定数据集.基于概率Skyline的思想,提出了不确定数据集上的k-Skyline查询,用于查询Skyline概率最大的k个对象,并设计了一个高效算法:GIKS(grid indexed k-skyline).GIKS是一个自底向上的网格索引方法,将数据空间分割为多个易于处理的小区域,利用网格的优势分而治之;同时借助索引结构IDM(instances distribution map)实现信息共享,大幅降低时间复杂度.对于实例密度很大的数据集上的k-Skyline查询,提出了自顶向下的BRKS(bounding and refining k-skyline)方法,它以均值评估为基础,利用分层树进行限界求精.详细的理论分析以及大量的实验评估表明GIKS是有效且高效的,且BRKS在大实例密度数据集上有互补优势。
概率Skyline Top-k查询 多标准决策 网格索引结构 不确定数据集 信息共享
李金玖 熊贇 朱扬勇
复旦大学计算机与信息技术系 上海 200433
国内会议
桂林
中文
554-561
2008-10-24(万方平台首次上网日期,不代表论文的发表时间)