会议专题

一种面向不完整数据流上的k-支配skyline查询算法

skyline查询是数据挖掘一个重要的研究方向,在基于数据的决策支持等应用中有着重要的作用.由于现实应用中存在着大量的不完整数据流,但大多数现有的skyline查询算法都依赖于如下的假设:1)任意数据点的所有维度值都是已知的;2)数据集是稳定、有界的并且可以随意访问.此外,随着数据维度的增加,skylime数据点的个数会变得过多,因此引入了k-支配skyline的概念,但是不完整数据的k-支配关系并不具有传递性,现有的skylime查询算法都无法适用.基于这些问题,考虑到数据流高维、无界、顺序性的特点,并且在某些维度上可能具有缺失值的特性,提出了一种新的基于滑动窗口的不完整数据流的k-支配skyline查询算法,实验结果表明,算法不仅可以支持不完整数据流上的k-支配skyline计算,并能够保证效率和性能.

skyline查询算法 k-支配 不完整数据流 滑动窗口 数据挖掘

廖再飞 罗雄飞 吕新杰 李新 刘伟 王宏安

中国科学院软件研究所 北京 100190 中国科学院研究生院 北京 100049 山东大学计算机科学与技术学院 济南 250101 中国科学院软件研究所 北京 100190

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

254-262

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)