不完整数据上高效Skyline查询处理算法
skyline查询是一种典型的偏好查询方法,它能够从多属性数据集中快速提取用户感兴趣的数据点,应用十分广泛.几乎所有针对skyline查询的方法都假设数据集是完整的,然而在实际应用中,由于设备异常,隐私保护等原因,目前收集到的真实记录数据往往都是不完整的,即存在属性值缺失问题.从查询速度和精度的目的出发,探索直接针对不完整数据的skyline查询处理技术,目前针对不完整数据的skyline查询研究并没有引起足够的重视,随着数据规模不断扩大,数据维度不断增加,数据不完整性问题更容易出现,因此研究不完整数据下的skyline查询具有十分重要的意义.本文提出了不完整数据下支配度的概念,通过首先比较支配度确定支配关系,从而减少不同数据之间属性值的比较,极大地减少支配能力强弱差距大的点之间的不必比较,本文提出了高效的EIDS算法,适用于大规模数据、高维数据和稀疏数据,理论和实验分析结果均证明了该算法的优越性.本文的未来工作包括针对动态不完整数据下skyline查询研究研究,考虑提高不完整数据skyline查询质量,同时针对其他类型劣质数据skyline查询问题展开研究.
不完整数据 Skyline查询算法 用户兴趣 支配度
于文涛 王宏志
哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001
国内会议
太原
中文
57-65
2014-09-19(万方平台首次上网日期,不代表论文的发表时间)