会议专题

不确定数据上聚集查询的分布式处理算法

不确定数据查询技术在军事、金融、电信等领域中起到了越来越重要的作用。目前这一领域的研究主要是在集中式数据库或数据流上进行的。事实上不确定性数据在传感器网络,分布式Web Server及P2P系统等分布式系统中广泛存在。从这些系统中收集所有数据进行集中式查询将带来巨大的通信开销、时间延迟和存储代价。同时,由于不确定数据的特点,大多数集中式不确定查询算法在分布式环境下并不适用。本文给出一种分不确定数据的最大值和Top-k聚集查询定义,并分别提出了基于过滤策略的分布式聚集算法。算法的主要思想是根据数据的分布区间和概率进行计算,尽可能将不可能成为最终查询结果的数据抛弃。实验结果表明,在各类系统和数据条件下,本文的过滤算法都能够正确地得到查询结果并显著降低系统的数据通信开销。

不确定数据 过滤策略 传感器网络 聚集查询 分布式处理

周逊 李建中 石胜飞

哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001

国内会议

NDBC2009第26届中国数据库学术会议

南昌

中文

126-134

2009-10-15(万方平台首次上网日期,不代表论文的发表时间)