会议专题

基于聚类直方图的数据流聚集查询算法

  数据流聚集查询有着应用广泛,在计算和存储资源不足条件下,必须考虑构建有效概要数据结构,获取近似聚集查询结果。针对不符合典型分布的电力通信光纤监测数据流,提出一种基于聚类的直方图构建方法,获取流数据分布的不规则子区间集合;当新到达流数据,实时更新直方图;通过控制桶内元组计数密度误差,动态维护直方图桶结构,以适应窗口内数据实际分布特征。给出基于聚类直方图的数据流滑动窗口聚集查询算法。分析了算法精度、桶数目和允许误差的关系。实验结果表明,该算法对数据流滑动窗口聚集查询是自适应和有效的。

数据流 聚集查询算法 聚类直方图 构建方法

JIANG Wan-chang 姜万昌 SUI Ji-sheng 隋吉生 QI Guo-jian 齐国坚

School of Information Engineering, Northeast Dianli University, Jilin 132012,China 东北电力大学信息工程学院,吉林市132012 Jilin Electric Power Company, Changcun 130021,China 吉林省电力有限公司,长春市130021

国内会议

第18届全国信息存储技术学术会议

无锡

中文

396-399

2012-07-12(万方平台首次上网日期,不代表论文的发表时间)