会议专题

用基于学习的TOP-N查询解决数据流问题

通过对数据流的研究,可以得出一系列的结论,如:数据流具有实时性、持续性、广泛性、语义不定性等特征.在传统的数据流处理技术,如:直方图方法、抽样方法、哈希方法的基础上,本文提出了使用基于时间滑动窗口模型的方法改构建概要数据库,从而为用基于学习的TOP-N查询解决数据流问题提供了可能.在传统的TOP-N查询的基础上,本文提出一种基于学习的top-N查询方法.该方法首先需要建立一个知识库,用来存储查询简档,然后对知识库进行检索.在检索知识库时,需要通过计算分布密度ρ,得到查询半径r,从而近似地查询到符合要求的N个结果.当有新近一批数据进入概要数据库时,还需要对知识库进行更新、维护.

数据流 滑动窗口模型 概要数据库 TOP-N查询 知识库

曹智强

河北大学研究生学院,071000

国内会议

2010年全国信息技术与应用学术会议

北京

中文

118-124

2010-11-10(万方平台首次上网日期,不代表论文的发表时间)