时间敏感数据流上的频繁项集挖掘算法
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率.
时间敏感数据流 频繁项集挖掘 滑动窗口模型 挖掘算法
LI Hai-Feng 李海峰 ZHANG Ning 章宁 ZHU Jian-Ming 朱建明 CAO Huai-Hu 曹怀虎
School of Information, Central University of Finance and Economics, Beijing 100081 中央财经大学信息学院 北京 100081
国内会议
合肥
中文
2283-2293
2012-10-01(万方平台首次上网日期,不代表论文的发表时间)