数据流中基于位向量的最大频繁项集挖掘
针对现有数据流中挖掘最大频繁项集的算法效率较低的缺点,提出了一种基于位向量的最大频繁项集挖掘算法MMFI-BV.算法首先将滑动窗口中事务的每个项转换成住向量表示;然后通过位向量的与操作找出所有频繁项集;最后构建基于位向量的频繁项集树FI-BV-Tree,通过检测树中节点的链接信息找到最大频繁项集。另外提出了一种基于位向量的最大频繁项集挖掘的更新算法UMMFI-BV,当新事务到来时,通过位向量移位操作获得新窗口中的最大频繁项集。实验结果表明,算法MMFI-BV和UMMFI-BV具有较好的时间效率。
数据流 最大频繁项集 滑动窗口 位向量
任家东 张爱国 何海涛 胡昌振 解玉洁
燕山大学信息科学与工程学院,河北秦皇岛066004;北京理工大学计算机科学与技术学院,北京100081 燕山大学信息科学与工程学院,河北秦皇岛066004 北京理工大学计算机科学与技术学院,北京100081
国内会议
第三届中国计算机网络与信息安全学术会议(CCNIS2010)
河北保定
中文
46-52
2010-11-26(万方平台首次上网日期,不代表论文的发表时间)