会议专题

一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法

在数据流滑动窗口上挖掘闭合频繁项集是数据流挖掘研究领域的一个热点问题,现有的算法如Moment算法存在着使用空间过大的问题。提出了基于Moment的OP-Moment算法(OP指乐观裁剪策略),使用OP-CET数据结构维护滑动窗口上的闭合频繁项集信息.该算法使用乐观裁剪策略来裁剪大量的非频繁节点,并在每个频繁节点上增加一个属性以跟踪被乐观裁剪的非频繁子节点的最大支持度变化情况;算法使用位图来记录滑动窗口上所有元素的信息.实验表明,OP-Moment算法在稀疏数据集和密集数据集下都能大大降低占用的空间,并且在密集数据集下也能保持较高的运行效率。

闭合频繁项集 数据流 滑动窗口 乐观裁剪策略 Moment OP-Moment算法

李坤 王永炎 王宏安

中国科学院软件研究所 北京 100190 中国科学院研究生院 北京 100049 中国科学院软件研究所 北京 100190

国内会议

第二十五届中国数据库学术会议(NDBC2008)

桂林

中文

387-394

2008-10-24(万方平台首次上网日期,不代表论文的发表时间)