基于压缩FP-树和数组技术的频繁模式挖掘算法
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.
数据挖掘 关联规则 频繁模式 压缩FP-树 数组技术 FP-growth算法
秦亮曦 苏永秀 刘永彬 梁碧珍
广西大学计算机与电子信息学院,南宁,530004 广西气象减灾研究所,南宁,530022
国内会议
南宁
中文
244-249
2007-11-01(万方平台首次上网日期,不代表论文的发表时间)