最大频繁项集挖掘中搜索空间的剪枝策略
最大频繁项集挖掘可以广泛应用在多种重要的Web挖掘工作中.为了有效地削减搜索空间,提出了一种新的最大频繁项集挖掘中的搜索空间剪枝策略.这种策略基于深度优先遍历词典序子集枚举树,利用树中子节点与父节点扩展集中相同项的扩展支持度相等的特性,对搜索空间进行剪枝.应用该策略,对MAFIA算法进行改进优化.实验结果表明,该剪枝策略可以有效削减搜索空间,尤其在稀疏但包含长频繁项集的数据集上,搜索空间削减掉2/3,算法的时间效率比原MAFIA算法提高3~5倍。
Web挖掘 最大频繁项集 剪枝策略 搜索空间
马志新 陈晓云 王雪 李龙杰
兰州大学,信息科学与工程学院,兰州,730000
国内会议
北京
中文
1748-1752
2005-09-26(万方平台首次上网日期,不代表论文的发表时间)