会议专题

最大频繁项集挖掘中搜索空间的剪枝策略

最大频繁项集挖掘可以广泛应用在多种重要的Web挖掘工作中.为了有效地削减搜索空间,提出了一种新的最大频繁项集挖掘中的搜索空间剪枝策略.这种策略基于深度优先遍历词典序子集枚举树,利用树中子节点与父节点扩展集中相同项的扩展支持度相等的特性,对搜索空间进行剪枝.应用该策略,对MAFIA算法进行改进优化.实验结果表明,该剪枝策略可以有效削减搜索空间,尤其在稀疏但包含长频繁项集的数据集上,搜索空间削减掉2/3,算法的时间效率比原MAFIA算法提高3~5倍。

Web挖掘 最大频繁项集 剪枝策略 搜索空间

马志新 陈晓云 王雪 李龙杰

兰州大学,信息科学与工程学院,兰州,730000

国内会议

第三届全国搜索引擎和网上信息挖掘学术研讨会

北京

中文

1748-1752

2005-09-26(万方平台首次上网日期,不代表论文的发表时间)