一种分布环境中最大频繁项目集挖掘算法

摘要：

挖掘最大频繁项目集是数据挖掘中的重要研究课题.目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见.文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法.该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度.采用传递侯选最大频繁项目集的方法.实验表明该算法是有效的并行算法.

关键词：分布数据库数据挖掘最大频繁项目集频繁模式树

作者: 李忠哗何丕廉

作者单位: 河北北方学院计算机系,河北,张家口,075000;天津大学计算机学院,天津,300072 天津大学计算机学院,天津,300072

会议类型: 国内会议

会议名称: 2006年全国开放式分布与并行计算学术会议

会议地点: 西安

会议语种:中文

页码: 162-164

在线出版日期: 2006-10-19（万方平台首次上网日期，不代表论文的发表时间）

会议专题

一种分布环境中最大频繁项目集挖掘算法