一种分布环境中最大频繁项目集挖掘算法
挖掘最大频繁项目集是数据挖掘中的重要研究课题.目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见.文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法.该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度.采用传递侯选最大频繁项目集的方法.实验表明该算法是有效的并行算法.
分布数据库 数据挖掘 最大频繁项目集 频繁模式树
李忠哗 何丕廉
河北北方学院计算机系,河北,张家口,075000;天津大学计算机学院,天津,300072 天津大学计算机学院,天津,300072
国内会议
西安
中文
162-164
2006-10-19(万方平台首次上网日期,不代表论文的发表时间)