云环境下基于二进制编码聚类的并行频繁项集挖掘算法
本文提出了一种云环境下基于二进制编码的并行频繁项集挖掘算法,利用一种特殊的二进制编码的依赖度计量方法对原始数据集合进行编码转换及依赖度聚类,然后将数据集分布部署在云环境中,并采用共享多头表的FP-Growth并行改进算法挖掘频繁项集.实验表明,对于大规模数据集来说,本文算法可以取得良好的性能.
并行频繁项集挖掘算法 依赖度 计量方法 二进制编码
刘博 李云 张晓斌 徐杰
扬州大学信息工程学院,江苏扬州225127
国内会议
连云港
中文
62-65
2012-10-17(万方平台首次上网日期,不代表论文的发表时间)